新智元と共同で報道するニュース、亚马逊が最も強力なマルチモーダルモデルであるNovaシリーズを発表しました。このシリーズは、多くのベンチマークテストで、Nova ProがGPT-4oを上回り、Gemini 1.5 Pro、Claude 3.5 Sonnetに次ぐ性能を発揮しました。しかし、Nova LiteとNova Microは、同等の競合他社製品よりも劣ります。
Novaシリーズの強み
Novaシリーズは、非常に低い価格で提供されます。入力は100万トークンあたり0.0175ドル、出力は0.07ドルと安いです。性能の向上により、Amazon Novaは複雑な推論タスクを処理できます。複雑な文書や動画を分析し、チャートやダイアグラムを理解し、高品質な動画コンテンツを生成し、高度なAIエージェントを構築できます。
Amazon Novaのラインナップ
- Amazon Nova Micro:テキスト専用モデルで、最低の遅延レスポンスを極めて低いコストで提供します。
- Amazon Nova Lite:極めて低いコストのマルチモーダルモデルで、画像、動画、テキスト入力を迅速に処理します。
- Amazon Nova Pro:強力なマルチモーダルモデルで、各種タスクにおける正確さ、速度、コストの最適な組み合わせを目指しています。
- Amazon Nova Premier:シリーズの中で最も複雑な推論性能を持つマルチモーダルモデルで、カスタムモデルのディストイリングにも最適です。
- Amazon Nova Canvas:SOTA(State of the Art)の画像生成モデル。
- Amazon Nova Reel:SOTAの動画生成モデル。
Amazon Nova Reelの創造力
簡単なプロンプト「dolly forward」を入力すると、Amazon Nova Reelはシングル画像を短い動画に変換し、創造力を爆発させます。Amazon Novaのクリエイティブジェネレーションモデルは、売り手や広告代理商の広告クリエイティブを全新レベルに引き上げます。これらのツールを使用するブランドの広告宣伝製品数は平均で5倍増加し、各宣伝製品で使用される画像数は倍増しました。これにより、予算をより必要な場所に割り当てることができます。
Amazon Nova Proのビデオ理解能力
研究者は、無音のサッカーゲームのビデオクリップをモデルに視聴させ、ゲーム内容を説明させました。結果、モデルは一気に正確に大会のルール、ユニフォーム、選手アクションの説明、そしてゲームがどのようにクライマックスに達するかの詳細を伝えました。
詳細な機能
- Amazon Nova Pro:最大30万入力トークンを処理し、マルチモーダルエージェントワークフローの新スタンダードを設定します。
- Amazon Nova Lite:リアルタイム顧客コミュニケーション、文書分析、ビジュアルクエストアンサーリングタスクを高精度で処理します。
- Amazon Nova Micro:128Kのコンテキスト長で、スピードとコストを最適化し、テキスト要約、翻訳、コンテンツ分類、インタラクティブチャット、ブレインストーミング、シンプルな数学推論、コーディングなどのタスクで優れています。
クリエイティブコンテンツの生成
- Amazon Nova Canvas:スタジオ品質の画像を生成し、スタイルとコンテンツを精密に制御し、編集機能を豊富に提供します。
- Amazon Nova Reel:テキストプロンプトと画像を用いて視覚的なスタイルとリズムを制御し、プロ品質の動画コンテンツを生成します。
価格と性能
Amazon Nova Micro、Amazon Nova Lite、Amazon Nova Proの価格は、Amazon Bedrockで性能が最も優れたモデルよりも75%以上安くなっています。また、これらのモデルはAmazon Bedrockと統合されており、完全に管理されたサービスを通じて、リーディングAI企業およびアマゾンの高性能基盤モデルを使用できます。モデルはカスタム微調整をサポートし、クライアントはモデルを自身のデータにポイントさせ、マークされているため精度が向上します。これにより、Amazon Novaモデルはクライアント自身のデータ(テキスト、画像、動画)から最も重要な内容を学習し、Amazon Bedrockでプライベート微調整モデルをトレーニングし、カスタマイズされた応答を提供します。
AIチップの競争
AIチップの覇権争いで、挑撃者は激しい「造芯」革命を繰り広げています。市場調査機関Omdiaのデータによると、人工知能計算分野で、データセンターオペレータがNon-NVIDIAチップコンピュータでの支出は今年49%増加し、1,260億ドルに達すると予想されています。この数字は、チップ市場の無限の可能性を示しています。
結論
Amazon Novaシリーズの発表は、AI技術とマルチモーダルモデルの進歩を示す重要な一歩です。これらのモデルは、複雑なタスクを処理し、クリエイティブなコンテンツを生み出す能力を持ち、AIチップ市場とAIアプリケーション全体に影響を与えるでしょう。
会社名:株式会社Dolphin AI
事業内容:
Dolphin SOE 英語発音評価サービスの開発&販売
Dolphin Voice 音声対話SaaS Platformの開発&販売
ドルフィンAIは自社開発のAI技術を持つ研究開発型のハイテク企業です。
独自技術の音声対話意図理解モデル(Dolphin Large Language Models)に基づき、音声認識、音声生成、意味理解、テキスト生成、機械翻訳、声紋認識、その他音声対話のフルチェーン技術を開発し、日本語、英語、中国語、韓国語、フランス語、スペイン語、ロシア語、ドイツ語、チベット語、タイ語、ベトナム語など20以上の言語に対応しています。
また、SaaSやオンプレミスのサービス形態を通じて、教育、医療、金融、その他の分野のお客様に基礎となるAI技術と業界ソリューションを提供しています。
アクセス情報:〒170-0013
東京都豊島区東池袋1-18-1 Hareza Tower 20F
JR山手線・埼京線 池袋駅東口(30番出口)より徒歩4分
東京メトロ丸の内線・副都心線・有楽町線 池袋駅東口(30番出口)より徒歩4分
西武池袋線 池袋駅東口(30番出口)より徒歩4分
東武東上線 池袋駅東口(30番出口)より徒歩4分
電話番号:(+81) 03-6775-4523
メールアドレス:contact@dolphin-ai.jp