AI 技術動向 NVIDIA、テキストと音声入力から音楽や効果音を生み出すAIモデルFugattoを発表 音声認識技術の最前線で、NVIDIAが革命的な生成式AIモデル「Fugatto(Foundational Generative Audio Transformer Opus 1)」を発表しました。このモデルは、テキストと音声入力から任意の音... 2024-12-04 AI 技術動向
AI 技術動向 Moonshine:リソース制約デバイス向けのオープンソース音声認識モデル 音声認識技術は、AI分野の中でも特に重要な位置を占めており、リアルタイムの音声からテキストへの変換を提供します。最近、リソース制約デバイス向けに最適化されたオープンソース音声認識モデルであるMoonshineが登場し、話題を集めています。こ... 2024-12-04 AI 技術動向
AI 技術動向 Open-Emotion: EMO-SUPERB―音声感情認識の新基準 人工知能の分野で、感情認識は常に活発な研究分野であり、特に人間と機械の対話で重要な役割を果たしています。最近、音声感情認識システムのための新しいプラットフォームEMO-SUPERBが話題を集めており、それは再現可能な汎用性能基準を提供してい... 2024-12-04 AI 技術動向
AI 技術動向 音声認識技術:SFから現実へ SF映画「2001年宇宙を旅する」で、HAL 9000ロボットは自然な会話能力で有名です。この映画は過度に楽観的でしたが、音声認識技術の研究と開発に科学家たちを刺激しました。今日、私たちは音声認識技術が急速に発展し、私たちが機械と対話する方... 2024-12-04 AI 技術動向
AI 技術動向 Erlangshen-DeBERTa-v2:320M中国語モデルの新境界を探求する 自然言語処理(NLP)の分野で、プリトレインモデルは技術進歩を推し進める鍵となっています。ModelScope.cnが最新にリリースしたErlangshen-DeBERTa-v2-320M-Chineseモデルは、320Mのパラメーター量で... 2024-11-21 AI 技術動向
AI 技術動向 GPT-3.5とGPT-4の違い比較:最新動向を一記事で理解する 人工知能分野で、GPTシリーズモデルの発展は常に注目されています。GPT-4のリリースに伴い、多くのインターネットユーザーや技術愛好家が、前のバージョン(GPT-3.5)との違いに強い関心を寄せています。この記事では、比較テストを通じて、G... 2024-11-21 AI 技術動向
AI 技術動向 CosyVoice音声生成大模型:300M-Instructの先進機能を探求する 人工知能分野で、音声生成技術は研究と適用のホットスポットとなってきました。ModelScope.cnは最近、CosyVoice音声生成大模型をリリースしました。これは300Mのパラメーターを持ち、音声合成と理解タスクに特化した高度なモデルで... 2024-11-21 AI 技術動向
AI 技術動向 MiniCPM-MoE-8x2Bを探求する:OpenBMBの最新モデル 人工知能の進歩の中で、OpenBMBはモデルとアルゴリズムの革新者として、自然言語処理(NLP)の限界を押し進め続けています。今日は、ModelScope.cn上で最新にリリースされたMiniCPM-MoE-8x2Bモデルに焦点を当てます。... 2024-11-21 AI 技術動向
AI 技術動向 PoNetプリトレインモデル:英語テキスト理解の新たな基盤を探求する 自然言語処理(NLP)の広い分野で、プリトレインモデルは言語の深层的な意味を解き明ける鍵となっています。ModelScope.cnが最新にリリースしたPoNetプリトレインモデルは、英語テキストの理解と処理に特化し、研究者や開発者に強力なツ... 2024-11-21 AI 技術動向
AI 技術動向 WeNet-U2pp_Conformer:中国語リアルタイム音声認識の新しいフロンティアを探求する 人工知能技術の急速な発展の中で、リアルタイム音声認識技術は人と機械を結ぶ重要な架け橋となっています。ModelScope.cnがリリースしたWeNet-U2pp_Conformerモデルは、中国語音声認識タスクに特化し、16kHzの音声処理... 2024-11-21 AI 技術動向