音声合成

メディア

【多言語音声認識API – DolphinVoice】 が 【株式会社ホープラン東京】様の自律走行型サービスロボットに採用されました!

【株式会社DolphinAI】(本社: 、代表取締役: )は、この度、『DolphinVoice音声対話サービス』が2025年2月10日より【株式会社ホープラン東京】(本社: 、代表取締役: )のサービスロボットに正式に採用されたことをお知...
AI 技術動向

Dolphin AI:音声インタラクションの新しい時代を開く

デジタル化が急速に進む現代において、人工知能(AI)は各業界を変革する核となる技術の一つです。今回ご紹介するのは、音声インタラクションソリューションに特化した革新的な企業、Dolphin AIです。Dolphin AIは、その先進的なAI技...
AI 技術動向

AI音声インターラクションの核心技術と課題を解読:音声認識と音声合成

こんにちは、今日はAI音声インターラクションの核心技术である音声認識(ASR)と音声合成(TTS)について探求していきたいと思います。この技術は、私たちの日常生活に急速に融合しつつあり、スマートアシスタントからリアルタイム翻訳、音声コマンド...
AI 技術動向

音声生成技術:CosyVoice 2.0-0.5B

「CosyVoice 2.0-0.5B」は、ModelScope.cnから提供されている最新の音声生成技術です。このモデルは、人工知能を用いて自然で流暢な音声を生成する技術を提供しており、多言語対応で、特に中国語の音声合成において優れた性能...
AI 技術動向

CosyVoice音声生成大模型:300M-Instructの先進機能を探求する

人工知能分野で、音声生成技術は研究と適用のホットスポットとなってきました。ModelScope.cnは最近、CosyVoice音声生成大模型をリリースしました。これは300Mのパラメーターを持ち、音声合成と理解タスクに特化した高度なモデルで...
AI 技術動向

ChatTTS:対話用の生成型音声合成モデル

デジタル時代に進入してから、テキストトゥースピーチ(TTS)技術は私たちの生活のあらゆる面に深く根付き、その応用範囲が非常に広範です。有声小説から音声ナビゲーション、ビデオナレーション、スマートホーム制御まで、TTS技術の応用は日に日に広が...
AI 技術動向

オープンソースTTS神話ChatTTS:使用チュートリアルと開発ガイド

人工知能が常に進歩する今日、テキストトゥースピーチ(TTS)技術は、人と機械の間の対話体験を向上させる重要なツールとなっています。今日は、対話シナリオに最適化されたオープンソースTTSプロジェクトであるChatTTSについて探求していきまし...