音声対話

AI 技術動向

Dolphin AI:価格優位性と高性能の完璧な組み合わせ

今日の競争が激しいAI市場において、Dolphin AIはその顕著な価格優位性で際立っています。Dolphin AIは、コストパフォーマンスが高く、強力な機能と柔軟なソリューションを提供し、さまざまなユーザーのニーズを満たします。 コストパ...
メディア

【多言語音声認識API – DolphinVoice】 が 【株式会社ホープラン東京】様の自律走行型サービスロボットに採用されました!

【株式会社DolphinAI】(本社: 、代表取締役: )は、この度、『DolphinVoice音声対話サービス』が2025年2月10日より【株式会社ホープラン東京】(本社: 、代表取締役: )のサービスロボットに正式に採用されたことをお知...
AI 技術動向

DeepSeekをどのようにスマートボイスAPIと組み合わせるか

DeepSeekをスマートボイスAPIと組み合わせることで、強力な音声インタラクション機能を実現し、ユーザーエクスペリエンスを向上させることができます。以下は具体的な実装方法とアプリケーションケースです。 DeepSeekとスマートボイスA...
AI 技術動向

智谱BigModel初のエンドツーエンド音声API:GLM-4-Voiceが登場、スマート音声インタラクションの新時代を開く

音声インタラクションは、人間と機械を結ぶ重要な橋渡しであり、人工知能(AI)分野における重要な研究開発分野です。最近、北京智谱华章科技有限公司が運営する智谱BigModelプラットフォームは、初のエンドツーエンド音声モデル「GLM-4-Vo...
AI 技術動向

LiveKit + Groq:低遅延でリアルタイムに遮断できる AI 音声対話アプリの作成

音声対話の分野では、スムーズさとリアルタイム性がユーザー体験の鍵です。今日は、LiveKit と Groq という2つの強力な技術を組み合わせて、低遅延でリアルタイムに遮断できる AI 音声対話アプリを作成する方法を紹介します。詳細なインス...
AI 技術動向

Hume AI:共感 AI 音声インタフェース EVI

人工知能技術が急速に発展する現在、AI は単純なデータ処理やタスクの実行から、人間の感情を理解し、シミュレートする新たな段階へと進んでいます。最近、Hume AI の登場により、世界初の共感 AI 音声インタフェース EVI が AI ダイ...
AI 技術動向

2024年11月に発表された4つの衝撃のChatGPT機能

みなさん、こんにちは。今日は、ChatGPTの最新機能について紹介したいと思います。このAI技術は、私たちの作業フローを根本的に変えていく4つの素晴らしい新機能を2024年11月に発表しました。それでは、早速紹介していきましょう。 機能1:...
AI 技術動向

Ultravox:リアルタイム音声対応の迅速なマルチモーダル大規模言語モデル

こんにちは、今日はオープンソースプロジェクトであるUltravoxについて紹介します。このプロジェクトは、人工知能の領域で注目を集めており、私たちが機械とより自然でスムーズに対話できるようにする非常に興味深いツールです。 Ultravoxの...
AI 技術動向

Hertz-Dev:低遅延、高自然度のオープンソース音声インタラクションの新時代をオープンします

人工知能の分野で、音声インタラクション技術は急速に発展し、人と機械の間の新しいコミュニケーション手段となっています。最近、Standard Intelligenceは、人と同様に迅速かつ自然に音声で対話できるように設計された全双工音声インタ...
AI 技術動向

F5-TTS:音声の質と速度の完璧なバランス

人工知能技術が急速に発展する今、テキストトゥースピーチ(TTS)技術はユーザー体験を向上させるための重要なツールとなっています。最近、上海交通大学がオープンソースとして公開したF5-TTSという高保真度、高効率のTTSプロジェクトが話題です...