在生成式 AI 突然爆红的一年之后,似乎大多数人对于这类应用的可能性以及极限都已经有相当程度的掌握。不过最近有人突然在社群网站上分享了一支影片,其中示范的 AI 语音客服的反应以及自然语调,给了他难以置信的感觉。认为原本预估也许还少要个半年到一年才可能逐步到位的 AI 即时对话功能,现在似乎已经看到了发展突破的曙光。继续阅读 AI 语音客服的新境界,Deepgram Aura 示范真假难辨反应极快的语音对话功能报导内文。
▲图片来源:Deepgram
AI 语音客服的新境界,Deepgram Aura 示范真假难辨反应极快的语音对话功能
▲图片来源:Deepgram
在生成式 AI 突然爆红的一年之后,似乎大多数人对于这类应用的可能性以及极限都已经有相当程度的掌握。不过最近有人突然在社群网站上分享了一支影片,其中示范的 AI 语音客服的反应以及自然语调,给了他难以置信的感觉。认为原本预估也许还少要个半年到一年才可能逐步到位的 AI 即时对话功能,现在似乎已经看到了发展突破的曙光。
One problem that persist, humans have a tendency to make pauses when speaking, and other humans are great at picking this up.
One of the biggest issues I have with TTS now is that AI responds to fast, and I don't get to finish my sentence.
— Linus (●ᴗ●) (@LinusEkenstam) December 8, 2023
在影片里,这个目前已经开放免费额度的 API 供使用的 Deepgram Aura 即时 TTS 服务,以超低延迟的回复速度,快速地以男女声语音回答了客户的需要。
从对答如流的内容中,可以听得出来 AI 语音助理不仅语调用语都相当自然,更有着相当适当的反应。更有报导提到 Deepgram 似乎还能根据对话调整语调。贴文者提到,在这样快速的回应速度下,反而可能产生一般人话可能说到有些停顿,结果就马上被语音助理插话的窘境(笑)。
▲图片来源:Deepgram
是说,虽然贴文者宣称这支影片是100% 真实,不过在X 社群贴文之中还是免不了有人对于影片真实性的质疑(毕竟Google Gemini 的示范影片事件还历历在目)。
不过既然在 Deepgram 的官网上他们挂出了满满的企业合作品牌,另一方面据称 API 还能提供高达 200 美元,换算约为 4.5 万分钟的转录试用时间。以这样的状况来说,应该还是蛮推荐企业或者专业人士有想要打造以生成式AI 技术提供的客服或什至物联网助理等应用的话,真的可以考虑看看这个看似有了相当突破发展的TTS 服务。
评论