声网发布对话式AI引擎 AI对话1分钟不到1毛钱
3月6日,声网在京举办了主题为“AI开口,互动无界”的产品发布会,正式发布了全球首个对话式AI引擎,凭借650ms 超低延时响应、优雅打断、全模型适配等五大能力,对话式AI引擎可支持任意文本大模型快速升级为“能说会道”的对话式多模态大模型。同时,对话式 AI 引擎的价格也更为优惠,1分钟不到1毛钱,只需0.098元/分钟。

五大能力让任意大模型“能说会道”
在生成式AI的浪潮下,行业普遍认为多模态大模型是实现AGI的必经之路,知名投资机构a16z最新关于Voice AI的报告也显示,随着大模型的不断进步,语音将成为一种关键的切入点。声网作为全球实时互动云行业的开创者,在音视频领域积累了深厚的技术优势与场景实践,一直致力于将RTE与生成式AI结合,并推出了对话式AI引擎,为开发者带来“多快好省”的AI语音对话体验。
模型选择多:真正把选择权交给开发者!支持包含 DeepSeek、ChatGPT等在内的全球几乎所有大模型厂商。同时也支持全球主流语音合成供应商任意切换,支持开发者通过语音合成供应商定制的自定义音色接入。更有音视频SDK支持30000+终端机型适配,解决多设备兼容性的后顾之忧。

响应快、打断快:通过全链路深度优化,并在中、美、欧、东南亚主要城市实测,语音对话延迟中位数低至650ms,让AI秒回你的提问。超低打断延时,自研“智能打断”技术,模拟真人对话节奏,随时打断与AI的对话,响应低至340ms。

对话体验好:“选择性注意力锁定”功能可屏蔽95%环境人声、噪声干扰,精准识别对话人声。此外,对话式AI引擎具备优秀的抗弱网、抗丢包能力,80%丢包率下仍能稳定流畅对话,断网3-5s依旧流畅对话。

开发省心、更省钱:声网对话式AI引擎提供了极简的开发部署,只需2行代码,15分钟就能让AI开口说话,大幅降低了开发门槛。只需填入与复制LLM与TTS相关的URL与Key,就能实现快速部署,具体流程可查看声网官网的文档中心。

对话式AI引擎的成本也更优,AI语音对话只需0.098元/分钟,单次还赠送1000分钟。自研的“智能打断”功能作为增值服务也只需0.042元/分钟,以更低的成本助力开发者探索AI应用场景。
声网AI RTE产品线负责人姚光华表示,"经过一段时间与客户的打磨及实际使用场景调研,我们统计出,用户与AI 每产生1次对话中,平均会有约3轮问答,计算下来平均对话时长约为21.1s,单次成本仅需3分钱。如果每月对话次数15次,那么月成本不到5毛钱,年成本也只需5元。"
对话式AI推动智能助手、智能硬件等场景走向火热
通过声网对话式AI引擎,开发者可以快速部署智能助手、虚拟陪伴、口语陪练、智能客服、智能硬件等对话式AI场景。例如智能助手场景可以通过自然语言交互,帮助人们进行日程管理、信息查询和任务执行,全面提升生活便利性,并提高工作效率。
智能硬件场景也是当下非常火热的AI场景,通过嵌入对话式AI引擎,可实现语音控制、智能看护、智能陪伴和个性化服务,将智能设备升级为智能硬件体。适用于 AI 玩具、AI 教育硬件、AI 陪伴设备、家居语音助手、穿戴设备个人助手等多种应用场景。
相关阅读
- 英伟达RTX 3050 A移动显卡曝光:64-bit位宽、4GB GDDR6显存、1792个CUDA核心
- 惠普蜻系列骁龙版商务本 OmniBook X 14 通过 3C 认证
- 北京互联网法院宣判首例“AI换脸”侵权案
- 俞浩回应追觅造车:谢谢关心,做过资金测算可以承受
- 法拉利首款纯电车型明年底亮相,CEO称不会使用磷酸铁锂电池
- 特斯拉Model Y长续航版车型“加速提升包”国内降价一半
- CES 2025见证科技创新新突破:海信洗衣机引领家电美学变革
- 闭环管理+ 时效可视化,WPS 365 助力酒钢集团加速数字化转型
- 2024 TCL全球技术创新大会举办,发布全领域全场景AI应用等创新成果
- AIGC 风潮席卷手机:但在 PC 面前 还是个弟弟