对AI语音的思考

作者: Frossky

时间: 2025-12-08

分类: 未分类

有个AI可以语音聊天似乎是很牛的事情，然而大家新鲜过后就很少再继续了。因为聊天是个很累的事情，要不断的搜肠刮肚想如何回复和新的话题。如果从聊天中没有足够的知识收益或者情绪收益，人们就懒得聊下去了。相反，通过音乐、评书、新闻、播客等，用户不需要说话就能持续稳定获得收益，用户就更不愿说话了。所以AI对话需要用户的“主动探索”而不是“被动接受”，花费的精力更多。
儿童和幼儿似乎有不同，他们的表达欲要高于成人，更愿意去探索和交流，所以会出现某个小孩因为小智音箱坏掉痛哭不已的视频。但现在AI语音似乎又不能很好适配这类用户的需求，因为儿童组织语言能力差，一句话说得比较慢，中间停顿思考的时间长，而Ai语音由于网络和处理延时本身较大，为了更快响应用户，往往用户稍有停顿就开始处理回答了，这样经常听不完整用户的语句。这个可能纯靠语音判断用户是否已经说完就比较难，我跟小朋友打电话的时候也经常搞不清楚他到底有没有说完还只是在思考，但当面看到他们的表情和动作就知道了。
所以AI需要解决如何提供更多的收益给用户，如何准确识别用户已经讲完话。
另外AI语音要表现得更像一个完整产品的话，也需要有自己完整的语音控制人机界面。能把所有手机操作变为语音界面。

标签: none 阅读量: 482

对AI语音的思考

添加新评论

最新文章

最近回复

分类

归档

其它