优势2:解放双手和双眼
通过语言交互可以将手和眼睛空起来处理其他事情,在需要多感官协同的场景下效率更高 。例如:车载场景通过语音点播音乐,医疗场景医生在沟通病情的同时记录病历,工业场景在双手占用的同时下达指令 。
优势3:使用门槛低
- 非文字使用者友好:人类是先有语音再有文字,每个人都会说话但有一部分人不会写字,针对老人、小孩、失明的人群,无法使用文字交互,语音交互会为其带来极大的便利 。
- 学习成本低:语音交互更自然,在非复杂场景下,语音交互比界面交互更自然,上手成本更低 。
- 声纹识人:通过声纹可以进行身份判断,并且可以在下达指令的同时进行身份判断,效率更高 。同时声音还可以判断性别、年龄层、情绪等信息 。
- 声音传递情感:声音交互可以传递情感,因此在有情感诉求的场景下,声音是一个很好的选择 。
PART 2:语音交互的劣势劣势1:信息接收效率低
语音输出是线性的,当别人说话时,你可能得等全部说完后才能理解,无法像文字一样可以跳过阅读;语音交互也会增加用户的记忆负担,尤其是面临多项选择并且选项内容较长时 。
因此它无法同时输出很多内容,在接受信息和多选择交互时,视觉具有更大的优势,声音的效率不高 。总结来讲,语音交互针对单向指令是更有效的,而双向交互不是很有效 。
劣势2:嘈杂环境下语音识别精度降低
语音识别需要清晰的识别出人声,包括将人声和环境声进行分离,将人声和人声进行分离 。嘈杂环境使得人声的提取变得非常困难,尤其是针对远场语音交互,噪音的问题更加突出 。
目前业内普遍使用麦克风阵列硬件和相关算法来优化该问题,但是无法完全解决,例如远场安静环境下语音识别准确率能达到95%,但是在嘈杂环境下仅能达到80%出头 。但是随着技术的进度,嘈杂环境下的远场语音识别准确度也肯定会逐步完提升 。
劣势3:公开环境下语音交互具有心理负担
语音交互的心理障碍是用户不能预设和预先判断 。在同一情况下,不同的人可能会产生完全不同的行为和期望 。这给设计者带来了很大的麻烦,也给用户带来了不确定性 。从心理体验来看,没有多少人愿意对着机器说话,因为有可能会得到毫无感情甚至是错误的反应
3. 语音交互适合什么场景和设备?我们判断什么场景和设备适合增加语音交互,根据语音交互的优劣势分析,得出以下加分项和减分项,为了简单起见,每个得分享赋予相同的权重,然后计算综合得分,将适用程度划分为高、中、低3档,分别记2、1、0分 。
原则1:每个设备类型仅考虑起本身的功能,不考虑因为入口性质附加的额外功能,例如智能音箱,现在除了音箱属性,被赋予了天气、智能家居等其他属性 。未来形态下家庭语音入口会分布式的,智能音箱被赋予的生活助手的角色也会被剥离 。
原则2:设备的功能考量时会考虑现在还不具备但是以后会延展的相关功能,例如冰箱,支持查询冰箱内的物品情况 。
加分项:
- 需要复杂的信息输入:输入指令不能被穷举,则得分最高,如果仅简单的输入指令,则得分低;
- 使用对象双手或双眼被占用;
- 使用对象为非文字使用者:如果使用人群里老人、小孩和失明人群较多,则得分高,反之得分低;
- 需要跨短距离空间的操作:如果有实体按键,则得分高,如果可远程遥控则得分次之,而且皆无,则不得分;
推荐阅读
- GP的英文全称是什么 gpi是什么意思
- 买新车提车注意事项 提车的时候要注意什么
- 艾叶枕头怎么做
- 鹅如何养才听主人的
- 狗狗注射疫苗的误区
- 狗狗们挑食厌食的原因
- 凯尔特人11号是谁
- 狗狗不可食用的食物
- 健美操学习的意义
- 最适合狗狗生活的适宜温度
