HMI语音设计探索Homepage recommendation
121天前Publish
年前最后一篇文章收尾啦~ 新的一年我必继续砥砺前行,深耕车载行业

前沿:


开头必须来一句,我相信语音一定是未来,我非常确认🧑‍🏫


这篇HMI的语言探索以介绍语音交互内容为基础,结合我的实际工作项目经验,输出总结关于语音设计的内容,最后在结合案例,在对话设计中会进行深度的探索,并提出个人的想法和思路,因为有的时候深度去思考觉得我们项目还可以有很多优化的点。


进入我们今天的正题👇👇👇


在说语音交互之前,先给大家讲一下题外话,关于人机交互(Human Computer Interaction)简称HCI,可能日后我想去攻读这个硕士学位🧑‍🏫,简单来说就是指人与计算机之间通过使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算机之间的信息交换过程。


语音助手最初的载体是手机APP,通过与用户之间的对话方式,能够帮助用户来解决问题的,随着我们现在人工智能的研发技术不断发展,包括让机器学习,语音识别、图像识别、自然语言处理、智能搜索等一系列。语音交互运用的很普遍了,不仅仅只是智能手机,现在涉及到的领域是越来越多了,如智能家居、汽车、可穿戴设备、就连商场普遍也有机器人语音对话。



HMI语音介绍


我这边就不打算讲语音的发展历史了,不然又是水了一大堆内容,我可是一个讲干货的小作家呢🧑‍🏫,如果我的小粉丝们需要的话,就私信我,我会在微信公众号更文。


语言是传递信息重要方式,对于我们用户来说,语音交互也是学习成本相对较低、容易掌握的,语音交互设计简称为 ➡️ VUI。


新能源汽车不断的发展,智能车载系统也是我们最看重的。随着语音交互的的普及,语音识别开始走入人们生活,凭借其实用性和准确性得到了用户的认可,因此在发展的过程中摒弃了传统的、繁杂的手动操作,提高安全驾驶属性和更高效的处理问题的能力,但是,在现阶段的新能源汽车发展过程中还不能完全替换掉手动操作。


现在为什么用户在驾驶车的过程中,还是不会常用到语音交互,首先提到的就是用户习惯,根据数据调查,在使用语音交互的人群中,年轻人占了主力军,其余年龄段的人由于常年驾驶都是通过硬按键来操控车内空调、电话、音乐、电台、内置导航。其实就算是苹果手机中的siri都很少用到, 在使用初期因为技术的不成熟,再加上冰冷的对话方式使得用户不对他这个买单,像我现在生活中,用到的siri频率也会很少,最多就是定一个闹钟,app实在找不到就会使用到,还有无聊的时候和他进行无聊的对话,嗯就这样子🙄🙄🙄。


国内做语音头部公司有我们熟悉的科大讯飞,还有和多家车企合作的思必驰、云知声,对内服务的百度,搜狗,腾讯,阿里这些大咖都有自己的语音技术。


再讲一下语音的基础原理内容,这一块比较难懂一点,首先你要说出你需要解决的需求、要处理什么事情,通过车载系统设备收到指令的语音 ➡️ 自动语音识别 (ASR)  ➡️ 将指令转化为文本  ➡️ 自然语言处理 (NLP)  ➡️ 了解用户需要解决什么问题  ➡️  通过Skill (普及一下知识:Skill 是一种程序的语言,有notepad++,UltraEdit等,好了不啰嗦了) ➡️  将处理好的结果处理成回复文本  ➡️ 最后再通过TTS 播报形式  ➡️  形成回复音频   ➡️  通过车载系统回复给用户解决结果,听起来是不是有点复杂了,我相信我是全网说的最细的了🤪🤪🤪


如何去定义一个产品的语音的好坏?我觉得吧🤔,能够让用户对于这个语音系统的满意度达到一个高标准,首先能够让系统能够听懂你所说的内容,并且给出相对应的解决方案,语音系统运用的简而易用即可,如何做到以上的要求,我会再下面对话设计中会着重讲解深挖的。



车载语音交互(VUI)基本原则


车载场景下的语音交互核心基本原则有三点:


1.首先是安全

驾驶过程中,司机的眼睛、耳朵和手占据了大部分多任务操作,如果一些功能还需要通过眼睛和手来操作的话,会降低安全驾驶的系数,所以车载语音交互更有助于辅佐司机安全驾驶,减少注意力的分散。


2.其次是便利

语音交互设计之初,一定要考虑便利、快捷,尽量的减少每一个任务的对话次数、快速响应、将对话流程简单化,从而打破VUI对于用户的一个心理障碍(便利这块内容我会在后面对话设计中着重讲解)。


3.最后是愉悦

为什么要谈到愉悦,因为市场上最初的语音对话交谈,都是冷冰冰的,几乎没有情感可谈,像极了和机器人对话,并且有的时候无法处理任务就会说,超出能力范围,这是一个很不好的用户体验。现在市场上可以看到,导航软件也有语音包可以选择,这也是增加了情感化设计,这是其中的一个点。还有一个小点就是自然的对话交流,很流畅的完成用户提出的每一项任务,尽可能的规避对话中的错误,让整体的对话过程达到一个愉悦的感觉。




用户语音的目的

用户在语音交互的时候,绝大多数都是带有明确指示任务指令的,也有可能是闲聊状态。


任务状态下:

任务式对话中,用户需要尽快的得到想要反馈和解决方案,并且快速的完成,此类任务的反馈要求还需要清晰、简单明了。


闲聊状态下:

我们经常也会问Siri一些无聊的问题,比如:“siri给我来一段Rap” 通常这类的任务带有的目的性不是很强,但是对于趣味性要求会高。



市场现状(VUI+GUI)

语音是最舒服的交互形式,但是他不能完全取代GUI,相互协作才是更佳的方案,所以现在市场上的车载系统大多数都是以语音(VUI)和 图形用户界面(GUI)相组合的,也有少部分车加入其他交互方式譬如手势交互。


语音与图形的交互是交叉处理,从而形成了多模,多模态在我第二篇文章也有讲到,第一次看我文章的👨‍🎓同学们可以回顾一下,用户在对车载系统发送一个指令的同时,设备会有多种的反馈方式,首先你可以听到系统虚拟形象给你做出回答,其次你看到图形界面的变化,举一个例子,你说:“我要听周杰伦的七里香”系统就会处理讲页面跳转到音乐界面,并且播放周杰伦的七里香,如果声音小了,你可以说:“声音大一点”


大家是不是发现一个问题呀?我在前面说系统首先会做出回答,然后界面才会发生变化,但是实际情况,系统语音形象没有做出任何多余的回答,而是直接听取到用户的需求,直接反馈出结果,播放了周杰伦的 #七里香#,这就是我准备在下面会重点讲到的“对话设计”


再说对话设计之前,我们先了解一下VUI设计师,想必大家头一次听说,还有语音(VUI)设计师嘛,国内不太注重培养VUI设计师,大家可以去招聘平台搜索一下语音交互设计师,很少有公司专门针对这个职位去招聘的,就算有,也是招聘算法等研发岗的职位,VUI设计师的工作任务一般都是公司的产品经理或者交互设计师代劳了,这会肯定就有产品经理或者交互设计师想出来吐槽了,哈哈哈🤪🤪🤪


语音交互方式给用户听和说两个动作,相信大家也有听过7±2法则,因此在听到的信息设计发面需要考量,因为用户听到一遍内容之后就消失了,除非这款车机语音系统,有再次复述上一段话的功能,不然在语音设计的时候,千万不要让用户产生的认知负荷,更不要挑战用户的短时间的记忆力,最强大脑除外🙄🙄,我们大多数人可不是什么最强大脑是不是🤪🤪。再次强调一下,就算拥有复述这个功能,也要注意设计的语音内容,该功能点只是加分项而已,不能打破底线,将语音设计的原则抛之脑后。



VUI & GUI的优缺点

再分析一下图形设计(GUI)和语音设计(VUI)之间的优缺点,那我们先从优点开始说起.


(1)前面我们有提到VUI只需要听and说,而GUI则需要触控屏幕内容,在效率和安全方面没有VUI好,触控操作比语音操作要相对会慢,语音交互方式中驾驶者无需离开方向盘。


(2)在对于整套车机系统而言,GUI学习的成本远高于VUI,因为VUI只要会交流即可,无须像GUI一样学习触控交互手势、在哪里点击等一系列问题。


(3)还有一点,图形设计是一种已经预设好了操作路径和交互方式,页面之间存在这层级交互的基本关系,用户需要根据指定的操作进行,而VUI则突破了GUI的限制,交互更快捷了,举个例子:“导航去虹桥机场”,VUI则一步到位,而GUI首先需要找到导航应用的入口,然后再点击搜索输入框,输入#虹桥机场,确认完毕之后,再点击导航,我的天呐我写的都很烦了,说真的还不如语音一步到位呢。



说完优点后,我们在反思一下VUI还有那些没有GUI做的好的点.


(1)语音交互涉及到3块内容,语音识别,识别用户所说的内容,其次语言理解,这边会关乎到方言理解的问题,毕竟我国语言博大精深,难以参透哈哈哈🤪🤪,最后是语音的合成,这三块内容如果有一块出了问题,最后反馈的结果可能并不是用户想要的答案。而图形设计有这统一的执行操作指令,不会出现什么bug问题,如果有,那肯定就是这款车机在测试的时候测试人员遗漏的问题,可以投诉奥🤓。


(2)整套车载的GUI设计都会有这一套严谨的操作逻辑,有这明确的信息分布和页面的层级关系,但是VUI的功能不可见(除非你看那个使用手册,哈哈哈哈哈)所有的场景VUI都需要去探索,在引导性方面会弱很多,所以在买车的时候抓住销售员使劲的问哈,毕竟你花了一大笔钱来买车了,在试驾的过程中也要多去询问,就先点到这里了。


(3)GUI是可以全场景交互,不限制于任何场景,而VUI则会受到的场景因素较大,有较多场景中不适用语音交互,最直接的就是设置中的内容。


(4)语音设计对于用户的一个记忆力是一个考验,如果一个很长的TTS反馈,用户不知道哪里才是自己所需要的信息,因此在做VUI设计的时候尽量简短高效的句子,而GUI信息都会呈现在页面中,所以这个点要相对于优胜于VUI了。



总结一下👊

以自然交互为主的,声音,显然是最自然的交互形式,但不能完全取代图形GUI,而是更好的协作,尽量减少界面的形式设计,加强情感化的交互形式体验,将智能化更好的融入到车载系统中去,让每一位用户能够更好,更便捷,更安全的驾驶着汽车,是我们全体设计师的初衷,嗯,感慨了一下🤔🤔。


想用一个成语总结一下 👉 相辅相成,就是这个意思🤓



语音设计需要考虑几个要点


一定要想好从哪里开始,到哪里结束

我们首先假设一个场景,调节空调温度的语音设计,那VUI设计师需要将这个场景的对话要贯穿该流程中去,那接下去要考虑这段对话可能出现的任何状况,以及相对应的解决反馈内容,再第二点设计VUI语法中,我给大家演示一下空调全方案案例。


设计VUI语法

语法就是用户输入给机器的指令,VUI的设计师需要了解对话设计的意图,尽量要考虑用户可能表达的所有方式,将最常用的表达方式提取出来,作为指令的模版,当然越多越好,这样给用户体验带来的感受会更好,能够解决用户的问题概率也会提高,别到时候语音助手反馈:“已经超出我能力范畴 or 您换个说法试试”,我一听到这些就炸毛了,后面就不可能再去使用它了,因此VUI设计师一定要多考虑一下指令。语法我会在我工作实际案例有特别详细的讲解(在实际案例篇幅 - 使用语音场景分析里面),这个特别重要,大家要细细的品。


空调案列分享:

用户一开始的输入指令可能有 “打开制冷模式”、“打开加热模式”这些都会有点官方定义的语法感觉会很正式

下面在延展一下用户轻松的说辞  👉 “我有点热了帮我开一下空调”、“今天太冷了,车温度好低啊” 其实用户的说法有很多,但是空调的模式就这么几种,所以需要抓住关键词 #热、#冷、#高、#低 ...,什么意思呢?因为这些关键词是起到决定性因素的内容,其他的修饰词语可能会千变万化,所以语音助手一旦检索到该词汇,就可以做出判断,到底是制冷、还是制热、还是通风等功能。先简单就介绍这一个,后面还有很多案列,大家好好看奥。


如何设计好回答用户的问题

在语音基础介绍中也有提到过TTS,他是语音交互中最主要的回答方式,就是将VUI设计者撰写好的对话设计脚本,通过TTS转化为语音去播报。回答能够给用户带来最直接的感受,回复是好是坏,会直接影响到这款语音产品的体验,想要设计好我想谈两个大方向,设计脚本尽量简洁明了,全局系统语言特点保持统一,后续有案列可以叙述讲解的。



国内外语音设计差异点

国内的语音设计和国外也会存在差异点的,首先是地方语言的差异,国内语言多达80种以上,汽车智能语音的在方言这一块相对堪忧,能够支持的方言相对较少,这也成为了中文语音识别的一个难题。


在设计语音之初我们就得定义好,需要支持那些方言,比如粤语、河南话、四川话等,现在的车载版本微信可以支持20多种方言,但是整体的车机系统可能难以做到这一点,这块内容是需要攻克的一个壁垒,据我查看国外报道,关于方言解决方案,宝马、三星和松下三家公司与语音识别公司 Nuance 合作开发新智能辅助技术,这项技术使得汽车语音系统在处理特定的方言时,可以更加容易。


还有一点就是中西方语言文化差异,那就举一个例子,单从一个社会礼仪就可以展现出两者之间的差距,国人路过遇见熟人总爱嘘寒问暖 “吃饭了吗?”、“到哪儿去”、“最近怎们样呀?”等,在我们看来,这是一种有礼貌的打招呼用语,但你要跟西方人这样打招呼 “Have you had your meal?”、“Where areyou going? ”,他们则会认为,你想请他吃饭,或者干涉其私事,会引起误解,而西方人见面通常打招呼 “Hello”、“How do you do! ”、“Nice day, isn't it? ”




实际案列讲解篇幅


语音唤醒设计

车载语音唤醒分为免唤醒和需要唤醒,免唤醒的定义就是无需说出唤醒关键词或者其他任何操作,就直接可以进行与语音助手交谈并处理任务。如需要唤醒的话,触发动作可分为点击、按压、语音等,目前市场上主流的车机唤醒方式有三种:


实体按钮,好处就是能够给到用户触觉上的反馈,用户感知性强


虚拟按钮:此类的按钮一般都会在中控屏幕上面,唤醒的方式是点击


语音唤醒:在驾驶场景中双手被占用,不能远距离的操作中控屏幕,最佳的交互操作方式就是语音唤醒



语音助手形象

在语音助手形象设计方面,会分为两种,一种是卡通化语音助手形象,而另外一种是抽象化语音助手,下面用实际案例展示一下,卡通形象我们就拿未来汽车的NOMI,抽象化Google的Android Auto语音形象


基于工业设计2021年01期的调查数据分析来看,卡通化的语音形象再亲和力上有很大的优势,能够被用户快速的接受,但是辨识度上可能存在同质化严重问题,所以在效果表现力上面有欠缺,也较难表达车企的品牌理念。抽象化的语音形象则通过造型的多变和动效丰富,从而在设计感和效果上相对突出,在传达性上也不满意,用户不容易知道当前语音是处在一个什么状态下,在亲和力上远也不如卡通化形象。



使用语音场景分析(重点)


关于车内可以延展很多应用的场景,要知道用户在驾驶过程中需要完成什么样的任务,接下来我们就围绕这几个核心的功能点  ➡️  多媒体(娱乐)、车辆控制、导航、电话,顺带将每个模块语音基础话术指令带过一下外加TTS反馈,也是让初学者熟悉一下命令,这块内容很重要奥,都是我在实际项目工作中总结出来的,大家要上点心好好看,答应我好嘛🥺🥺🥺


多媒体(音乐、电台)

播放音乐、电台或者是播客这些都是一辆车最为常见语音交互的功能之一吧,开车的时候都会听一些音频类内容,对于这个功能播放、暂停和切换歌曲等功能外,电台快速选择,针对这些功能我们可以划分一些子功能对应的典型话术👇👇


音乐-话术


播放音乐

按歌手 ➡️ 我想听霉霉的歌、播放周杰伦的歌

歌曲名称搜索 ➡️  播放天外来物、来一首七里香

歌手名称+歌曲名称组合精准定位(因为有很多翻唱的曲目) ➡️  播放周杰伦的七里香

按照语种 ➡️  我想听粤语歌、放一些英文歌

按照曲风 ➡️  来点爵士音乐、播放摇滚音乐


根据音源播放语

在线音乐 ➡️ 播放qq、网易云、酷我音乐等等(因为每一家车厂合作的音乐供应商不一样)

蓝牙音乐 ➡️ 播放蓝牙音乐、跳转到蓝牙音乐、放蓝牙歌曲、切换到蓝牙音乐、我要听蓝牙音乐

U盘音乐 ➡️ 播放U盘音乐、听U盘音乐的歌、跳到U盘音乐


音乐播放控制命令

切换当前播放列表上一首歌 ➡️ 切到上一首、上一首歌

切换当前播放列表下一首歌 ➡️ 放下一首音乐、切下一首

换一首歌播放 ➡️ 换一首歌、换一个音乐、换个歌

暂停歌曲 ➡️  暂停音乐、音乐暂停、停止播放音乐、不想听歌了

继续播放 ➡️  继续播放音乐、播放音乐


针对于音乐这个模块的基础语言先讲到这边了,因为在线音乐的功能相对比较多,所以后续我会对于QQ音乐、网易云、酷我音乐等在线音乐额外的语言控制命令再写一篇续集。



电台-话术


播放电台  

打开电台 ➡️ 打开/开启收音机、听广播、播放电台/收音机/广播/Radio

按频率收听 ➡️  调频<104.5>、播放调频<104.5>、收听调频<104.5>、广播<891>

按频段+频率搜索收听 ➡️  我想听FM<104.5>、FM<104.5>、收听/播放/我要听FM<104.5>、收听AM<1045>

按电台频道搜索收听 ➡️  我想听音乐类电台、我要听上海<民生聊聊>电台、收听<交通>/<新闻>广播

按在线音源+音频类型搜索并播放 ➡️  播放喜马拉雅的相声

按艺术家+音频类别搜索并播放 ➡️  我想听郭德纲的相声


播放源

喜马拉雅 ➡️ 收听/打开/我想听 喜马拉雅

FM ➡️ 打开/收听/我想听/播放/我要听 FM

AM ➡️ 打开/收听/我想听/播放/我要听 AM


电台扫描

扫描电台 ➡️  扫描电台、搜索电台、重新搜台、搜寻电台、搜索频道、扫描频道


电台轮播

轮播电台 ➡️  浏览电台、电台浏览、电台轮播、轮播电台、快速浏览


电台播放控制命令

上一个电台 ➡️  上个频道、上一个台

下一个电台 ➡️  下一个台、切到下一个台

换台 ➡️  换一个台

暂停电台 ➡️  暂停电台播放

收藏/订阅 节目 ➡️  收藏、收藏这个、添加收藏、加入收藏

取消 收藏/订阅 节目  ➡️  取消收藏、收藏取消



车辆控制-话术

基本功能包括车内空调温度调节、控制车窗开关、后视镜角度的调节,还可以切换驾驶模式、变换档位等等。


空调控制  

空调控制ON/OFF  ➡️ 打开空调、关闭空调

空调Auto  ➡️ 打开自动空调、自动空调开启

空调打开+模式 ➡️ 太冷了、好热啊(检索到关键词,制冷/热进行切换模式)

空调风量增减 ➡️  风量大/小一点、风大/小一点

设置风量级别 ➡️  风量设设为2级、风量调成2级、风量最大/小

空调温度增减 ➡️  温度高/低一点、温度调高/低一档

设置温度级别 ➡️  温度调到xx度、温度设置xx度、温度调到最高/最低温度(空调温度调整到对应指)

空调吹风模式 ➡️  吹脸/脚、吹脸吹脚、吹脚前除霜、前除霜(前除霜:处理前挡风玻璃的)

后窗除霜 ➡️  打开后除霜/雾、打开后窗加热、后挡风玻璃除霜/雾


车窗

开启/关闭车窗 ➡️ 开/开启/打开/关/关闭 车窗(未指定某一个窗户,打开/关闭所有车窗户)

指定开启/关闭车窗 ➡️ 开/开启/打开/关/关闭 - 左前/右前/左后右后窗 、 打开/关闭主驾旁边车窗、打开/关闭前排窗、打开/关闭后排窗、打开/关闭全部窗户

车窗开启/关闭到具体数值 ➡️  车窗开/关一半(1/2)(车窗调节范围0-100%,根据不同车厂设定值为准)


情景模式

前文中有提到TTS反馈,那我就在车辆控制中情景模式详细举例子给大家讲解一哈。

清凉模式  ➡️ 打开/开启/关闭 清凉模式     TTS反馈 清凉模式已打开/关闭、清凉模式已处于打开状态

温暖模式  ➡️ 打开/开启/关闭 温暖模式     TTS反馈 温暖模式已打开/关闭

雨雪模式  ➡️ 打开/开启/关闭 雨雪模式     TTS反馈 雨雪模式已打开/关闭、即将关闭车窗,请注意安全

抽烟模式  ➡️ 打开/开启/关闭 抽烟模式、我想抽烟    TTS反馈  抽烟模式已打开/关闭



导航-话术

导航是我们最常用的功能之一,对于用户而言输入地址是一件头疼🤦🤦的事情,所以在导航去目的地的时候,直接语音输入后,匹配所需要导航的目的地,让语音助手帮你直接导航,还可以询问语言助手到达目的地时间和距离播报,有的车机导航系统还可以支持语音缩放地图大小,省得两只手指在触控屏幕进行放大缩小操作手势,在导航中的使用语音主要的目的就是便捷与高效。导航中的执行逻辑我这边就不做过多叙述,因为相对要更专业点,后续有机会我在深挖讲解。


导航

公司  ➡️  我要去公司、导航到公司、去公司、上班了

回家  ➡️  我要回家、导航回家、回家了

注:如果没有设置公司/家的地址 需要进入设置公司/家的具体地址流程,设置完毕之后,方可语言导航去公司/家

附近加油站  ➡️  导航到附近/周围/周边加油站、帮我找个最近的加油站

当前位置 👉 导航到模糊的POI(会产生多个结果)  ➡️  导航到火车站(拿上海举例子:上海有虹桥火车站、上海火车站、上海南站、松江站、上海西站,因此产生了多个结果后,语音助手还会继续问到你需要导航到具体那个火车站,如果时间超过定义时间将默认为第一个)

当前位置 👉 导航到POI简称  ➡️  导航到人广(人名广场,要不要和我一起去吃炸鸡🐔 哈哈哈🤪🤪)、带我去交大(交通大学)


增加途径点

附近其他  ➡️  导航附近三甲医院

搜索指定位置+指定类型POI  ➡️  帮我找一下南京西路的日式餐厅

搜索指定距离+指定类型POI  ➡️  两公里以内的停车场、一公里中式快餐店

搜索指定位置+指定品牌POI  ➡️  南京西路的古驰店


导航距离/时间的播报

查询途径点的距离播报  ➡️  距离南京西路还有多远、距离下一个途径点距离还有多少

查询途径点到达耗时播报  ➡️  到南京西路还需要多久、距离下一个途径点还要多长时间



电话-话术

在驾驶过程成如果需要拨打电话,是一件不太容易的事情,而且是极其危险的,所以需要结合语音进行来辅助,接听/挂断 不管是屏幕触控 还是方向盘的硬按键都可以直接操作,体验还不错,对于不习惯语音的的人来说该功能点可以替代,但总体来说,语音接通/挂断会优于屏幕触控,硬按键对于长期使用来说可能会有优过语音,对于用户来说,在安全驾驶前提下,那种使用方式习惯就用那种。


拨打电话

联系人姓名  ➡️  打电话给老妈、呼叫老爸、联系哥哥、给姐姐打电话

拨打电话号码  ➡️  打电话给12315、打电话给18015888888

拨打常用黄页名  ➡️  打电话给中国电信、给上海银行打电话


接听/挂断/重拨/回拨

接听  ➡️  接听/接电话/接通电话/接听电话

挂断  ➡️  挂断/挂电话/挂断电话/挂掉电话

重拨  ➡️  重拨电话

回拨  ➡️  回拨电话




对话设计


对话设计是基于人们的对话的设计语言,它集合多个设计的内容,其中包括语音用户界面设计、交互设计、视觉设计、动画设计、语音对话脚本设计、乃至还有音频设计增加语音助手的灵动性。


对话设计的是否成功与否最重要的就是个性,现在市场上的许多车载语音系统对话听起来还是基本很相似,是因为很多公司都没有专业的对话设计师,要么是程序员、产品经理、好一点的公司组建一个语音组,都是从其他行业转化过来,然后将各个大厂的语音对话研究一下,就上岗了,国内优秀的VUI设计真的很稀缺,也是很缺少的人才,我可不想再用语音交互的时候 语音助手和我说“对不起,我没懂你的意思” 😒😒😒



对话设计师在规划用户在具体每个功能模块区域内做什么,同时还要考虑用户的需求和技术限制,对话的策略,是代表着该语音系统完整的用户体验,也包含这详细的规范定义流程和底层逻辑。


这边需要着重的讲一个小知识点:

我们会有一个误区,认为“对话”仅只是#说 or #听到的内容,其实对话本质上是多模态的,对话的核心内容是对话的流程和底层逻辑,图形界面的逻辑一般都不太会用在对话内容的设计方面,基本上他们两是一个独立的个体。




对话设计需要注意点


语音简短化

车载语音的对话做的是否OK?是基于对话内容时间的长短,因为用户没办法像查看UI界面内容那样,去查看语音的内容。根据人的平均记忆力,如果车载语音虚拟形象说了,关于这个话题很多内容,用户可能无法记全所有的内容,这对于对话将大打折扣,因此在对话过程中需要严格遵循  ➡️  简短明了,让每一个文字都有意义,避免重复的短语,可以让用户可以快速的做决定。



响应等待设计

当用户在用导航功能的时候,语音对话说“导航去火车站”,如果在上海的话,就有好几个火车站,需要用户再次去选择,#1虹桥火车站、#2上海火车站、#3上海南站、#4上海西站,我们在做项目的时候,体验设计师给他的定义是如果用户超过8秒还没有进行选择的话,默认是选择第一个,如果第一个目的地不是我想要的,那么我需要重新通过语音再次输入信息。我觉得默认选择这个选项可能会有些不妥,如果这期间来一个电话或者是微信的语言电话,那么我是不好通过语音去选择的,如果汽车不是在驾驶的状态,可以手动触控屏幕进行选择OK没问题,如果是驾驶状态下,就需要优化前面默认选择项了。


我的想法💡

(1)超过8秒钟后,默认选择第一个没有问题,但是在用户结束自己之前任务状态后,可以说重新选择目的地,将之前的搜索出来的火车站结果都再次调出来,提供用户重新去选择。

(2)这块就更智能化一些了(这个有一点前瞻性的意思,研发要是看到这个需求估计要揍死我🤫🤫),当语音助手检测用户正在忙的状态时候,在8秒钟都没有做出选择,那么语音助手可以从第一个目的地开始播报,用户可以通过方向盘OK硬按键去选择自己所需要导航的目的地,在驾驶过程中,方向盘的硬按键安全性远高于中控屏幕的点击。



避免过多的选择

给用户提供选择的选项列表的时,最好不要超过三个选项,给用户较少的选择,能够让用户更明确去抉择,减少过多选项对于用户的干扰,刚刚上面导航那个案例排除,上海火车站真的太多了没办法,其他城市应该还好都是1-3个左右。

我的想法💡

上面实际案例就是强行逼迫用户去选择一个,这种体验很差,有一种场景,如果这三个选项都不是我想要的,你就得重新在说,帮我推荐一下附近的餐厅,想想这种体验就不是我想要的,我觉得可以增加一些情感化的设计在里面,如果这三个选项都不是我想要的。

我可能会说“这些我都不想去、能不能帮我再推荐其他的”


语音助手说“你可真挑食、好的,那我就在帮你找找其他美食”(我的意思就是要让机器多去自我学习,更加智能化、情感化贴近于用户的交流,这样用户才会更愿意使用语音交互)



上诉的场景是对于这块区域不熟悉的用户来搜寻美食,如果用户有直接目的需要吃什么类型的餐饮的时候,语言助手只需要推荐相关美食就好,

用户说“帮我找一下附近的海底捞”


语音助手说“附近有三家海底捞,您是要去哪一家...(播报三家信息)”


(播报三家海底捞的 位置和距离 甚至我想是不是可以增加排队人数的播报,如果排队人很多就可以换一家,接下来就可以和语音助手直接说帮我预约好位置,省的用户到店面还要进行排队等候)



不要假设用户知道该做什么

在做对话设计的时候千万别考虑用户的思考逻辑,每个人的思考逻辑都不一样的,所以不用去猜想用户的想法,只需要提供有用的信息让用户自己选择好了,前面有提到对话设计是讲究有逻辑性的,你在设计对话剧本的时候不可能就只考虑一条线。


举个简短的例子,你在设计一个订购飞机票语音对话流程,你想法是,首先先确定目的地,哪里起飞去哪里,然后再选择时间点起飞。假设用户直接说:“帮我预定早上八点的飞机,飞往深圳”那问题来了一开始是用户是说的时间,最后只说了目的地,没有有说出发地,因此在语音设计剧本的时候,你需要将所有能出现的状况都考虑进去。



语言文案设计一致性

在图形设计之前UE也需要将动词、名词之间的搭配提前定义好,需要全局保持一致性,这块内容有在我第二篇文章提到过,因此在对话设计过程中也要格外注意。



不要信息轰炸用户

现实中我们正常 处理事物的时候,也是将事物划分成几块,然后按照计划步骤进行,而不是一股脑子乱做,车载语音设计也是如此,作为一个正常的用户来说,我们一次性说出的需求并不会很多,不会像专业的车机测试人员一样,去叙述一大堆信息去检测机器的运转效率,和一个处理信息的准确性,每次出差去南京走查,都会听到测试人员巴拉巴拉 一直说,我脑袋都大了🙄🙄🙄,所以我们正常用户都是逐步的去说消息的,举个列子🌰



避免使用专业术语

举一个场景的例子,当你在道路上开车,需要停在路边接朋友,朋友还没有到达指定位置,或者该位置是不可以停留的,语音助手正确说法“这边不可以停车,不然交警叔叔会罚款的,赶紧溜,我帮你找一个附近可以停车的地方吧” 错误的说法:“你触犯了了我国《交通法》第XXX条,......此处省略法律条文 🤦🤦 这边是禁止停车的”


首先当你听到触犯法律,你的第一想法what?这是什么鬼,给用户的感觉是很糟糕的,因为法律消息通常会包含阅读的长并且还不自然的语言,给用户带了不好的体验,并且还未给解决的方案。一个好的语言设计方案会让人喜欢上使用它。



最后来个总结:


后续我会对于前瞻性的语音进行探索,再写一篇。前瞻性的就再举一个🌰吧:通过面部扫描,检测到用户不开心的时候,车载系统可以推荐一些治愈系的电台,或者可以让用户放松、舒缓心理的的歌曲,或者你进行人机交谈(这个就比较高级,需要让语音系统进行大数据自我学习,达到能够和人能正常交流),让我们一起展望未来吧。




文章中如有不足之处,欢迎补充交流,我们下期见 👋👋👋


下期文章预告:HMI可用性测试


作者:设计界的影帝 


本文由 @设计界的影帝 原创发布。未经许可,禁止转载。


372
Statement: all the content and comments made by netizens in ZCOOL only represent themselves, and do not reflect any opinions and opinions of ZCOOL.
Report
Share
Collect
in to comment
Add emoji
喜欢TA的作品吗?喜欢就快来夸夸TA吧!
All Comments0
上海 | 设计爱好者
Article information
文章标签
收录收藏夹
更多收录此文章的收藏夹