你可以再说一次:关于语音交互的重复原则

Recommanded by editor
上海/UX设计师/3年前/552浏览
你可以再说一次:关于语音交互的重复原则Recommanded by editor
三分设

google 的设计师专注于讲解“复述”法则是如何提升语音交互用户体验的,让读者对于语音交互如何提升用户体验有个更清晰的概念。

作为现在大热的语音交互,已经有不少文章进行了设计探讨。但是大部分的文章还是以笼统性地介绍为主,并没有深入探讨。而在此篇,google 的设计师专注于讲解“复述”这一设计法则是如何提升语音交互用户体验的,并且结合案例,可以让读者对于语音交互如何提升用户体验有个更清晰的概念。

这篇po文摘选于《产品设计里语言设计的作用》某章节——“ 对话从这里开始”


作为初来乍到的健身房新人,我最近一直在脑海里反复告诫自己:“一分耕耘一分收获”。但是作为一个语音交互设计师和语言学家,相比提醒自己需要在背部下拉机上重复训练,我发现自身的注意力更集中在思考语言上出现的复述法则。

这里有段关于“复述”概念的小例子

A: 乔虽然是服务员,但是从另一方面来讲他也很爱涂涂抹抹啦

B:哦是吗?他喜欢涂涂抹抹哪种风格的画?

A:画?我说的是他给别人的房子涂涂抹抹!

原文,帮助理解

A: Joe’s a waiter, but he paints on the side.

B: Oh, what kind of pictures does he paint?

A: Pictures?! He paints houses.


动词 “涂刷” (paint)出现了2次,而名词 “画” (picture) 出现了一次。“明确地复述”(即B根据上文A说的“paint“,提出疑问”paint“的是什么”picture”) 将2个句子连接了起来,让对话符合逻辑。语言学家会将此作为描述语言中“连贯性”的很好的案例。

“连贯性”一般发生于一段话里,解读一个事物时,需要参考同一段话中的其他事物。衔接手段 —— 如复述、代词和话语标记① ——是指那些连接碎片化口头语或书面语的文字,让想法和细节可以融合并保持清晰意思的词组或者短语。由于这些方法将文本片段以有意义的方式连接起来,它们对确保我们交流的可靠性和理解的简便性起到了帮助。

①话语标记:话语标记是指在句法上独立的一个单词或一个短语,它一般在句中起提示、停顿或过渡的作用,大多数时候没有实际意义,如果去掉也不会影响句子的意思。类似于“well”, "I mean"。

正如“复述”在日常的对话中有效发挥作用一样,它也是语音交互中极具价值,却经常被忽视的技巧。为了弄清楚为什么复述在语音交互中如此重要,我们首先必须理解语音识别技术中的“错误接收信息”问题。

错误接受信息

首先,“正确接收信息”是指用户说出某些内容且识别器作出了正确理解。与其相反,“错误接收信息”发生于当用户说出某些内容,而识别器理解错误的情况。例如,用户说“到奥斯汀(Austin)的往返机票”,但识别器错误地将话语理解为“往波士顿( Boston)的往返机票”。其他错误接收信息的例子是“6月13日(thirteenth)”被误认为是“6月30日(thirtieth)” ......或“四十(forty)美元”被误认为是“十四(fourteen)美元”。

随着语音识别系统变得越来越准确,错误接收信息的情况变得越发少见(即便如此,为它们设计依然至关重要,原因我们马上就会看到)。也许有一天这种情况会成为过去,但在此时,我们还没有拥有 “完美”(恩,跟真实人类一样“完美”)的语音识别技术,那么我们怎样才能将问题最小化呢?那就是复述!

这是一段识别器没有重复它所听到的“疑问”的小例子:

用户:11乘3等于多少?

语音助手:等于21。

原文帮助理解:

User: What’s 11 times 3?

Assistant: The answer is 21.

这种反应令人困惑,因为我们大多数人都知道答案不是21。这条实际上是被“设计”过的回复,看起来却像语音助手连基本的算术都做不好。而且,如果这是一个更复杂的数学问题,我们可能把这个答案当作正确结果并接受且执行它(因为我们可能无法判断它的对错性)。

现在这里有一个如果识别器向用户重复它认为听到的内容,交谈会如何进行的小对话:

用户:11(eleven)乘以3等于多少?

助理:7(seven)乘以3是21。

用户:不,11----乘以3等于多少?

助理:11乘以3等于33。

原文帮助理解:

User: What’s 11 times 3?

Assistant: 7 times 3 is 21.

User: No, what’s 11 times 3?

Assistant: 11 times 3 is 33.

通过复述我们认为用户所说的内容,很明显马上就显现出一个关于语速过快的识别问题 ——“错误接收信息”。通过使系统的识别假设对用户透明开放,语音助手似乎不再是数学不好(只是在某些场合下听力有点问题)。同时用户明白需要再次询问。

隐喻式确认


当我们只复述了来自用户请求的重要部分的信息时,称为“隐喻式确认”。这种复述在语音交互中很有用,这样用户就可以知道系统是否正确理解了请求。一方面,当识别器理解正确时,“隐喻式确认”提供了切实的保证(因为它会复述重要部分)。这种保证让用户对识别技术充满信心,尤其是如果他们过去有受到过其他不精准系统的煎熬。另一方面,当识别器理解错误时,“隐喻式确认”让用户知道他们需要再次尝试或改善他们提出的请求。这使得这个设计可以“被原谅”。也就是说,当错误发生时,这种设计可以最大限度地减少错误接收信息的后果。


以下是“隐喻式确认”的更多例子:

用户:佐治亚州的座右铭是什么?

助理:佐治亚州的座右铭是“智慧,正义,适度”。

用户:谁是印度总理?

助理:印度总理是Narendra Modi。

用户:致电AmberGómez。

助理:打电话给AmberGómez。

原文帮助理解

User: What’s the state motto of Georgia?

Assistant: Georgia’s motto is “Wisdom, Justice, Moderation.”

User: Who is the Prime Minister of India?

Assistant: The Prime Minister of India is Narendra Modi

User: Call Amber Gómez.

Assistant: Calling Amber Gómez.

特别是如果用户无法使用屏幕 | 假设他们正在开车 | 那么听到“AmberGómez”他们知道他们即将与对的人联系。毕竟,设想一下当我们使用语音进行信息输入后,等到跟另一人交谈的那刻才意识到联系错了人,我们会感到尴尬与懊恼。这种经历让我想起一位店主给我发了一条短信,为“昨晚的争吵”发自内心给我道歉 | 然而我们并没有吵架过 | 他希望我收到时已经平静下来。糟糕,发错人了!(没错,我还回复了。)

直白确认

复述用户所说的话是另一种确认方式的基础——“直白确认”。与“隐喻式确认”不同,“直白确认”会向用户发出声明,要求他们给予“是”或“否”的确认。这里有个例子:

网友:我需要6月7日从L.A到迈阿密的航班。

助理:好的,是6月7日从Los Angeles(洛杉矶)到迈阿密航班。我理解对了吗?

用户:是的,你对了。

......语音助手重复“迈阿密”和“6月7日”,并用“Los Angeles”取代用户的“L.A”。

原文助于理解

User: I need a flight from L.A. to Miami on June 7th.

Assistant: Okay, that’s from Los Angeles to Miami on June 7th. Did I get that right?

User: Yes, you did.

…where the Assistant repeats back “Miami” and “June 7th” and replaces the user’s “L.A.” with “Los Angeles.”


直白确认和隐喻式确认的适用情况

“直白确认”适用于以下情况:

  • 当这个字面意思的错误成本很高时,例如出售100股谷歌股票
  • 应用于即将执行一些难以或无法撤回的操作,例如取消订单
  • 用户已投入时间在系统里输入了许多模块的信息,例如预订机票
  • 有一个关于交易或法律的请求需要用户明确口头同意,例如在最终确定汇款之前
  • (语音助手)对特定情况识别结果的准确性,信心很低

“直白确认”的好处是用户清楚如何应对。当用户被问到一个确认“是或否”的问题时,他们将知道如何在(语音识别)“接收错误信息”的情况下使对话回到正轨。

然而,“直白确认”的缺点是感觉对话进展缓慢,尤其是在多次确认的情况下。

相反,“隐喻式确认”适用于一下情况:

  • 不太会发生由于误识别而导致的不良后果
  • 对于识别准确度的信心很高

“隐喻式确认”的优点是速度。当系统一直正确接收信息时,相对使用体验会很高效。而当系统错误地接收信息时,用户也只丢失了语音助手复述所消耗的那几秒钟,他们还是可以简单地复述或重申他们的需求。

“隐喻式确认”的一个潜在缺点是,当用户需要修复系统的错误接收时,他们可能不知道该说些什么。在这种情况下,应该构建语法识别以配合用户试图更改错误的需求。这需要用到关于用户日常交谈的行为数据,以及语法识别的迭代改进(类似于乐器使用前的“调音”功能)。

在考虑使用哪种类型的确认时,重要的是要将识别准确性和识别错误的成本考虑在内。

总而言之,重复用户刚刚说过的内容是语音交互中信息确认决策的核心。反过来,这些策略是使这个设计可以“被原谅”的基础。也就是说,确认机制可以最小化错误接收信息的后果。

确认机制还可以建立用户的信任度。如果用户知道语音助手永远不会根据没有事先进行双重确认的识别结果做出决定,他们将可能更信任该技术并感受到对发生事物的控制权。

想要更多精彩小窍门,请查看Google的最佳语音设计案例(http://actions.google.com/design)。

特别感谢 Eunice 刘协助整理内容

故事来自谷歌鹅的设计案例。查看更多编辑文章请访问design.google

原文标题:You Can Say That Again: The Role of Repetition in Conversation Design

原创作者:James Giangola

原文链接:https://medium.com/google-design/you-can-say-that-again-the-role-of-repetition-in-conversation-design-55937ef0f0ba

翻译作者:弹跳

授权获取:张聿彤

文章审核:王翎旭

文章编辑:王鸿飞

该译文并非完整原文,内容已做部分调整。如在阅读过程中发现错误与疏漏之处,欢迎不吝指出。如需转载,请注明来自 三分设


2
阅读原文
|
Report
|
3
Share
相关推荐
评论
in to comment
Add emoji
喜欢TA的作品吗?喜欢就快来夸夸TA吧!
推荐素材
You may like
一梦大唐·长恨歌
Homepage recommendation
x oasis coffee
Homepage recommendation
相关收藏夹
测试
测试
测试
测试
作品收藏夹
企业展厅
企业展厅
企业展厅
企业展厅
精选收藏夹
作品收藏夹
ip形象设计+表情包
ip形象设计+表情包
ip形象设计+表情包
ip形象设计+表情包
精选收藏夹
作品收藏夹
企业展厅/文化墙 参考
企业展厅/文化墙 参考
企业展厅/文化墙 参考
企业展厅/文化墙 参考
精选收藏夹
作品收藏夹
小家电
小家电
小家电
小家电
精选收藏夹
作品收藏夹
IP形象及IP内容
IP形象及IP内容
IP形象及IP内容
IP形象及IP内容
精选收藏夹
作品收藏夹
大家都在看
Log in