你可以再说一次：关于语音交互的重复原则

三分设

上海/UX设计师/3年前/552浏览

版权

你可以再说一次：关于语音交互的重复原则

三分设

google 的设计师专注于讲解“复述”法则是如何提升语音交互用户体验的，让读者对于语音交互如何提升用户体验有个更清晰的概念。

作为现在大热的语音交互，已经有不少文章进行了设计探讨。但是大部分的文章还是以笼统性地介绍为主，并没有深入探讨。而在此篇，google 的设计师专注于讲解“复述”这一设计法则是如何提升语音交互用户体验的，并且结合案例，可以让读者对于语音交互如何提升用户体验有个更清晰的概念。

这篇po文摘选于《产品设计里语言设计的作用》某章节——“ 对话从这里开始”

作为初来乍到的健身房新人，我最近一直在脑海里反复告诫自己：“一分耕耘一分收获”。但是作为一个语音交互设计师和语言学家，相比提醒自己需要在背部下拉机上重复训练，我发现自身的注意力更集中在思考语言上出现的复述法则。

这里有段关于“复述”概念的小例子

A: 乔虽然是服务员，但是从另一方面来讲他也很爱涂涂抹抹啦

B：哦是吗？他喜欢涂涂抹抹哪种风格的画？

A：画？我说的是他给别人的房子涂涂抹抹！

原文，帮助理解

A: Joe’s a waiter, but he paints on the side.

B: Oh, what kind of pictures does he paint?

A: Pictures?! He paints houses.

动词 “涂刷” （paint）出现了2次，而名词 “画” （picture）出现了一次。“明确地复述”（即B根据上文A说的“paint“，提出疑问”paint“的是什么”picture”）将2个句子连接了起来，让对话符合逻辑。语言学家会将此作为描述语言中“连贯性”的很好的案例。

“连贯性”一般发生于一段话里，解读一个事物时，需要参考同一段话中的其他事物。衔接手段 —— 如复述、代词和话语标记① ——是指那些连接碎片化口头语或书面语的文字，让想法和细节可以融合并保持清晰意思的词组或者短语。由于这些方法将文本片段以有意义的方式连接起来，它们对确保我们交流的可靠性和理解的简便性起到了帮助。

①话语标记：话语标记是指在句法上独立的一个单词或一个短语，它一般在句中起提示、停顿或过渡的作用，大多数时候没有实际意义，如果去掉也不会影响句子的意思。类似于“well”, "I mean"。

正如“复述”在日常的对话中有效发挥作用一样，它也是语音交互中极具价值，却经常被忽视的技巧。为了弄清楚为什么复述在语音交互中如此重要，我们首先必须理解语音识别技术中的“错误接收信息”问题。

错误接受信息

首先，“正确接收信息”是指用户说出某些内容且识别器作出了正确理解。与其相反，“错误接收信息”发生于当用户说出某些内容，而识别器理解错误的情况。例如，用户说“到奥斯汀（Austin）的往返机票”，但识别器错误地将话语理解为“往波士顿（ Boston）的往返机票”。其他错误接收信息的例子是“6月13日（thirteenth）”被误认为是“6月30日（thirtieth）” ......或“四十（forty）美元”被误认为是“十四（fourteen）美元”。

随着语音识别系统变得越来越准确，错误接收信息的情况变得越发少见（即便如此，为它们设计依然至关重要，原因我们马上就会看到）。也许有一天这种情况会成为过去，但在此时，我们还没有拥有 “完美”（恩，跟真实人类一样“完美”）的语音识别技术，那么我们怎样才能将问题最小化呢？那就是复述！

这是一段识别器没有重复它所听到的“疑问”的小例子：

用户：11乘3等于多少？

语音助手：等于21。

原文帮助理解：

User: What’s 11 times 3?

Assistant: The answer is 21.

这种反应令人困惑，因为我们大多数人都知道答案不是21。这条实际上是被“设计”过的回复，看起来却像语音助手连基本的算术都做不好。而且，如果这是一个更复杂的数学问题，我们可能把这个答案当作正确结果并接受且执行它（因为我们可能无法判断它的对错性）。

现在这里有一个如果识别器向用户重复它认为听到的内容，交谈会如何进行的小对话：

用户：11（eleven）乘以3等于多少？

助理：7（seven）乘以3是21。

用户：不，11----乘以3等于多少？

助理：11乘以3等于33。

原文帮助理解：

User: What’s 11 times 3?

Assistant: 7 times 3 is 21.

User: No, what’s 11 times 3?

Assistant: 11 times 3 is 33.

通过复述我们认为用户所说的内容，很明显马上就显现出一个关于语速过快的识别问题 ——“错误接收信息”。通过使系统的识别假设对用户透明开放，语音助手似乎不再是数学不好（只是在某些场合下听力有点问题）。同时用户明白需要再次询问。

隐喻式确认

当我们只复述了来自用户请求的重要部分的信息时，称为“隐喻式确认”。这种复述在语音交互中很有用，这样用户就可以知道系统是否正确理解了请求。一方面，当识别器理解正确时，“隐喻式确认”提供了切实的保证（因为它会复述重要部分）。这种保证让用户对识别技术充满信心，尤其是如果他们过去有受到过其他不精准系统的煎熬。另一方面，当识别器理解错误时，“隐喻式确认”让用户知道他们需要再次尝试或改善他们提出的请求。这使得这个设计可以“被原谅”。也就是说，当错误发生时，这种设计可以最大限度地减少错误接收信息的后果。

以下是“隐喻式确认”的更多例子：

用户：佐治亚州的座右铭是什么？

助理：佐治亚州的座右铭是“智慧，正义，适度”。

用户：谁是印度总理？

助理：印度总理是Narendra Modi。

用户：致电AmberGómez。

助理：打电话给AmberGómez。

原文帮助理解

User: What’s the state motto of Georgia?

Assistant: Georgia’s motto is “Wisdom, Justice, Moderation.”

User: Who is the Prime Minister of India?

Assistant: The Prime Minister of India is Narendra Modi

User: Call Amber Gómez.

Assistant: Calling Amber Gómez.

特别是如果用户无法使用屏幕 | 假设他们正在开车 | 那么听到“AmberGómez”他们知道他们即将与对的人联系。毕竟，设想一下当我们使用语音进行信息输入后，等到跟另一人交谈的那刻才意识到联系错了人，我们会感到尴尬与懊恼。这种经历让我想起一位店主给我发了一条短信，为“昨晚的争吵”发自内心给我道歉 | 然而我们并没有吵架过 | 他希望我收到时已经平静下来。糟糕，发错人了！（没错，我还回复了。）

直白确认

复述用户所说的话是另一种确认方式的基础——“直白确认”。与“隐喻式确认”不同，“直白确认”会向用户发出声明，要求他们给予“是”或“否”的确认。这里有个例子：

网友：我需要6月7日从L.A到迈阿密的航班。

助理：好的，是6月7日从Los Angeles(洛杉矶)到迈阿密航班。我理解对了吗？

用户：是的，你对了。

......语音助手重复“迈阿密”和“6月7日”，并用“Los Angeles”取代用户的“L.A”。

原文助于理解

User: I need a flight from L.A. to Miami on June 7th.

Assistant: Okay, that’s from Los Angeles to Miami on June 7th. Did I get that right?

User: Yes, you did.

…where the Assistant repeats back “Miami” and “June 7th” and replaces the user’s “L.A.” with “Los Angeles.”

直白确认和隐喻式确认的适用情况