本系列将拆分为上下篇,通过系统介绍可用性测试完整方法论,助力设计师有效验证设计方案可行性。
ISO 9244-11国际标准对可用性的定义:
特定的用户
在
特定的使用情境
下,
有效、有效率、满意
地使用产品达到
特定的目标
。
作为用户研究常用的定性研究方法之一,可用性测试聚焦于
典型用户在使用场景中的真实表现
。通过观察用户完成产品典型任务的过程,记录并发现产品问题,为体验优化提供有效依据。
为了大家能在实际项目中有效开展可用性测试,后续将对测试前、中、后的每个环节展开介绍。
没有目标就没有方向,同用户深度访谈一样,可用性测试也需要先确定一个目标。在产品不同阶段,测试目标也有所不同,但核心都是围绕
理解用户行为
、
发现产品问题
展开,从而为设计、开发提供精准的优化方向,避免重复返工。
在实际项目中,不同的测试目标对应不同的测试方法。除了定性的可用性测试,还有定量的A/B测试和灰度测试。由于
定量测试需要大量的样本为基础
,所以A/B测试和灰度测试在C端场景更为常见。
A/B测试:为了筛选最佳方案,同时对2个或多个方案收集来自大量相似属性的用户群体的反馈。比如,按钮颜色、页面布局。
灰度测试:为了保证产品版本的顺利发布,及时发现并纠正Bug,在正式发布前选择特定人群试用,并逐步扩大使用群体的范围。
与深度访谈类似,首先,根据测试目标确定用户类型和具体数量。然后,通过熟人推荐、公司数据库、问卷调查等方式筛选合适用户。最后,安排测试日程,对用户进行邀约,确定时间和地点。具体内容可回顾
《设计师必看!超全用户深度访谈指南(上)》,此处不做赘述。
在
深度访谈方法指南中提到,产品的目标用户一般可分为小白用户、普通用户和专家用户三种类型。在可用性测试的用户招募中,建议保持
50%-60%的普通用户占比
,既能发现基础易用性问题,也能验证常规功能。测试规模方面,尼尔森博士认为由
5个典型用户参与的可用性测试就可以发现产品80%的问题
。
测试脚本是可用性测试的核心框架。优秀的测试脚本包含明确的目标、真实的任务和有效的评价,时长控制在1小时左右。
测试脚本可分为开场铺垫、测试前访谈 、场景任务、测试后访谈四个模块:
开场铺垫(5min):主持人自我介绍,说明测试目的和主要内容,缓解用户紧张情绪。强调对用户的隐私保护,征得同意后进行录音/录像。
测试前访谈(5-10min):了解用户基本信息、对产品的使用习惯,方便理解用户的操作行为。
场景任务(酌情安排):设计核心测试任务和评分问卷,明确观察和记录的重点。
测试后访谈(10min):了解用户的评价,探究用户想法,结束时对用户表示感谢。
开场铺垫模块重在以简洁的语言介绍清楚测试目的,鼓励用户使用
发声思考法
,并强调
测试的是产品而不是用户
,以减轻用户的心理负担。
其中,
发声思考法指的是让用户一边操作一边主动说出内心想法
,有利于测试人员进行观察和记录。实际测试中,用户可能并不习惯一边说一边做,测试人员可以通过适当的引导提问获取用户的真实想法。
测试前访谈模块重在初步了解用户基本信息和产品使用基本情况,收集用户对产品或竞品的基本看法。
场景任务模块是测试脚本的重中之重,需要围绕核心功能点,设计场景化任务,并对任务的完成情况进行合理有效的评估。
首先,
不是所有的功能点都需要测试
。一般来说,新产品的核心功能、入口/操作路径变更的功能、新增的流程复杂的功能和团队内部有争议的功能适合优先进行可用性测试。
其次,围绕选择的测试功能点设计场景任务。设计任务的基本原则如下:
单个任务含1个多个功能点:单个任务可包含1~2个简单功能点,但不宜覆盖过多功能,避免用户注意力分散。
符合常规操作流程:任务应符合用户真实使用习惯,避免反逻辑设计。
明确的起点和终点:清晰说明初始条件,并定义任务结束的标志。
不应过于简单:任务应能暴露潜在问题,建议平均3~5分钟完成一个任务。
避免提供操作步骤:只描述需要用户做什么,不提供具体操作步骤。
如何将任务“剧本化”呢?可以遵循1个功能清单、1个场景、N个条件+1个目标原则:
1个功能清单:明确待测试的功能点,将其组合在1个或多个任务中。
N个条件+1个目标:说明完成任务需要的条件(如时间、地点等),明确任务完成的目标。
没有包含任务目标:用户不清楚为什么要做这件事,导致操作动机不足。
情境与任务毫不相关:虚假或牵强的场景会降低用户代入感,影响测试真实性。
对用户进行过多限制:过度约束用户行为,导致测试结果失真。
包含具体步骤和方法:指明操作路径,掩盖真实可用性问题。
涉及个人隐私、政治、宗教:可能引发用户不适或抵触情绪,影响测试氛围。
出现专业术语:用户可能由于不理解而导致任务失败,并非产品问题。
最后,明确评价测试任务的关键指标。常见的
核心指标有有效性、任务效率和满意度
,此外,还可根据测试目标自行定义。
有效性:产品功能的可用性,包括但不限于信息可见性、信息可读性等。
测试任务和评价指标确定后,还需明确测试过程中观察、记录的重点,准备相关的材料。
针对单个任务,记录的重点主要有关键指标、用户的微表情和动作以及详细的操作流程。
对于测试指标中的满意度评价,可以借助相关量表进行定量评估。
常用量表有场景后问卷(ASQ)和系统可用性问卷(SUS)
。
场景后问卷(ASQ)用于
每个任务完成后
,只有3个问题,快速评估用户体验。每个问题的平均分越高,体验越好。
系统可用性问卷(SUS)用于
整场测试结束后
,有10个问题,评估整体的可用性。平均分在70分以上是可接受的。
场景任务测试完成后,可以通过简单的访谈询问测试中用户产生疑问的原因,了解用户对产品的看法和建议,向用户表示感谢。
可用性测试彩排包括现场布置、设备调试、材料准备和熟悉脚本等内容,从而保证正式测试过程的专业程度。
可用性测试对连贯性的要求较高,应选择隐私性较强、不易被打扰的场所作为测试地点。条件允许的情况下,
优先选择线下测试
,便于观察和记录现场信息。
在测试材料准备方面,包括测试原型图、测试任务卡、测试记录表和测试问卷。结合产品不同设计阶段,早期可用草图测试信息架构,中期可用交互原型测试流程逻辑,后期用高保真UI测试用户体验。
测试前的准备工作告一段落,下篇内容将介绍测试中的实践技巧和测试后的整理分析。敬请期待~