2010年5月9日星期日

可用性工程的可用性评估 - 专家评估

以前的文章提到过,可用性评估大概有以下五种:

  • 用户模型(User Model
  • 启发式评估 (Heuristic Evaluation)
  • 认知性遍历 (Cognitive Walkthrough)
  • 用户测试 (User Testing)
  • 用户问卷调查 (Questionnaire)

大体上分为三类:也就是所谓的理论评估、用户评估和专家评估

今天继续介绍可用性工程的可用性评估 - 专家评估部分。

其实我对专家评审法这种用户不参与的方法挺有兴趣的。所谓的专家评审法大略有以下两种方法:

  1. 启发式评估(Heuristic Evaluation):可用性专业人员根据已有的可用性原则,对界面进行逐一评估。
  2. 认知性遍历(Cognitive Walkthrough):可用性专业人员将自己“扮演”成为用户,通过一定的任务对界面进行检查评估。

具体地说,专家评估就是由评估者(人因专家)以一种可以称为结构化的方式使用系统,测试是否符合预先定义的准则。评估结果反映了评估者的主观看法。这种评估方式主要是系统一致性的评估,即将系统和已建立的人因标准、规则(guideline)或原则(principle)进行比较。

专家评估快速并且便宜,但其缺点是,虽然专家是根据情况(用户水平、群体习惯等)作出判断,但专家关于任务的知识很少,难以从用户的立场看问题,且各人倾向会影响判断。以上的文字来自网络,无法判断最初来源。

 

启发式评估(Heuristic Evaluation)

启发式评估法就是使用一套相对简单、通用、有启发性的可用性原则(即“启发”)来进行可用性评估。具体方法是,专家使用一组称为“启发式原则”的可用性规则做为指导,评价用户界面元素(如对话框,菜单,在线帮助等)是否符合这些原则。

虽然任何人都可以充当评审人员的角色,有试验表明,选用既具有可用性知识又具有和被系统相关专业知识的“双重专家”是最有效的,这样的双重专家比只用可用性知识的专家平局多发现大约20%的可用性问题。每一个评审人员在1~2各小时的评估后都应该提供一个独立的报告,将各独立的报告综合以后就得到最后的报告。在报告中应该包括可用性问题的描述,问题的严重性,改进的建议。

可用性启发的原则又有哪些呢?

可用性启发原则

  1. · 系统状态可见性
  2. · 系统与用户现实世界相互匹配
  3. · 用户控制权与自主权
  4. · 一致性与标准化
  5. · 错误预防
  6. · 识别而非回记忆
  7. · 使用的灵活性与有效性
  8. · 美观而精炼的设计
  9. · 帮助和文档

接下来细细讨论这些原则:

系统状态的可视性

  • 在适当的时候应提供适当的反馈,以便用户随时掌握系统的运行状态
  • 系统的反馈形式可以分为两类:
    • 一类是非文字反馈,另一类是文字反馈
    • 非文字反馈是指系统通过改变人机界面元素的外观或显示暂时的元素,让用户知道他们行动的结果
    • 文字反馈指的是系统根据用户的行动而产生的文字信息
  • 根据反馈显示时间的长短,可以分为非持久反馈和持久反馈。
  • 非持久反馈只与某一个动作有关,在动作完成后,反馈也应被取消。
  • 一些非常重要的反馈则应该成为界面的一部分,持久显示

系统应与用户真实世界相符合

  • 使用用户语言,也就是使用用户熟悉的词汇、惯用语和概念,而不是面向系统的术语。系统还应符合真实世界中的习惯,信息应该按一个自然、合理的顺序出现
  • 其实不仅仅使词语和概念,非语言性的信息同样重要,例如图标、工作的流程等也要符合用户在真实世界的使用习惯

用户的控制权及自主权

  • 提供标记醒目的“紧急出口”,便于用户退出异常状况
  • 与此相关的可用性问题的例子:
    • 在不可逆转的行动之前系统没有提供足够警告
    • 系统没有在适当的实际提供取消的功能
    • 系统的取消功能不明显或是很难找到
    • 系统不支持撤销的功能

一致性和标准化

  • 避免用户无法确定不同的词汇(或情景、动作)是否具有相同含义的情形。
  • 一致性包括两个方面:
  • 内部一致性和外部一致性。
    • 内部一致性指的事系统的各部分之间要保持一致
    • 外部一致性是指系统应该和其他系统、传统习惯及标准保持一致,也就是标准性

帮助用户识别、诊断和修复错误

  • 使用简明的语言,描述问题的本质并推荐解决方法
  • 系统信息应该礼貌,不应该将错误归咎于用户。如“非法命令”或“非法用户名或密码”
  • 在设计错误信息时,另一个常见的策略是先为用户提供一个短的信息,如果这个信息不能满足用户的需要,他们可以用一个按键或链接找到更详细的帮助信息。短的错误信息用来处理比较常见的情况,读起来简单一些,并且可以在大多数情况下帮助用户解决问题。

预防错误

  • 应尽可能预防错误的发生
  • 基于知识的行为和学习是没有区别的,这常常发生在人们刚刚开始使用一个新的系统的时候。在这个层次的行为中,错误主要是由于用户对系统理解的差错引起的。为了防止错误,应该为用户提供正确的帮助信息,帮助他们在解决问题的过程中建立对系统的正确理解
  • 基于规则的行为层次,用户根据记忆中已经形成的规则来处理所接受到的信息。错误常常是因为忽略了重要的步骤,或是使用了错误规则来处理问题。在这个行为层次里,防止错误最有效的方法就是提供明确的文字提示,或是非语言的暗示(如鼠标的变化)
  • 基于技巧的行为层次,用户的行为是一种近乎机械的行为,他们可以不断地对接受到的信号进行条件反射式的处理。错误常常是与用户的知觉及运动技能有关。系统提供的信息应该能清晰地从背景中分辨出来,防止用户错误。在必要时,还应该使用户的行为提升到基于规则的行为层次,用正确的规则处理问题

识别而非记忆

  • 使得对象、动作和选项清晰可见。用户应该不需要在系统的一个部分记忆一些信息,才能使用系统的另一个部分,系统的使用说明应该在需要时容易找到,并清晰可见。

使用的灵活性及有效性

  • 提供一些新用户不可见的快捷键,以便有经验的用户快速执行任务
  • 相关可用性问题的例子:
    • 系统缺少自动化,没有自动地执行下面地任务,例如,一个新的视窗打开时,视窗的大小不合适,用户不得不自己改变视窗的大小
    • 系统没有提供应有的默认值
    • 默认值不正确
    • 使用系统需要太多的控制动作
    • 系统没有提供捷径,如:没有定义必要的功能键

最小化设计

  • 用户界面应美观、精练,不应该包括不相关或不常用的信息。任何多余的信息都会影响哪些真正相关的信息,从而降低他们的可见性
  • 从视觉角度来说,界面上如果有几个元素距离比较接近,或是被先或线框所包围,或是一起移动、变化,或是在形状、颜色、大小、字体上比较相似,人们会认为他们是同一个部分或同属于一组。界面设计中正确地应用这个原则可以起到简化的效果,如果使用不当,则会引起用户理解上的混乱。
  • 人体工程学告诉我们,人的注意资源是有限的,过多的信息不但会使新用户迷惑,也会让熟练用户慢下来。当人的心理活动指向和集中于某一对象时,该对象即成为人的注意中心,它所提供的信息,将得到大脑最有效的加工。处于注意边缘的事物,虽位人所仪式,但大脑反映得模糊不清。而处于注意范围之外的事物,则完全不为人所仪式。所以,人机交互时,人不可能把界面上的所有元素全部接受并产生意识,当用户只能注意某一方面的信息时,就不能注意其他方面的信息。
  • 因为用户注意资源的有限性,界面的设计不但要引导用户合理地使用他们的注意资源,也应该保持界面提供的信息精练简介,在界面上突出某一个元素的方法很多,如使用和背景或其他元素不同的颜色,使用粗体字或大一些的字号,放在页面左上角的信息比右下角的信息得到更多的注意

帮助及文档

  • 提供易于检索、便于用户逐步学习的帮助信息
  • 实验表明,用户使用联机帮助比使用用户手册找到相关信息的时间要短。
  • 相关可用性问题的例子
    • 帮助信息或用户手册不存在
    • 帮助信息没有意义或使用户更加迷惑

 

 

认知性遍历(Cognitive Walkthrough)

在认知性遍历中,专家测评者从一个说明书或早期的原型出发勾践任务场景,然后让用户使用此界面完成任务,即“遍历”界面。用户(称为典型用户)就像使用真正的界面那样对界面进行遍历,使用它们来完成任务。仔细观察用户使用界面的每一步骤,如果界面中存在妨碍用户完成任务的地方,就表明界面中缺少某些必要的内容;完成任务的功能顺序如果繁杂反复,就表明界面需要新的功能以简化任务并修改功能的顺序。

进行认知性遍历活动,需要以下四个条件

  1. 对系统原型的详尽描述,这种描述不一定是完整的,但要相当详尽。诸如菜单的位置描述或措辞选择等这样的细节也可能导致相当大的差异。
  2. 对用户在系统中要完成任务的描述,该任务应当是大多数用户将要执行的有代表性的任务。
  3. 一个完整的、书面的操作清单,列出使用给定原型完成任务所需执行的操作。
  4. 确定用户的身份,以及评估人员能够确定这些用户已具有哪一类别的知识和经验。

 

认知性遍历认为用户完成一个任务的过程有三步:

  1. 用户在交互界面上寻找能帮助完成任务的行动方案。
  2. 用户选择并采用看起来最能帮助完成任务的行动。
  3. 用户评估系统作出的反馈,判断在完成任务上的进展。

 

评审人员可以对用户的每个交互过程模拟这三个步骤去评价,并以回答下列三个问题为基础:

  1. 界面上执行正确动作的控件(按钮、菜单、选项等)是否可见?
  2. 用户是否知道正确动作可以到达希望的结果?
  3. 根据系统对动作的反馈信息,用户是否能够知道他的动作是否正确?

比如用户去一家网上书店买一本数,第一个任务是找到这本书,用户要知道如何找到这本书。这时网站上的图书分类和查询系统可能会暗示用户如何完成交互。用户可以尝试从网站的图书分类里寻找,并根据具体的分类一步步地接近要找地那本书,这时候就要记录下用户是否能够方便地使用网站的分类系统;用户也可以使用网站的查询系统,并长时使用查询规则,系统是否支持方便的查询,以及在查询过程中及时地反馈信息都会影响用户交互任务的完成。

认知性遍历评估过程中记录的信息非常重要,每一个否定的回答都表示存在一个潜在的可用性问题,可以用于知道改进交互设计。

 

以上内容百分之九十不是我写的,都来自一个课件,详见文末参考资料。

我比较注意的是“专家评估快速并且便宜”这句话,对于我而言,快速并且便宜的评估最能实现最大的价值。如果一个进行比较小的软件的可用性评估,我个人也比较倾向使用专家评估法。如果能注意使用启发式评估法的各个要点,并进行详细分析,就可以发现很多的问题,根据我自身的经验,我们可以取得提高软件的可用性立竿见影的效果。认知性遍历方法需要有一定经验的人员对软件可用性进行评估,这对评估人员的经验和能力要求比较高。如果能够结合“认知性遍历”和“启发式评估”这两种方法定能发现软件的可用性的缺陷并提高软件的可用性。

 

参考资料:

其实本文的大部分资料来自:

http://wenku.baidu.com/view/ab600322192e45361066f54d.html

上的“主讲:刘婷婷 - 人机交互界面设计”PPT文档。(我实在找不到具体最终的来源)

这个人机交互界面设计的PPT做得非常不错,推荐。

没有评论: