坑,坑,坑
#这是个悲伤的故事——期望值令人叹气 ——回顾文献确认试验方法 小规模的原型测试通常让用户进行某些简单的操作从而在两个版本中进行选择。虽然能进行测试的内容很少,但是也同样有着一定的前提。研究者最好意识到这些前提:如原型测试虽然看似测试用户偏好,但是测试的流程可能涉及到用户进行学习以及迁移学习经验的过程(比如识别版式,记认icon)。要解决这些问题,最好根据实际情况合理的安排参与者如何使用原型以及适当模仿类似研究的思路进行研究设计。 ——样本缺陷与描述性统计 简单的原型测试的样本选取过程通常都是有缺陷的,通常都无法代表总体。这某种程度上是一个好消息,因为研究者就此不必进行某些复杂的推断性统计——因为违背了推断统计需要的前提(其实多半情况下人数都不够= = )。 ——原型本身的缺陷 既然作为原型而不是正式的软件、网页,所以必然有着很多局限性——比如原型只能模拟有限的效果和操作(axure不支持双击);比如原型的制作需要一定时间;再如复杂的原型其实和代码一样可能有各种逻辑需要处理也需要慢慢debug。 ——我们究竟需要什么 在研究之前,就应该清楚的意识到数据本身的意义,也应该尽可能思考更多的衡量角度。比如用户所需要时间少就能发现某个功能,那么这样意味着这是一种好设计吗?设计的好坏在很大程度上取决于某种整体性的需求(或者说是概率),数据的处理本身也必须根据这种需求以及情景量身订造。不讨论业务特性和业务需求只看简单的数据计算,最终得出的数据结果不能导向好的结果。 #这是个麻烦的故事——原型制作到小规模测验 ——无数被迭代掉的版本 进行正式的原型测试之前,通常会有无数个原型图以及好几个基于原型图的高保真版本。无论是正式上线的ab test还是原型测试,所能使用的测试原型数量都有限。这就意味着,如果在最初的原型方案就筛选掉更有潜力的版本或是最终高保真阶段的选择不当可能导致整个原型测试的努力都被浪费。同时,原型测试中所使用的版本,最好是确定在此后不会有太多变动的版本。如果该设计如果其后会因为先前没有充分考虑的因素(比如要处理某些消息和状态,再如一些常见的一场状况),那么必然导致最终版本的设计必须进行一定的修改。这些修改可能会让用户偏好该版本的原因烟消云散,原型测试的结果沦为鸡肋。 ——原型制作需要与实验过