谷歌教你,如何设计“以人为本”的人工智能系统
漫谈

谷歌教你,如何设计“以人为本”的人工智能系统

听起来像是“以用户为中心”的感觉

2017-07-12 14:46:26


近年来,人工智能技术已经逐渐渗透到我们日常生活中。现在一提到这个新兴技术,我们脑海中出现的不再只有那些高深的概念,还有着像苹果的 Siri、亚马逊的 Echo 这类人工智能“明星产品”。

虽然,现阶段人工智能技术还处于“孩提时代”——可以处理复杂问题或同时执行多任务的 AI 还未出现,但是受到横扫围棋棋坛的 AlphaGo 或者是科幻电影等等的影响,不少人对人工智能技术产生了一定的恐惧感:担心会被 AI 抢饭碗、害怕被 AI 支配……

位于 AI“先头部队”前列的谷歌对于这些“空穴来风”的担忧似乎颇为重视, 筹划了一项名为“PAIR”研究项目,旨在设计出“以人类为中心的机器学习(HCML)”系统 ,并以此“安抚”人们对人工智能的不安。

QQ截图20170712102639

“这个项目将专注于——研究和重新设计人与人工智能的交互方式,”谷歌方面表示,“我们会把‘以人为本’这个概念贯穿于构建机器学习系统的全过程。”简而言之就是,在开发机器学习系统时,不能忘记它是服务于人类的

近日,谷歌的用户体验以及人工智能团队,还列出了设计“以人为本”机器学习产品的七大注意事项:

1.不要指望机器学习系统自己找出问题,它只负责解决

1 1amLc8Z6dlYZRCBvA39Vng

在机器学习、人工智能炒得火热的当下,很多公司和产品团队在指定产品策略时大有“不管三七二十一先确定以机器学习作为解决方案”的意思。

如果这只是纯粹的技术探索没什么问题,或许还能激发出好的产品设计灵感;但放到产品设计上情况就不一样了——不从用户的需要出发,可能会出现这样的情况,建立了一个非常强大的系统来解决小问题或者根本不存在的问题。

所以说,那些情景调查、访谈、深入讨论、用户调查、日志分析等等用以挖掘用户潜在需求的工作通通不能简化,需要产品设计师自己完成,机器学习要做只是解决设计师定义的问题。

2.想一想,这个问题一定要用机器学习来解决吗

一旦确定了需要解决的问题或满足的需求,接下来就要评估机器学习是否能以独特的方式来解决这个问题。

1 URC8DMjzMCrWrzpjIddBVg忘了加附件的提示,就适合用机器学习了

虽然机器学习让产品更加“智能”和“个性化”,但是实际生活中并不是所有的问题都用得上机器学习。因此,在开发产品之前需要确定哪些用户体验需要机器学习、哪些功能用机器学习来实现可以得到意义的增强、哪些问题用不用都一样有时甚至是画蛇添足……

1 KwrGfG_0ivojLfbPsVMIZQ将产品或者功能放到四个象限中分析
(横轴代表机器学习带来的影响,纵轴对用户的影响)

花费几分钟思考一下这些问题,不仅能帮助开发者了解用户带着哪些预设去使用相关产品,还能帮助他们合理利用机器学习技术。

3.原型设计:在设计中测试,在测试中调试

原型设计是构建机器学习系统的关键环节。倘若产品的核心在于通过独特的数据来为用户定制个性化体验,短时间内开发者无法设计出具有真实感的原型;这种情况下如果等到机器学习系统构建完成之后再去测试它,想要修改就难了。

所以说,在设计原型的过程中,需要进行一定测试,以不断调试及完善系统。一般情况下,研究人员会使用——建立个人示例或者 Wizard of Oz 研究方法来实现这些目标。

其中,建立个人示例指的是,运用早期模型对用户进行测试,观察系统给出正确和错误响应时用户的反应。而 Wizard of Oz 则是在还没有制造出模型之前,让工作人员假装“机器”来向用户做出反馈。

1 doAy8yuUHlLo1JbO37jFNg

聊天界面是 Wizard of Oz 测试最简单的方法之一(Ps:另一端是一位假装“AI”的工作人员)

这些交互可以为产品设计提供关键的指导,因为当参与者与“AI”交互时,它们会自然形成系统的新模型并根据模型来调整自己的行为。

4.衡量假正类和假负类的权重

对于机器来说所有的错误都是一样的,但对人类却不然。

举个例子,有一个“人类 or 妖怪”分类器意外地把人识别为妖怪。从表面上看,这只是系统的一次失误,不涉及任何侮辱或者文化因素的考量;但是机器不会明白人被识别为妖怪带来的侵犯感远大于妖怪被错误识别为人。

1 -QR9WF1n7jkzn4t1u57NNw用户面对机器学习系统错误的四个状态

也就是说,开发者需要了解机器学习系统会犯什么错,并且衡量其是否会影响用户的产品体验。具体来说,就是在设计过程中有意识地在正确率以及召回率之间权衡——如果你认为囊括所有的正确答案更重要,那意味着包含更多的错误答案(优化召回率);不过你想让错误答案最小化,代价是舍弃一些正确的答案(优化准确率)。

例如,你在 Google Photos 中搜索操场,可能会看到如下的结果:

0 JA6ide7VGzj_l4FD

在这个案例中,召回率由于准确率,也就是找到所有含操场的照片更为重要,所以搜索结果中出现了一些非操场场景的儿童玩耍图。

5.阶段性优化是必要的

好的机器学习系统,应该随着用户的心智模型不断优化升级。

实际上,人与系统进行交互时,双方会相互影响——机器学习系统是根据现有数据集训练而成的,所以人类的输入会影响以及调整这个系统未来的输出;而这些调整反过来也将改变用户和系统给的交互方式……

1 whMp785sX1yFEpXz6TbJ1Q良性循环的例子:能不断优化并预测用户下一步的谷歌输入法 Gboard

不过,这些反馈循环过程既有良性的也有恶性的,所以在使用过程中开发者要适当地、有计划地进行相关干预。随着用户和用例的增加,开发者需要对系统的准确率以及召回率进行量化测量,以此评估机器学习系统的性能。此外,研究人员还需要考虑如何在产品的整个生命周期内获得用户的真实反馈,以改进机器学习系统,设计出更好、更快的交互反馈模式。

1 cD4Zc1XMRTDG6-oUMt7OdAGoogle App 隔断时间就会询问用户某个页卡是否有用

6.使用正确的标签,建立强大的训练数据集

“标签”是机器学习的重要组成部分。一个完全标记的数据集可以提高机器学习系统的训练效果,而错误的标签则会给产品带来巨大的负面影响。

拿识别猫来举例,研究人员需要查看大量的图片,然后打上是否有猫的标签。只有足够的照片被标记为“猫”或者“非猫”,才能形成一个用以训练模型识别猫的数据集。不过,这只是一个简单的例子,真正的挑战是让模型预测对用户来说非常主观的东西,比如是否对一篇文章感兴趣或者提供电子邮件的回复建议等等。

1 ZtUs_9crXZqBg9O_Nw-A9A

解决这些主观类问题,开发者需要从合理的假设开始,进行模拟、真实用户数据分析等等过程才能获取一个适用于大部分使用者的标记标准,建立起一个大规模的标签协议框架,进而生成一套强大的训练数据集。

7.扩展思维,发挥创意

1 D4Ykl-wS9nHpFY_ibnioGg

机器学习是一个具有创造力和表现力的工程,但是训练一个模型的速度较为缓慢,在没有最终成品之前,开发者需要靠自己的想象力来进行相关预测以及设想。而且,在设计产品之前不能规范太多,不然会在无意之中束缚了工程师的创造力。

不是为了炫技。也不是为了抢占风口,谷歌接下来要把人工智能看作一件物品去设计它

扫码关注粹客网微信公众号,每日推送更多精彩资讯,随时随地关注业界最新动态
关注人工智能/生物医疗/材料科学等领域,欢迎交流,微信:Lucy_Cheng_nsn

热门评论

Copyright © 2015-2016 粹客网 | 广州市彼利熊网络科技有限公司 (粤ICP备15096117号)