深入 机器学习 的黑箱

探索人工智能如何改变我们的生活、工作与设计方式

数据时代

每天我们都会产生大量数据——以TB为单位。在过去一个月、一周甚至一小时内,你可能写了邮件、发了照片、发了短信、看了流媒体视频、佩戴了运动追踪器,或者经过了交通摄像头。我们在生活中留下的是大量非结构化数据——即没有像电子表格或表格那样组织成有序集合的数据。

学者称,多达95%的数据是非结构化的。机器学习(ML)使计算机能够从所有这些非结构化数据中获取意义。就在你阅读本文时,计算机正在筛选和分类你的数据轨迹——无论是非结构化的还是结构化的——深入了解你的身份和行为动机。

机器学习 (ML)

使用算法从数据中识别模式,然后在没有明确编程的情况下对世界做出预测或判断的过程。

非结构化数据

处于原生格式的数据,没有预定义的数据模型,也没有以预定方式组织。

结构化数据

遵循标准化格式的有组织的数据。

机器学习计算能力增长

芯片设计、网络架构和基于云的资源方面的创新使可用计算总量每年增长十倍——截至2018年,它比2012年增长了30万倍。

如今,计算机对世界的理解更接近人类。当我进入一个房间时,我不会通过电子表格来了解这个房间。相反,我使用我的感官。我分析图像、声音、空间和运动。我获取这些信息,并根据发现做出决定。

将传感器(加速度计、气压计、陀螺仪、接近传感器、心率监测器、虹膜扫描仪、环境光传感器、化学和微生物传感器、电子鼻)和其他输入设备(相机、麦克风、触摸屏)与机器学习相结合,将每条非结构化数据轨迹转化为丰富的、有价值的组织化数据资源。

算法的冲击

但这种神秘的机器学习到底是如何工作的?昨天我查看了电子邮件,在网上搜索了一位高中老同学,使用Waze穿越城镇(并提示我哪里有警察),查看了我的Instagram动态,向Amazon Echo询问了天气,并收到了信用卡的欺诈检测警报。这些活动中哪些涉及机器学习?全部都是。每一次交互都有预测的参与。

传统编程

传统编程要求开发人员输入基于逻辑的明确指令(代码),以在软件系统中产生行为。

输入:明确的指令和规则
处理:按照预设逻辑执行
输出:基于输入规则的结果

机器学习算法

相比之下,机器学习使计算机能够观察和分析物理或数字世界中发生的行为,然后生成代码来解释它。

输入:示例数据和结果
处理:识别模式并创建模型
输出:可应用于新数据的预测

什么是机器学习?

简单来说,机器学习由算法组成——本质上是一组面向任务的数学指令——它们使用统计模型分析现有数据中的模式,然后基于结果做出预测。它们使用数据来计算可能的结果。我们可以将这些算法视为"预测机器"。

例如,这些算法可能预测你可能购买的荞麦枕头或你接下来会 binge-watch 的 Netflix 剧集。它们可能预测 Uber 的到达时间,或者一封电子邮件是否是垃圾邮件(以及你是否会打开它)。它们可能预测一张脸的身份,甚至是 Tinder 上会吸引你的个人资料。

数据的重要性

这些预测的魔力在于学习。机器学习算法不仅分析历史数据,而且一旦经过训练,还能对新数据做出预测。例如,电子邮件平台可能采用机器学习来检测垃圾邮件。经过训练的算法将能够侦查一封电子邮件是否应该直接进入垃圾邮件文件夹,不仅在原始训练数据集里,而且在进入系统的新数据(新电子邮件)中也是如此。

同样,机器学习算法需要大量的训练数据才能获得高准确率的预测。让我们暂时回到人类的角度来考虑这一点。为了理解世界,人类观察并与环境互动。我们 earlier 指出,这通常通过非结构化数据发生——运动、声音、图像等。我们遇到的数据范围越广,我们的理解就越复杂。

机器学习的应用

当与有趣的数据集和强大的愿景相结合时,机器学习算法可能具有相当的变革性。艺术家/活动家 Mimi Ọnụọha 和 Diana J. Nucera(又名 Mother Cyborg)在他们的 zine《A People's Guide to AI》中将这种技术比作盐——本身不太有趣,但一旦加入食物中,"它可以改变整餐饭"。

Stitch Fix 算法推荐系统

Stitch Fix 推荐系统

Stitch Fix 通过交互式故事讲述,可视化其使用丰富数据来匹配客户与衣服、鞋子和配饰。该公司将算法决策与人类技能——直觉、理解背景和建立关系——相结合,使购物变得个性化。

零售 个性化推荐
Seeing AI 应用

Seeing AI

这款由微软创建的人工智能应用程序讲述它在物理世界中"看到"的内容,以帮助视障人士。该工具可以读取短文本,包括印刷标志和海报,读取货币,查找和读取条形码以识别产品,甚至描述周围世界中发生的动作。

辅助技术 计算机视觉
预测性维护应用

预测性维护应用

北卡罗来纳州立大学的平面设计研究生与一家汽车零部件公司合作,原型设计了一个智能系统,以预测每个客户的汽车维护需求。车辆识别系统识别商店停车场中的客户车辆后,生成的应用程序会自动生成建议。

汽车行业 预测分析
Woebot 心理健康聊天机器人

Woebot 心理健康助手

由斯坦福大学训练的临床研究心理学家 Alison Darcy 创立的 Woebot Health 使个人能够通过这个聊天机器人获得心理健康服务。该机器人使用认知行为疗法(CBT)作为治疗框架,通过简短对话帮助人们应对生活挑战。

医疗健康 自然语言处理

机器学习核心能力

推荐系统

分析行为和上下文数据,推荐产品、服务或行为,如亚马逊产品推荐、TikTok视频推荐等。

信息过滤

过滤信息以减少噪音,如搜索引擎结果优化、垃圾邮件检测,同时根据用户偏好不断学习。

预测分析

预测未来结果,如疾病诊断、设备故障预测、用户行为预测等,提前采取相应措施。

机器学习应用领域分布

设计师与机器学习

机器学习需要设计师。我们以人为本的方法阐述了与更广泛社会相关的人类需求和愿望。如今,数据可用性往往推动机器学习的应用,而非人类需求。与设计师不同,数据科学家受过训练,从手头的数据中寻找可以准确确定的东西。

设计师 vs 数据科学家

设计师

设计师从审查客人的偏好开始。有任何过敏吗?有素食者吗?他们会有多饿?他们渴望什么?设计师只有在选择了合适的餐后,才会考虑必要的食材和方法。

受过训练以寻求理想的未来或"设计的'正确事物'"

数据科学家

数据科学家通过首先评估可用的食材来确定最佳膳食。什么是新鲜的、当季的?什么是负担得起的?什么是方便的?

受过训练以从手头的数据中寻找可以准确确定的东西

预期设计 (Anticipatory Design)

预期设计是一种用户体验(UX)模式,可预测用户行为并抢先做出响应。本质上,预期设计减少或消除用户选择,以提高便利性和相关性。

预期设计的特点

无需直接用户输入,系统主动预测需求

减少认知负荷,简化用户决策过程

随着时间推移学习用户偏好,提高准确性

创造无缝、个性化的用户体验

"如果您想让设备做一些智能的事情,您有两个选择:您可以对其进行编程,或者它可以学习。人们当然不是被编程的,所以我们必须学习。这一定是正确的方法。"
— Geoffrey Hinton, Google

设计师的机器学习工具

设计师难以使用像机器学习这样无形的技术进行"草图绘制"。正如 van Allen 所说,"如果我们不能作为设计师用人工智能进行草图绘制,就像我们的右臂被切断了一样。我们必须能够随意摆弄它。"

Delft AI Toolkit

交互设计教授 Philip van Allen 创建了这个无代码编程环境,使设计师能够轻松使用机器学习。设计师最初可以使用该工具在 Unity 中模拟 3D 人工智能系统。

无代码环境

机器学习作为设计材料

将机器学习视为一种设计材料,专注于其能力而非技术工作原理。就像设计师了解纸板的特性一样,设计师需要了解机器学习的"纹理"。

材料化思考