【行业资讯】一文解析机器人发展趋势，从自动化演进到自主化_行业快讯_新闻中心_

人工智慧开启了新一代机器人技术 Robotics 2.0，最大改变是从原先人工编写程式而来的自动化，迈向了真正的自主学习。本文将尝试揭开人工智慧（AI）应用的神秘面纱，协助读者瞭解 AI 机器人将如何影响我们的未来，并釐清我们常常听到，但却着墨不多、甚至根本尚未全然理解的主题。

本文为「Robotics 2.0」系列文章的第一篇，讲述机器人技术与 AI 对于各大产业和未来工作的影响。我们将讨论 AI 将如何释放机器人技术的潜力，这项新技术的挑战和机会，以及这一切将如何影响我们的生产力、就业状况、甚至日常生活。在人工智慧被大肆宣传的当下，我们希望透过这些文章鼓励更有建设性和全面性的探讨。

重新定义机器人：揭开次世代 AI 机器人 Robotics 2.0 的神秘面纱

提到机器人，我们总有各式各样天马行空的想像：从 Softbank（软银集团）的社交机器人 Pepper、能轻松后空翻的 Boston Dynamics 公司机器人 Atlas、《魔鬼终结者》（Terminator）系列电影的人造人杀手，到电视影集《西方极乐园》（West World）中随处可见、栩栩如生的拟真机器人角色。

我们常常听到两极化的观点；有些人倾向高估机器人模仿人类的能力，认为机器终将取代人类，有些人则对新研究和技术的潜力太过悲观。

在过去一年之中，许多创业、科技、新创业界的朋友都曾问过我，在 AI，尤其是深度强化学习和机器人技术的领域，究竟有哪些「实际」进展？

令人最为好奇的是：

AI 机器人和传统机器人有什么不一样？AI 机器人是否真有颠覆各大产业的潜力？它的能力和限制又是什么？

看来，想要瞭解现在的技术进步和产业格局，是出乎意料的困难，更不用说要对未来做出预测。藉由这篇文章，我尝试揭开人工智慧应用于机器的神秘面纱，釐清这个我们常常听到，但却着墨不多、或根本未全然理解的主题。

首先必须回答的基本问题：什么是 AI 机器人（AI-enabled Robotics）？它们又有什么独特之处？

机器人演进：从自动化到自主化

「机器学习解决了以往『对电脑困难，对人来说却容易』的各种问题，或以更容易理解的方式来说，就是解决了『人类很难让电脑也理解』的问题。」

— — Benedict Evans，安霍创投（a16z）

AI 所造就的机器人技术领域，最大成果是从原先的「自动化」（工程师藉由程式设计编写规则，让机器人遵守）迈向了真正的「自主学习」。

如果机器人只需要处理一件事情，那么，它到底有没有人工智慧，差别其实看不出来；但是，如果机器人需要处理各式各样的任务、或是回应人类与环境的变化，就需要一定程度的自主性才能胜任。

我们不妨借用下列不同等级的自驾车定义，一併解释机器人的演变：

Level 0 — 无自动化：由人类操作机器，没有机器人的参与。（机器人的普遍定义，是指有能力自行从事复杂动作的可程式化拟人机械）。

Level 1 — 单一自动化运作：单一功能已自动化，但不使用环境资讯。这是自动化与制造业中传统的机器人使用现况。透过程式编辑，机器人能够以高精度与速度重复执行特定工作；但直至目前为止，多数实际运用的机器人都无法感知或应变环境的变化。

Level 2 — 部分自动化：透过环境感知所输入的特定功能，协助机器进行决策。例如某些机器人透过视觉感应器，识别并应付不同的对象：然而，传统的电脑视觉，需要对每个对象进行预先登记和清楚的指示，且机器人还是缺乏处理变更、意外状况、或是新对象的能力。

Level 3 — 条件式自主：机器控制了所有的环境监控行为，但仍需要人为检查关注与（即时）介入。

Level 4 — 高度自主：在某些情况下、或是定义的区域内完全自主。

Level 5 — 完全自主：在任何状况下均可完全自主，不需人为介入。

我们现在处于哪一种自主等级呢？

现在，工厂里多数机器人都是透过开放式迴路、或是非回馈方式予以控制。这意味着它们的运作与感测器回馈各自独立、彼此互不影响（level 1）。

少数在工厂中的机器人，会根据感测器回馈而调整操作（level 2）；此外还有协作型机器人（cobot），他们的操做更加简单安全，因此能与人类共同作业。然而，相较于产业用机器人，这种机器人的精确度和速度却相形失色。另外，虽然协作型机器人的程式化相对简单，但它们仍然不具有自主学习性；每当工作内容或环境有所变动时，就需要由人类手动引导协作机器人进行调整，或是重新编写程式，机器本身无法自主举一反三，弹性应变。

深度学习（Deep Learning）和强化学习（Reinforcement Learning）能帮助机器人自主处理各种物件，将人类的介入程度降到最低。

我们已经开始看到一些使用 AI 机器人（level 3/4）的前导试行专案，例如「仓储拣货」就是一个很好的例子。在货运仓库中，员工需要根据客户需求，将数百万种不同的产品放入箱子里。传统的电脑视觉没办法处理如此广泛的物品类别，因为每个物品都需要事先登录、并针对机器人需要採取的动作，先进行程式设计。

然而，现在由于深度学习和强化学习技术，机器人能够开始自主学习处理各种物件，降低人类的介入程度。在机器人的学习过程中，可能会出现它未曾遇过的某些货品，而需要人类的协助或示范（level 3）。但是，随着机器人搜集更多的资料、从试验和错误中学习（level 4），演算法也将日益改善，迈向完全自主。

就像自驾汽车产业一样，机器人新创公司也採取了不同的策略：有些公司看好人类和机器人之间的合作，专注于 level 3 的研发；有些公司则相信，机器终将实现真正的完全自主，于是他们跳过 level 3，直接着眼于 level 4、甚至到 level 5。

这也是为什么我们很难评估现在产业自主程度的原因之一。

新创公司有可能自称致力于研究 level 3/4 的自主系统，但实际上却是大量委外，以人工远端操控机器。在无法了解其内部软体及 AI 产品发展程度的前提下，光从机器外观看不出远端操控和自主学习的差别。另一方面，目标为 level 4/5 的新创公司，万一无法在短时间取得理想结果，可能反而降低了客户的早期採用意愿、并导致早期阶段的资料搜集更加困难。

在本文的后半部分，我将进一步讨论新创公司的不同的商业策略思考。

AI 机器人的崛起：运用范围不再侷限于仓储管理

有趣的是，机器人的人工智慧应用潜能甚至高于无人车，因为机器人有各式各样的应用与产业，因此从某种意义上说，机器人理当比汽车更容易实现 level 4 目标。

AI 机器手臂开始在仓库中被採用，就是最好的例子。因为仓库属于「半受控」的环境，不确定性相对低。另外，拣货作业虽然关键、但能容许错误。

至于自主居家型或手术机器人，则要等到更遥远的未来才能实现；毕竟相关环境的变数更多，且有些任务具备不可逆性，以及一定程度的危险性。但是，可以预见的是，随着技术精度、准确性、可靠性的与时俱进，我们将看到更多产业採用 AI 机器人。

许多产业还没有使用机械手臂，主要原因在于传统机器人和电脑视觉的限制。

目前世界上只有大约 300 万台机器手臂，其中大多数从事搬运、焊接、装配等任务。到目前为止，除了汽车业和电子业以外，仓储、农业和其他产业，几乎都还没有开始使用机械手臂；主要原因，就在于上述传统机器人和电脑视觉的限制。

在接下来的几十年中，随着深度学习（DL）、强化学习（RL）、以及云端技术释放出的机器人潜力，我们将看到新一代机器人带来的爆炸式增长、并改变产业格局。其中，AI 机器人的成长契机有哪些？新创公司和现有业者，又採取了哪些不同的方法和商业模式，来因应新科技带来的变化？

新世代 AI 机器人新创公司产业概况

接下来，我会介绍不同市场区隔中的几间范例公司。这样的概略介绍，当然无法涵盖所有企业的状况；欢迎你提供其他公司及应用案例，一起让内容更加完备。

AI/Robotics 新创公司市场概况

研究新世代机器人新创产业结构，可以看到两种截然不同的商业模式：垂直应用与水平应用。

1. 垂直应用

第一种是垂直应用：硅谷当地多数的新创公司，专注于为特定的垂直市场开发解决方案；如电子商务物流、制造业、农业等等。

这种提供完整解决方案的作法相当合理，毕竟相关技术还处于萌芽阶段；公司不依赖他人提供关键模组或元件，而是建构端对端的解决方案。这种垂直整合的解决方案能更快进入市场，也能确保公司更全面掌握终端使用者的案例与效能表现。

但是，要找到像「仓库分拣」这样相对容易实现的应用案例，则没有那么容易。仓库拣货是相对简单的工作，客户的投资意愿与技术可行性都较高，而且每个仓库几乎都有相同的拣货需求。

但在其他产业（如制造业）中，装配任务可能因工厂而各不相同；另外，在制造业中执行的任务，也需要更高的精度和速度，技术上相对困难。

目前具有学习能力的机器人，仍无法达到与封闭迴路机器人相同的精度。

尽管机器学习能让机器人与时俱进，但目前透过机器学习运作的机器人，仍无法达到与封闭迴路机器人相同的精度，因为它需要累积尝试错误的经验，从错误中学习，逐渐进步。

这点说明了为什么 Mujin 和 CapSen 机器人这样的新创公司，并未採用深度强化学习，反而选择使用传统电脑视觉。

然而，传统电脑视觉要求每个物件都要事先登录，终究还是缺乏扩充和适应变化的能力。一旦深度强化学习（DRL）达到了效能门槛、逐步成为产业主流，这种传统方法终究会变得无用武之地。

此外，这些新创公司的另一个问题，在于它们的价值往往遭到高估。我们经常看到，新创公司在硅谷筹集了数千万美元资金，却无法承诺创造出任何真正具体的收入流。

对于创业者来说，「描绘」深度强化学习的美好未来，再容易也不过了；但现实则是，我们还需要数年的时间才能达到如此的成果。尽管这些公司离创造获利还有一段距离，硅谷的创投仍愿意继续押宝在这些人才优秀、技术先进的团队上。

2. 水平应用

另一方面，水平应用则是更实用、却比较罕见的模式。我们可以简单将机器人技术简化为感测（输入）、处理、驱动（输出）三个部分；除此之外，还有开发工具。（这里使用的「处理」一词，同时概略涵盖了控制器、机器学习、作业系统和机器人模组等等，各种不属于感测或驱动的其他项目。）

我认为未来，这个领域将最具增长潜力。对于机器人的用户来说，破碎而零细的市场是棘手的问题；因为所有的机器人制造商，都各自推展自家开发的语言和介面，使得系统整合商与终端使用者，都很难将机器人与相关系统进行整合。

随着产业的逐渐成熟，有越来越多机器人应用到了汽车和电子厂以外的领域；因此我们更加需要标准的作业系统、通讯协定、介面，从而提高效率、并缩短上市时间。

举例来说，美国波士顿的几家新创公司正在研究相关的模组；例如 Veo Robotics 公司开发的安全模组，能让工业机器人更安全地和人类协同工作；Realtime Robotics 公司则提供加速了机械手臂路径的解决方案。