科学新闻-人工智能视角下的机器人研究与发展 _365bet

作者：张钹来源：发布时间：2021-11-18 0:47:16

人工智能视角下的机器人研究与发展

人工智能和机器人的关系

近年来，人工智能的话题非常热门。不过，大多数人对人工智能存在误解，很多人认为人工智能是用机器来模拟人类的智能，实则不然。实际上，人工智能是用机器来模拟人类的智能行为。

模拟智能和模拟智能行为是完全不同的。比方说，我们没法模拟人类的情感，因为我们不知道怎么来定义快乐、痛苦等，因为当我们快乐和痛苦的时候，我们的大脑和心理发生了什么变化，到今天为止人们并不很清楚。在这种情况下，不能用机器来模拟人类的感情，而只能模拟感情的表现——即痛苦或高兴所表现出来的行为。

众所周知，情感主要从三个渠道表现出来：即脸部表情、语言（声音）和肢体动作。从人类的面部表情、发出的声音（语言）和做出的动作能够判定某人对某事的态度，这是情感分析。反过来，则称为情感生成。人工智能主要用机器来模拟人类的以下四个方面的智能行为：理性行为、感知、动作以及情感、灵感等。

有人可能会说，人工智能要模拟人类的这四个智能行为，这和机器人很相似。但人工智能和机器人是有显著区别的。机器人做的是机器，人工智能做的是智能体（intelligent agent），为什么用Agent来描述它，而不是用智能机器。这是因为人工智能不光要做机器，还包括软件、系统和零部件等。

那么该怎么定义机器人呢？现代机器人问世已有几十年，对其定义仁者见仁，智者见智，没有一个统一的意见。目前，对机器人的理解宽度很大，最低的只指可编程的机器，最高的则是指各种各样智能化的机器。在我看来，对机器人的定义是一个逐步发展的过程，主要包括三大部分：前端指感觉（传感器）或者感知，可能通常做不到感知，只能做到感觉，后端就是可控的操作器、效应器等等，中间的部分目前主要还是集中在控制、编程这些领域，智能成分会逐步增加。

从机器人和人工智能发展的整个进程来看，机器人和人工智能有很多重叠的地方，但机器人更加面向任务、面向应用。

现代机器人的研究始于20世纪中期。最早在二战后，美国阿贡国家能源实验室为了解决核污染机械操作问题，首先研制出遥控操作器用于处理放射性物质。紧接着于第二年，又开发出一种电气驱动的主从式机械手臂。

20世纪50年代中期，“可编程”“示教再现”机器人面世。1960年，第一台真正意义上的工业机器人由美国联合控制公司研制成功。随着传感技术和智能技术的发展，20世纪80年代开始进入智能机器人研究阶段。

经过近40多年的发展，机器人已从传统的工业制造领域迅速向医疗服务、教育服务、家庭服务、勘探勘测、生物工程、救灾救援、深空深海探测、智能交通、智能工厂等领域扩展。

扩大应用场景本身就是创新

机器人的诞生是人类高新技术革命的结晶，经过短短几十年的发展已取得了很大的进展，但对于人类的理想而言，这还仅仅是开始。

在各种类型的机器人中，应用于生产过程与环境的工业机器人较早得到大规模应用。作为各种机器人分类中较为成熟的板块，工业机器人应用已经渗透到几乎所有工业生产制造的场景中，包括：机器人码垛、冲压、注塑、分拣、焊接、激光切割、喷涂、机床上下料，另外结合视觉技术或机床，还能创造出更多的可能。

协作机器人近两年也开始在机器人市场崭露头角。其常见的应用场景包括拾取和放置、设备看护、包装码垛、加工作业、精加工作业、质量检测等。此外，它还被应用于加工作业、医疗外科手术、仓储物流、机器维护等其它非制造业和非传统的领域。

随着人工智能与物联网技术的不断发展，服务机器人在不断丰富自身功能及实现更强大性能的基础上成为当之无愧的后起之秀。新零售、智慧城市、智慧医疗、银行、智能安防、机器人STEM教育等应用场景遍地开花。

为了让机器人在更多场景落地应用，很多机器人行业已经开始探索AI、VR、5G等更广泛的技术融合。其实，想要为机器人选择一个好的应用场景并不容易。特别是对于制造传统机器人而言，不断扩大应用场景，本身就是一种创新。

如何突破从结构化到非结构化的环境

目前，机器人在某些领域应用比较普遍，比如无人机、水下机器人等。为什么机器人在这些领域能得到应用，而其它领域却比较困难？我认为，关键在于如何突破从结构化到非结构化的环境，这就需要人工智能。这里，我想通过几个例子来说明。

PUMA型机械臂是最早的多关节机器人，在20世纪70年代被推出，在20世纪80年代变成了工业机器人，并进入迅猛发展的阶段。如今，要把它推广到一个相对非结构化的环境。所谓机械臂的非结构化环境就是有人参与，能够与人交互，这样环境就变成非结构化了。

要想解决非结构化环境的问题，必须把感知和动作结合起来，也就是说要做的动作是把感知和动作连接起来。从事机器人研究的人对反馈的概念非常清楚，因为这里必须要用反馈，而人工智能缺少反馈的概念，所有从事计算机领域的研究人员都缺少这个概念，因为他们研究的对象都是开环的算法，所以我认为这是人工智能和机器人结合的非常重要的点，而且可以做好。

协作机器人可以柔顺控制，不会碰到周围的事物，一旦碰到会立刻降速，但协作机器人目前还未形成产业。就我国而言，在非结构化的环境下，发展协作机器人产业是一个巨大的考验，但当前有很大的市场需求，只有在有需求的情况下，才能找到应用场景。

过去我们也做过不少移动机器人，中国早期也是集中在研究越野，慢慢地越野的任务就转向军方和自动驾驶车辆。就目前而言，全世界都非常重视汽车的自动驾驶，汽车必然走向自动驾驶的道路。

目前自动驾驶主要是通过数据驱动的学习方法，学习不同场景下的图象分割，判别是车辆、行人还是道路等，基于此建立三维模型，在三维模型上规划行驶路径，但是自动驾驶的这种方案并不能解决复杂路况下的行驶问题。

自动驾驶最重要的就是感知部分，也就是说汽车必须可以感知周围的环境，主要是视觉传感器，包括多模态，用摄像机或者其它设备感知周围环境，这在人工智能看来就涉及深度学习。众所周知，采用浅层神经网络对标准图像库ImageNet进行图像识别，原来误识率是50%，但采用深度学习之后误识率降到3.57%，尽管误识别率降低了很多，但算法的脆弱性令人担忧。在很多情况下，基于深度学习的人工智能系统非常脆弱、容易受攻击和受欺骗，这就是计算机视觉算法的不安全性。如果这种不安全性不消除，很难想象在实际应用中会出多大的事故？

人工智能现有的方法只能处理结构化环境下的问题，而非结构化环境下的问题，人工智能的方法还有待提高，所以我们提出第三代人工智能就是要解决非结构环境下的有关问题。

早期，我们从事人工智能研究主要是靠知识、算法和算力，进入数据驱动时代以后，则主要靠的是数据、算法和算力，仅仅依靠数据、算法和算力做出来的系统总是存在不安全问题，怎么解决这种不安全问题？我们的办法就是发展第三代人工智能，其核心思想是全面利用知识、数据、算法和算力这四个要素。

自动驾驶从L2、L3、L4走到L5，必须要解决计算机视觉不安全性的问题，现在世界各国都在做这件事。有人说未来汽车是四个轮子上的超级计算机，换句话说，将来只要用很少的钱买车本身，而需要用大量的钱买车上的各种计算机设备。

我们现在是用大数据的方法对图像进行分割和识别，然后建模、规划，目前这些任务完全可以做到实时，这样车能不能就可以让计算机来开？我认为在复杂路况下还是不能开，因为计算机视觉是不可靠的。当一个系统中有人（在交通系统中，包括行人和汽车驾驶员）存在时，这个系统就会变成复杂的系统。由于在现实情况中，驾驶员和行人都存在有意无意地违反交通规则的情况，所以必须从实际情况出发去考虑这种问题。其实，解决这样的问题并不难。我们可以让计算机自动驾驶车，累计开几十万迈，从中暴露计算机中存在的错误，找到解决各种突发事件的办法，如同驾驶员在驾驶中积累经验一样，有了这些“经验”，就可以放心地让计算机单独驾驶了。

总之，当机器人往前发展的时候，与人工智能会有更多的交集，通过和人工智能的交叉融合，最后达到二者互利共赢的目的。■

（作者系365体育手机版：院士、清华大学人工智能研究院名誉院长，记者倪伟波整理）

《科学新闻》 (科学新闻2021年10月刊封面)

发E-mail给：

| 打印 | 评论 |