【迈向云端 加速落地】英特尔中国研究院院长宋继强深度解读:机器人4.0应该怎么走?
2019年将是5G元年,也将是5G竞争真正开始的一年。那作为硬科技代表的机器人行业要怎么利用5G这个技术红利加速服务机器人的落地?在2019中国机器人产业发展论坛主论坛上,英特尔中国研究院院长宋继强就此做了深度剖析,带来“迈向云端融合的服务机器人4.0时代”的精彩演讲。
宋继强院长从IT的背景切入到机器人领域,他认为AI、5G通讯、计算的模式等都有对机器人领域潜在巨大的贡献和可能性。(以下内容由英特尔中国研究院院长宋继强现场速记整理)
什么是4.0时代?
首先,宋继强院长分析了什么是4.0。在2017年的时候,IDC国际数据集团和英特尔一起做了一个关于机器人3.0时代的白皮书,里面把机器人的发展分成了三个时代:第一个时代是电气化时代,主要让机器人做固定自动化编程的事情。这个时候的机器人没有什么感知能力。到了2.0时代有很多传感器可以放进来,数字化是它的红利,促进了自动化生产流程的发展。第三个阶段就是2015年开始,得益于2012年开始的深度学习的大发展,可以让识别技术更便宜可用。这个阶段促进了语音交互和视觉作为输入,进而利用这些技术让智能服务机器人具备了对环境的感知能力和一定的由简单感知触发的操作能力。
工业机器人从全球范围来看一直处于持续上升的趋势,而服务机器人从2015年才开始快速增长。到2018年以后,它的增长速度开始变缓。我们看出,当人工智能开始便宜可用的时候,服务机器人开始快速增长,同时也产生了一些市场效益。但是,基于深度学习的AI带来的语音和视觉识别红利已经逐渐消耗得差不多了,后面要怎么办?
我们预计2015年到2020年是3.0的时代,那2020年以后怎么办?如果我们想进入到下一个级别要解决什么样的问题?
我们先看看现在的3.0时代,我们解决了一些什么问题?那就是让机器人拥有了感知能力,机器人用视觉识别人脸、语音交互等。但认知能力还比较薄弱,它没有记忆,没有对场景的理解,缺乏知识。AI本身的能力目前也是受限的,比如它受到攻击怎么办?数据的安全,还有物理安全怎么办?这都是需要解决的问题。所以对AI不能光利用它感知的一个层面,要用它的高级能力来提升服务机器人的个性化自然交互能力。
5G能促进服务机器人真正规模化部署
如果套用互联网的三级火箭发展模式,第一阶段要有一个好的场景,可以吸引很多人来用,把用户基础扩大;第二阶段,做这件事情的能力一定要达到预期;
第三阶段,规模化,才能商业化,从而降低成本。
有人会说,现在的机器人很多已经跟云连上,在利用通讯网络远程管理、解决问题。但此时解决问题主要是局部感知,很多时候看不到周边的情况,它的AI能力也是有限的,需要远程的人对它进行支持,这个其实是不够的。
因为我们看到现在机器人很多是做简单识别,或者说受限语音的功能库。如何让它达到一个从感知到理解再到决策的闭环?这个机器人的大脑怎么样让它运转的更好?这个脑到底放在哪里?要放多大?它在设备和云之间怎么放?只有一个大脑在中国北京的数据中心?还是分布式大脑?这中间什么样的关系?这中间都需要融合。以现有的模式还不能满足要求。
拿一个关键场景养老来说,它要求机器人能够自主移动、观测场景、了解人、对人有个性化的交互和服务、又是大规模的用户基础。养老问题在未来30年一定会爆发出来,这一定要靠科技,靠智能家居去组合机器人,组合其他技术去完成。
如果想让机器人真的服务于大规模的场景,缺的就是4.0里面要解决的问题,就是对前端和云端的一个很好的组合连接,并且让它能够规模化部署。这个组合连接在于怎么把要完成任务的记忆场景的知识和常识很好的组合起来,所以需要把云端的大脑分布在从云到端的各个地方,充分利用边缘计算去提供更高性价比的服务。这些恰恰是5G带来的红利。
5G通讯在中国已经开始在实验做组网了。做服务机器人产业的要知道这件事情的发生,思考怎么更好的利用5G带来的红利,去加快系统能力的升级,把云和端更好的组合起来。
所以服务机器人4.0可以这样划分:1.0是自动化的时代、2.0是数字化、3.0智能协作、4.0自主的服务。在某些特定的情况下它需要远程做一些决策辅助,但是它90%,甚至95%的情况是可以自己做事情的。
服务机器人4.0时代关键技术
在3.0时代,服务机器人就可以做到一些物体识别、人脸识别,但是4.0需要加上一个自适应,为什么要自适应?比如用深度学习做物体识别、人脸识别的时候需要很多的数据来源。但是真正到家庭场景的物体识别,没有那么多数据,所以必须通过少量数据去建立识别能力,自己去找到不同的位置,不同的角度做训练,这是一个底层的基础。
这些就是4.0要做的,首先对三维环境语义的理解,要知道它是什么,同时要把它往上升,把看到的这些信息变成知识,这样存储就变得更加合理,而且可搜索,可查询,可关联,也可推理。那么应用层就可以根据这个知识和观测到到现场场景做很多智能的提醒,去寻找一些物品,进行行为检测。比如老人要出门,机器人的知识库告诉他,今天预报要下雨,但是检测到老人没有带伞,然后查询伞的位置,机器人就可以把伞送到老人手里。这都是结合内部知识和外部的一些情况做的决策。
知识图谱在整个学术界和工业界越来越受到重视。获得图灵奖的杰夫∙辛顿教授在加入谷歌的时候就说要建一个知识图谱给全世界用,我相信这里肯定包含不了中国,中国的知识图谱不是老外可以建立起来的。阿里研究院发布2019年的十大技术趋势里面也专门提到了知识图谱的重要性。这是人工智能迈向下一个阶段的必由之路,也是必做之事。
面向服务机器人4.0的HERO系统平台
全部人类知识包括两部分,稳定的知识和动态知识。
稳定知识是什么?就是固定下来,大家都知道的常识性知识。比如说天要下雨了要带雨伞,这是一个确定的知识。而某些领域知识,比如在音乐、美术、饮食、餐饮方面的知识也是稳定的。
动态知识是指什么?比如卖一个机器人到家里,在没进去之前根本不知道家里的场景地图,这些是要逐渐建立的。还有群体性知识,老人、女性、男性,男性还得分小学生、中学生。机器人要来处理不同群体的知识。
不同的建立知识图谱的方法都是可以在系统里使用的。个性化知识图谱可以分布在从终端到云端,中间加一个边缘。
英特尔中国研究院目前在做的面向服务机器人4.0的HERO系统平台,最下面是一个计算平台,上面是软件层,3.0有3.0的一层,包括一些运动导航、规划、操作。4.0更多的是怎么去做自适应的交互,做三维场景的语音理解和个性化的知识图谱。
除此之外,安全也非常重要,当我们在用户的家里搜集很多的信息,包括视觉数据、空间数据等,用户不希望这些数据都上传到云端大脑,其实也没有必要。我们就可以在边缘或者设备本身对这些数据做保障。
在机器人本体方面要保证某些重要的隐私或者物理安全相关的程序和代码安全,网络侧、边缘端就是对用户的数据做好保护,被授权的人才能看到,有些数据不会上传到云端上面去,到云端需要通过一些安全存储鉴别。
在这个HERO的平台上可以把空间智能快速提升,比如说做一个建立场景的三维图,如果用开源的软件去做速度比较慢,现在加速了算法以后非常的流畅。
最后还是期望能够共同的和产业里的各种伙伴一起把云端深度融合的事情做好,真正把机器人能够推到规模化发展,真正进入现实场景为大家服务。