OpenAI又一个大动作,ChatGPT的终极形态是机器人?
随着多模态大模型快速迭代,近期包括OpenAI、微软、谷歌等在内的多家大厂都在关注GPT在机器人领域的应用,并在机器人规划、控制、导航等主要任务上进行探索。
近日,挪威人形机器人公司1X Technologies宣布在OpenAI领投的A2轮融资中筹集了2350万美元。
消息一出,便引发了外界对于GPT模型和机器人结合的无限遐想,其中一个景象便是,人形机器人管家从电影走入现实生活,它不仅能够帮助人类做家务,还可以理解人类的语言,识别人类的情绪,并做出真正智能化的回应。
事实上,除了OpenAI,此前多家大厂也纷纷“加码”类GPT机器人。
3月14日,商汤科技发布多模态多任务通用大模型“书生2.5”,可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。例如,在机器人领域,利用多模态多任务通用大模型辅助完成居家机器人场景中各类复杂任务,如洗衣服、倒垃圾、做饭等。
3月8日,微软发布论文《ChatGPT for Robotics:》研究项目,推动ChatGPT与机器人融合,开发出了一种实验性框架,能够用于多种机器人应用场景中,例如利用ChatGPT的语言能力来控制机器人和无人机,使其能够感知和理解物理世界,并执行各种任务。
3月8日,谷歌推出PaLM-E——横跨机器人、视觉-语言领域的通才模型。PaLM-E不仅可以理解图像,还能理解、生成语言,可以执行各种复杂的机器人指令而无需重新训练。谷歌研究人员计划探索PaLM-E在现实世界场景中的更多应用,例如家庭自动化或工业机器人。
机器人行业或迎来奇点时刻
开源证券表示,机器人是以ChatGPT为代表的人工智能最好的载体,ChatGPT在机器人领域的应用主要体现在自然语言交互和自动化决策两方面。
第一,ChatGPT作为一种预训练语言模型,可以被应用于机器人与人类之间的自然语言交互。机器人通过GPT来理解人类的自然语言指令,并根据指令进行相应的动作。
第二,GPT可以帮助机器人在执行路径规划、物体识别等任务时做出相应的决策。
其指出,人形机器人实现大规模商用的核心障碍之一就是AI技术仍待突破,而自然语言处理工具Chat GPT的出现,可以帮助机器人逐渐实现真正像人类一样交流、执行大量任务。
东方财富证券也表示,机器人商业化的核心突破点在于核心算法的升级带来的逻辑思维能力提升与高水平智能化的行为智慧决策能力。ChatGPT的出现首先可解决机器人的自主语音交互难题,完成上下文理解、多语种识别、多轮对话、情绪识别、模糊语义识别等技能,从而实现智能化、人性化的沟通与服务。
其认为,ChatGPT带来的革命性变化有助于机器人行业解决过去软件端算法和数据能力落后的难题,AI能力的注入将推动机器人行业迎来奇点时刻。
AI赋能这些机器人应用
申万宏源认为,机器人是人工智能和智能制造的交汇点。
中信证券指出,多模态大模型有望成为机器人“智能大脑”,其通过自然语言指令-多模态大模型-终端执行机构的工作原理,将提升机器人的智能化水平,人机交互能力与自主运动能力,加速机器人多场景规模化落地,如物流配送、流水线作业、服务机器人、导盲机器人等。
工业领域,利用多模态大模型对特定任务中的物体识别、机械臂控制进行学习,从而使得机械臂可以很好地完成分拣、装配等常规流水线任务,有望率先落地。
服务机器人方面,多模态大模型服务机器人将能够理解用户的语言指令,结合多模态数据感知,匹配语言指令做出规划和执行,完成清洁等任务,并且未来随着人机交互技术逐步成熟并且未来随着人机交互技术逐步成熟,机器人可具备听、说、理解与思考能力,并提供重要陪伴与娱乐功能,加速其规模化商用。
开源证券分析称,工业机器人是智能制造使用的核心数字化设备,人形机器人是有望与智能汽车人车协同,从而真正实现低成本完全自动驾驶的核心。
市场空间方面,申万宏源提到,2012-2021年中国工业机器人市场快速发展,市场销量10年扩增10倍,年复合增速30%,参考政策规划,其预计2025年国内市场规模达千亿。
人形机器人领域,人工智能应用落地,打开想象空间。特斯拉大力投入人形机器人开发,2022年10月推出Optimus,据特斯拉称未来3-5年有望量产,参考特斯拉电动汽车的历史销量来推测未来特斯拉人形机器人的发展进度,在乐观、中性、悲观假设之下,开源证券预计2030年特斯拉人形机器人的销量分别为200万台、100万台、20万台。
手术机器人,2020年全球手术机器人市场规模为83亿元,中国市场规模为4.3亿美元,占全球市场的5.1%,明显低于美国和欧盟市场,增长潜力巨大。开源证券称近年来政策层面利好逐步释放,2022年以来国内手术机器人接连获批上市,商业化元年有望开启。