咨询热线:0755-89999869      政策热线 0755-26978111

Sora惊艳全球,对具身智能产业影响几何?

       春节期间,OpenAI团队突然抛出其首个文生视频模型Sora,可生成一分钟的高质量视频,瞬间引爆全行业对通用人工智能的再次讨论。
       “Sora意味着实现通用人工智能可能从10年缩短至1年。”360董事长周鸿祎第一时间表达了对Sora的看法。在他看来,Sora的轰动效果远超GPT,是人工智能重要的里程碑。“GPT解决了AGI第一阶段的问题,对语言、文字的完整理解,Sora在第二阶段取得突破,解决了机器和这个世界之间的互动问题。”
       南山所观察到,Sora影响的涟漪还在不断外溢,被认为是AI终极形态的具身智能产业十分兴奋。在大模型开发加速以及具身智能热潮的带动下,政策端和产业端都在迅速行动。

大模型加速开发利好具身智能产业

       英伟达创始人黄仁勋在ITF World 2023半导体大会上表示,AI下一个浪潮将是“具身智能”(Embodied AI)。按其描述,具身智能是一种新型人工智能,指一种具备自主决策和行动能力的机器智能,通过自主学习和适应性行为来完成任务。目前主要体现为机器人技术和自动驾驶汽车技术等。
实际上,具身智能并非新概念。1950年,“计算机科学之父”图灵就在论文《Computing Machinery and Intelligence》中提及具身智能涵义,但因当时技术还不足以支撑其发展而走入大众视野。直至今日, AI技术的突破以及关键零部件性价比的逐渐提升,具身智能热潮才重新被掀起。
       Sora的问世有望助力具身智能突破技术瓶颈。中银证券发布研究报告称,Sora通过观察大量数据学习世界的物理规律,最终有望构建可渲染真实物理世界的模型,搭载到机器人身上后,机器人认知能力有望大幅提升。
       中关村智友研究院院长王田苗阐述到,大模型出现后,具身智能相当于一个成长速度极快的孩子,能够通过人机交互,将宏观的任务分解为一系列思维链路和子任务,并利用自动编程,逐步自主地完成任务。期间,具身智能将逐渐学习和成长,同时在复杂环境下可以利用感知、视觉和触觉等功能来校准行为动作或控制模型的误差,以适应环境变化。
       相比于传统机器人每一项智能都需要人来定义和编程实现,具身智能则能够从环境交互中自主学习,并产生对客观世界的理解与改造,不再依赖人工进行的数据标注。
       面对如此产业机遇,主要国家及地区早已布局,将机器人产业发展上升至国家战略。美国政府于2011年推出了《国家机器人计划》,以“建立美国在下一代机器人技术及应用方面的领先地位”。日本政府于2015年公布了《机器人新战略》,提出“世界机器人创新基地”“世界第一的机器人应用国家”和“迈向世界领先的机器人新时代”三大核心目标。欧盟于2016年启动了《欧盟机器人研发计划》,旨在“保持机器人技术的领导地位,促进行业和供应链的建设”。
       国内政策也在加码推进具身智能领域的发展。2023年10月,工信部等部委一连抛出多份重磅文件,提出到2025年,人形机器人实现批量生产,2027年综合实力达到世界先进水平。
       产业端反应更为迅速。谷歌、特斯拉、英伟达、阿里、小米,国内外科技企业都在积极跟进相关产品和技术布局。英伟达发布多模态具身智能系统NvidiaVIMA,微软在探索如何将ChatGPT扩展到机器人领域,OpenAI投资了挪威人形机器人公司1X Technologies,谷歌依托谷歌大脑和DeepMind开发具身智能众多技术路线。
       国内科技企业也正在积极拥抱AI大模型。“国内人形机器人第一股”优必选对外发布人形机器人智能多模态交互系统,达闼科技专门推出了机器人多模态人工智能大模型RobotGPT,阿里千问大模型在实验接入工业机器人,广州高新兴机器人正在将大模型和巡逻机器人结合。

Sora为具型智能带来哪些产业机会?

       Sora的出现,让人们嗅到了通用人工智能进程的加速。
       越来越多的共识认为,Sora不仅是文本视频生成器,更是世界模拟器。就像Sora技术报告中提到的,“通过扩大视频生成模型的规模,我们有望构建出能够模拟物理世界的通用模拟器,这无疑是一条极具前景的发展道路”。
       北京市社会科学院数据资产化研究院执行院长王鹏表示,Sora的核心技术主要包括人工智能、大数据分析和云计算等。通过人工智能技术,Sora能够模拟人类的思维过程,实现对复杂问题的智能分析和解决。
       中欧中证全指软件开发指数拟任基金经理宋巍巍分析到,大模型对物理世界的模拟会对具身智能(机器人或智能系统)带来巨大的影响和突破。如自动驾驶能够通过感知器和执行器与其所处的环境进行实时互动,过去过度强调感知层面,尚未攻克认知层面,人工智能对真实世界的物理规律没有理解,可能未来一段时间内,自动驾驶领域有望出现较大的突破。在通用人工智能方面也是一样。
       浙商证券报告提到,具身智能或将是AI的终极形态,人形机器人是实现具身智能的最佳形态之一 。由于结构设计接近人体,人形机器人的活动场景可覆盖人类活动的方方面面,可应用于家庭、商用、工业等场景。以目前发展阶段来看,随着人口老龄化程度加深、成年单身人口数量持续增长,服务型需求场景是人形机器人的重要市场。
       种种迹象表明,Sora已具备对真实物理世界的理解能力,这是通用人工智能向前发展的里程碑,也是推动具身智能产业发展的巨大跃步。
       南山所认为,具身智能机器人是“新三大件”之一,未来有望带来万亿级别的空前蓝海,产业发展进度在ChatGPT、Sora等大模型加持下将大大加快,有望赋能千行百业、实现产业共振。
       道阻且艰,具身智能产业之路需上下求索。目前,具身智能产业链尚处于早期阶段,发展周期较长。具身感知和具身执行是关键环节,软硬件技术应用突破至关重要。除此之外,若要加快市场放量,成本是关键。机器人普及依赖于技术降本,如果成本下降幅度低于预期,可能导致市场放量较慢。若通用大模型技术发展不及预期、AIGC渗透率及应用场景受限,潜在市场规模也将无法释放。
       值得关注的是,产业的发展速度也依赖于产业链进度改善、巨头技术突破、新品发布和迭代、基础设施建设、政策落地等因素。同时,新技术的出现应伴随着伦理风险的考量,AI可能会生产的违反常规、违背法律和道德的内容和行为也值得警惕。
       面对人工智能通用大模型带来的发展机遇,我们在欣喜科技进步的同时,更要保持清醒的头脑,把握自身定位,抓住产业机遇。人工智能通用大模型的发展,为我国具身智能产业提供了强大的技术支持,但仍需看到与国际先进水平的差距。我们要在保持自身特色的基础上,积极学习借鉴国际先进经验,不断提升具身智能产业核心竞争力。