高瓴种子|「灵初智能」完成天使轮融资,强化学习开启具身智能初纪元,高瓴创投领投

今日,灵初智能宣布完成天使轮融资,高瓴创投(GL Ventures)、蓝驰创投(Lanchi Ventures)领投。本轮融资完成后,灵初智能将继续推进基于强化学习算法的机器人技能集训练、场景化的数据生成及采集、端到端解决方案的研发及落地,打造业界领先的通用灵巧操作智能体。灵初智能创始人王启斌博士在手机、智能音箱、机器人领域有近20年的成功操盘经验,多次实现产品从定义、开发、到上市、再到全球化0-1-N的产业闭环,是一名深谙机器人商业化落地的“老兵”;联合创始人柴晓杰博士,在机器人及无人驾驶领域从业15年,擅长算法、仿真、工程、全栈技术,有L4产品落地的数据闭环经验,是量产经验丰富的研发专家。高瓴创投(GL Ventures)项目负责人表示:“作为人工智能与现实世界的深度结合,具身智能行业前景广阔,且拥有引发各行各业深刻变革的巨大潜力。灵初智能凭借在强化学习和模仿学习方面的技术深耕和积累,在实现机器人灵巧性、泛化性和高成功率的‘不可达三角’挑战上已取得显著进展;创始团队汇聚多领域顶尖人才,不仅有卓越的技术背景,还兼备强大的工程化能力以及深厚的商业化实战经验。我们相信,在创始人王启斌博士带领下,灵初智能能够为行业带来革命性的应用与高效率的解决方案,实现技术突破与商业价值的共赢。”

Aseed+高瓴种子计划是高瓴单独设立的种子投资序列,计划用3年时间投资100家左右种子期企业。除投资外,Aseed+还会为早期初创企业提供创新平台支持、产学顾问、产业资源对接、融资服务等在内的高瓴种子共创服务。灵初智能被称为“科学家密度最高”的具身智能公司:

公司与北京大学成立北大-灵初智能具身灵巧操作联合实验室,由人工智能研究院杨耀东博士担任首席科学家开展横向课题合作。杨耀东博士是强化学习领域的知名青年学者,博士毕业于现代深度强化学习的发源地UCL(伦敦大学学院)。杨耀东课题组在强化学习领域已有系列重要成果,包括带领华人团队研发多体强化学习算法首登Nature机器智能子刊、获得NeurIPS 2022具身灵巧操作冠军等。

同时,北大-灵初联合实验室将和梁一韬博士就具身智能体长程任务规划开展课题合作,梁一韬长期致力于如何将知识注入机器学习中以提高其性能和泛化性,在开放环境MineCraft中取得系列重要成果。他利用LLM实现复杂任务的拆解和规划,让大模型“缸中之脑“长出手脚,在具身场景中自主行动。

在灵初北大联合实验室之外,公司联合创始人陈源培是一名痴迷机器人的00后天才少年,作为斯坦福访问学者,陈源培师从Karen Liu和李飞飞教授,曾在全球首次实现利用强化学习在真实世界同时控制双臂、双手多技能操作。此外,来自上海交大人工智能学院的温颖副教授也是技术团队关键成员,其课题组曾推出多模态决策大模型DB1,实现了对DeepMind通才决策Gato模型的超越,并引入了与现实世界相关的百余个场景任务,为实际业务需求提供了有力工具。由产品老兵带队,携手密度最高的科学家团队,灵初智能组成了7890六边形战队——团队跨越了70、80、90、00的年龄梯度,是一支有技术、懂产品、能落地的全能团队,就像他们擅长基于强化学习(RL)的具身智能类人操作一样,具有更领先的技术,更大的商业潜力,和更强的战斗力。

高泛化性、高灵巧性和高成功率是具身智能的 “不可达三角”。高泛化性指机器人在变化环境对不同物体执行复杂任务,高灵巧性体现在执行任务的精确灵活(如搭乐高、双手操作等),高成功率即机器人受干扰时稳定正确执行任务(产品验证阶段成功率 95%、规模化落地高于 99.9%)。兼顾这三者极具挑战,高泛化性需通用模型和注重数据多样性的学习算法,高灵巧性需要精细模型和关注精度细节的学习算法及特定控制算法,鲁棒性也对控制算法有要求。强化学习是提升具身智能体这三方面性能的核心技术,能让智能体在仿真环境利用低成本合成数据训练,实现自主探索、试错学习最优解,提升灵巧性甚至超越人类上限,还能增强鲁棒性。

灵初智能早期一直深耕基于强化学习的全栈能力,从灵巧操作入手在具身智能领域积累技术壁垒,后将扩展至通用泛化操作。其开发的分层端到端模型领先业界,包含Psi – P0 规划模型和Psi – C0 控制模型。Psi – P0 借助大模型交互推理理解行为对环境影响,拆解复杂任务以实现任务泛化;Psi – C0模型为陈源培提出的双层架构,结合人类运动数据和深度强化学习,上层用人类数据训练参考轨迹生成器,下层用其生成轨迹指导强化学习训练,解决泛化性和灵巧性难题,这也是世界首次利用强化学习在现实中控制双臂双手多技能操作。

Psi-C0控制模型支持多个技能串联作业的训练难题。陈源培与斯坦福大学共同提出的Sequential Dexterity通过串联多个灵巧操作策略来完成长程的任务。在真实世界的搭积木任务中,能将翻找、重定向、抓取和插入积木4个skill串联起来提高整体的成功率。这也是世界上第一个基于强化学习实现了灵巧操作的长程任务,显示了多技能组合的泛化性。,时长00:28

Sequential Dexterity通过串联多个灵巧操作策略来完成长程的任务

梁一韬博士开发的Psi-P0实现开放环境中复杂任务的任务拆解和规划。其所支持的任务复杂度和准确度都超越同期OpenAI(VPT)和Nvidia的工作(Minedojo)。如下面视频所示,我们可以进一步通过构建memory使具身模型具有lifelong learning,即根据自身经历自我提升的能力。,时长00:20

   在开放世界用不同工具进行类人的探索、建造和对抗

在产品规划上,灵初智能将从2B服务业切入,以头部客户的高价值场景需求为指引,开发整合技能集,实现商业落地,并快速迭代硬件,算法,数据系统,不断提升具身智能整体解决方案的泛化性,灵巧性和成功率,给出具身领域“不可达三角”的最优解。

灵初智能创始人兼CEO王启斌表示:“非常感谢投资人的鼎力支持。我们这支集合工业界老兵和高密度科学家的战队,拥有完整的技术栈,将在具身智能的前沿打造软硬一体的综合解决方案,拓展在先进制造,商超物流及2B服务业等场景中的应用场景,快速实现数据闭环,商业化落地。在具身智能赛道的初纪元,期待和我们的合作伙伴灵性成长,共同开创智能未来。”

给TA打赏
共{{data.count}}人
人已打赏
科技

大数据、机器学习与量化投资

2024-10-10 22:51:51

科技

国际领先!腾讯CSIG获CSIG科技进步一等奖:头发丝1/50粗细缺陷都能发现

2024-12-1 13:22:13

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索