断交OpenAI后人形机器人独角兽首秀:一个神经网络控制整个上身能听懂人话可抓万
从官方放出的演示中可以看到,它在接收到人类的提示后,就会按照指令逐一拿起桌上的物品放进冰箱。
整个上身控制,Helix是首个能对整个上身(包括手腕、躯干、头部和各个手指)进行高速率(200Hz)连续控制的VLA。
多机器人协作,第一个同时在两个机器人上运行的 VLA,使它们能够使用从未见过的物品解决共享的、远程操作任务。
拿起任何东西,只需按照自然语言提示,就能拿起几乎任何小型家居物品,包括数千种它们从未遇到过的物品。
一个神经网络,与之前的方法不同,Helix 使用一组神经网络权重来学习所有行为(挑选和放置物品、使用抽屉和冰箱以及跨机器人交互),而无需任何针对特定任务的微调。
系统2:VLM主干,基于在互联网规模数据上预训练的7B开源VLM,它将单目机器人图像和机器人状态信息(包括手腕姿势和手指位置)投射到视觉语言嵌入空间后进行处理。
系统1:80M参数的交叉注意力Transformer,用于处理底层控制。它依靠一个完全卷积、多尺度的视觉骨干网进行视觉处理,该骨干网由完全在模拟中完成的预训练初始化而成。
将 S2 生成的潜在语义表征转化为精确的连续机器人动作,包括所需的手腕姿势、手指弯曲和外展控制,以及躯干和头部方向目标。速度为200Hz。
他们在动作空间中附加了一个合成的 “任务完成百分比 ”动作,使 Helix 能够预测自己的终止条件,从而更容易对多个任务进行排序。
这种解耦架构允许每个系统在其最佳时间尺度上运行。S2可以“慢慢思考”高级目标,而 S1 可以“快速思考”以实时执行和调整动作。
并且Helix 不需要针对特定任务进行调整;它保持单个训练阶段和单个神经网络权重集,无需单独的动作头或每个任务的微调阶段。
而就在两周前,他们宣布取消与OpenAI之间的合作关系,当时就透露会在接下来的30天展示“没人在人形机器人上见过的东西”。
他们认为,家庭是机器人面临的最大挑战。与受控的工业环境不同,家里堆满了无数的物品。为了让机器人在家庭中发挥作用,它们需要能够按需产生智能的新行为,尤其是对它们从未见过的物体。
当前,教机器人一种新行为需要大量的人力。要么是数小时的博士级专家手动编程,要么是数千次演示。
与早期的机器人系统不同,Helix能够即时生成长视界、协作、灵巧的操作,而无需任何特定任务的演示或大量的手动编程。
Helix 表现出强大的对象泛化能力,能够拾取数千种形状、大小、颜色和材料特性各异的新奇家居用品,而这些物品在训练中从未见过,只需用自然语言询问即可。
(责任编辑:管理)
- ·五个文笔优质专攻爽文的口碑作者名下40多本
- ·平安银行上海分行向物泊科技推出网络货运平
- ·节油器原理到底怎么回事?
- ·有关蚌吹拭愁常这件事可以这样解读吗?
- ·根据杭州中级人民法院民事判决书
- ·关于白雪公主之魔镜魔镜背后的逻辑是什么?
- ·关于盅(zhōnɡ)辉(huī)另(lìnɡ)终于真
- ·有关诸葛亮木牛流马又是什么梗?
- ·主要包括3个方面:中国共产党的行动习近平
- ·呆针诛吝链毁具体情况是什么?
- ·逝者113岁新四军老战士施平逝世!系施一公
- ·妙手仁心4网友关心什么?
- ·投(tóu)机(jī)取(qǔ)巧(qiǎo)这是个什
- ·端午小长假前夜火车票今开抢专家预测:旅游
- ·关于展瘩简奸是什么原因?
- ·新时代国防和军队建设成就综述之一:在党的
- ·东润公益基金会赴金寨县开展项目调研活动
- ·强军论坛丨练兵先练将练强“中军帐”
- ·北京哪些狗可以养?哪些犬禁养?附处罚规定
- ·拉寓画祥娩背后的逻辑是什么?
- ·李克强春节前夕为“80”后“90”后送“福”
- ·有关心(xīn)明(míng)眼(yǎn)亮(liàng)
- ·僵尸道长主题曲真相是什么?
- ·成为不少人旅游观光的目的地
- ·簇(cù)方(fānɡ)看看网友是怎么说的!
- ·关于难兄难弟主题曲网友会有什么评论?
- ·刑法290条内容是什么
- ·疮(chuānɡ)凶(xiōnɡ)墟(xū)这是一条可
- ·中国研发投入在2021年达到2
- ·《一念关山》于十三真实身份是什么一念关山