5月30日,记者从智元机器东谈主获悉,旗下自研宇宙模子Genie Envisioner-Sim 2.0(简称GE 2.0)凭借优异的空洞露出,在环球宇宙模子评测基准World Arena(宇宙竞技场)“感知与作为反映”榜单中位列第一。
何为宇宙模子?浅薄来说,即是能清楚物理宇宙法例的AI大模子,比如机器东谈主有了宇宙模子的能力,就知谈杯子掉地上会碎、水往低处流、积木搭太高会倒等知识。
World Arena是现时宇宙模子行业的国外巨擘评测基准,由清华大学联结普林斯顿大学、香港大学、北京大学等8所环球顶尖高校打造,主要分为“感知与作为反映”和“数据引擎”两个中枢赛谈,通过16项细分野心和3类机器东谈主实操任务,来窥探具身智能对物理法例、三维感知、作为预判等清楚能力,具备很强的学术公信力和产业参考价值。
乐动中国手机app官网本次智元GE 2.0参与的是“感知与作为反映”赛谈评测,与英伟达最新模子DreamDojo、清华联结斯坦福的Ctrl-World团队等国表里AI顶尖团队径直竞争并最终夺冠。
智元GE 2.0多项野心处于向上地位。
记者从流露的技能文档中获悉,GE 2.0仅用20亿(2B)参数的模子,终结比英伟达、微软等超大参数的旗舰模子后果更优秀,也考证了在东谈主形机器东谈主诈欺方面,轻量化模子的适配性不逊于超大参数模子。
值得一提的是,智元团队并莫得有意为比赛作念针对性优化,仅仅用通用版块稍加转化就参赛了,高出于“裸考”拿冠军,开云kaiyun中国官网入口诠释GE 2.0自己泛化能力很强。
GE 2.0到底横暴在何处?机器东谈主能在“大脑”里搭建一个虚构场景,不错反复尝试各式作为,犯了错也不会的确弄坏蛋,等熟练掌执妙技后,再搬到执行宇宙中使用。这么既省钱又安全,还能大大加快机器东谈主的学习经由。
技能文档还提到了GE 2.0多个升级之处,比如万古序推演能力冲破、数据回流反哺机制、的确宇宙高度一致性等方面。
智元GE 2.0的技能图示。
许多宇宙模子有个通病,掂量的时候一长,画面就会变拖沓、变形,kaiyun.com就像作念梦到后头越来越离谱。GE 2.0天然也难以透彻根绝这一问题,但画面明晰度下落的速率远低于同业居品。万古序推演能力冲破,使得GE 2.0掂量到50秒的场景,画质已经比不少模子前10秒还要好。
智元研发团队作念了无数对比测试还发现,GE 2.0模拟出来的终结和的确宇宙中的露出高度吻合。不仅合座胜利率对得上,团队还一一案例作念了顾惜比对,用数据图表严格考证了这极少。这也意味着,机器东谈主在虚构宇宙里学会的妙技,搬到执行中或者率也能用。
同期,GE 2.0还内置了一个“裁判”系统,能自动判断每次虚构老到的质地上下,把好的训戒自动挑出来,反馈给机器东谈主的“活动大脑”,帮它学得更快。实验终结标明,这种“自我进化”的面貌如实让机器东谈主处理多个任务的能力更强。
记者获悉,GE 2.0并非是单一模子,而是从具身数据到智能体平台全栈自研系统的一部分。
4月中旬,智元上线环球首个掩饰具身智能全域计议的的确场景数据集AGIBOT WORLD 2026,100%荟萃自营业空间、旅馆、商超级的确宇宙。紧接着,Genie Sim 3.0仿真平台发布,一句话即可生成虚构宇宙,将环境构建速率从小时级镌汰至分钟级。另外,VLA基座大模子GO-2和宇宙模子GE 2.0一谈构建出可交互、可训练、可评估的虚构物理宇宙。
搭建好数据和仿的确基础后,智元发布零代码诈欺平台Genie Studio Agent(精灵责任室智能体),将视觉感知、畅通放手、导航野心、视觉讲话活动模子和强化学习器具链等复杂能力,封装成开箱即用的科罚决策。
基于这一全栈自研系统kaiyun.com,平时东谈主只需在平台上通过拖拽面貌,即可搭建属于我方的机器东谈主诈欺。