中化新网讯 8月14日,据智元机器人消息,智元机器人推出面向真实世界机器人操控的统一世界模型开源平台Genie Envisioner(GE)。
据了解,GE的核心突破在于构建了基于世界模型、以视觉为中心的建模范式。不同于主流方法将视觉输入映射到语言空间进行间接建模,GE直接在视觉空间中建模机器人与环境的交互动态。这种方法完整保留了操控过程中的空间结构和时序演化信息,实现对机器人—环境动态更精确、更直接的建模。
这一视觉中心的建模范式带来了高效的跨本体泛化能力和长时序执行能力两个关键优势,能够在使用极少量数据的情况下实现高效跨平台迁移,并通过在视觉空间中显式建模时序演化,GE-Act能够规划和执行需要长时序推理的复杂任务。这种长时序执行能力的提升,能够帮助机器人选择性地保留关键历史信息,从而在长时序任务中保持精确的上下文理解。
目前,GE平台已应用于智元远征A2人形机器人,在物流分拣场景中实现98.7%的抓取准确率。该技术的推出,有望推动机器人行业从“单任务专用”向“多任务通用”跨越。
智元方面表示,团队将开源全部代码、预训练模型和评测工具。未来,随着更多开发者的加入,GE或将成为机器人界的“Android系统”,加速智能机器人的商业化落地。
8月28日,ABB携手仪表自动化领域7家领导企业联合宣布成立Ethernet-APL(以太网高级物理层)生态圈,旨在推动APL(高级物理层)技术在流程工业中的实际应用与深入发展。