8月14日,智元机器人宣布推出面向真实世界机器人操控的统一世界模型平台Genie Envisioner(GE)。不同于传统“数据—训练—评估”的流水线模式,GE将未来帧预测、策略学习与仿真评估首次整合进以视频生成为核心的闭环架构,使机器人在同一世界模型中完成从“看”到“想”再到“动”的端到端推理与执行。
当前,行业主流VLA(Vision-Language-Action)方法通过视觉-语言模型将视觉输入映射到语言空间进行间接建模,而GE则直接在视觉空间中建模机器人与环境的交互动态。
智元机器人表示,这种方法完整保留了操控过程中的空间结构和时序演化信息,实现了对机器人—环境动态更精确、更直接的建模,使得机器人拥有高效的跨本体泛化能力和长时序任务的精确执行能力。团队将开源GE的全部代码、预训练模型和评测工具。在未来扩展更多传感器模态,支持全身移动与人机协作,持续推动智能制造与服务机器人的落地应用。
配先查配资-股票配资门户网-天津专业炒股配资网-国内知名股票配资公司有哪些提示:文章来自网络,不代表本站观点。