当前位置: 首页 > news >正文

亚马逊发布TEACh数据集训练家用机器人

新数据集助力训练家用机器人执行人类指令

亚马逊科学团队公开发布的TEACh数据集包含来自模拟环境的3000多组对话及关联视觉数据,旨在推动能完成复杂家务任务的AI助手研发。

数据集概览

  • 数据规模:4365个采集会话中,成功回放3047个
  • 环境构成:基于AI2-THOR模拟器的30种厨房及多数客厅/卧室/浴室变体
  • 交互特性:包含45,000余条对话,平均每会话8.4条用户指令和5.25条机器人响应
  • 操作能力:支持拾取/放置、开关橱柜、操作电器、液体倾倒等20余种物体交互动作

技术实现

  1. 任务定义语言:通过属性验证机制判定任务完成状态(如检测"存在装满咖啡的干净杯子")
  2. 众包采集:双工作者分别扮演用户和机器人角色,通过网页界面在模拟环境中协作
  3. 动态交互:支持非结构化对话,包含过早/过晚指令、纠错指导等真实交互场景

三大基准测试

  1. EDH(基于对话历史的执行)

    • 输入:对话历史+机器人动作序列
    • 输出:预测后续动作并验证环境状态改变
    • 应用:Alexa Prize SimBot挑战赛基准
  2. TfD(基于对话的轨迹预测)

    • 输入:完整对话记录
    • 输出:重建机器人全部动作序列
  3. TATC(双代理任务完成)

    • 需构建用户模型(生成指令)和机器人模型(执行动作)的协同系统

验证架构

  • 可见分割(validation-seen/test-seen):评估训练房间内的泛化能力
  • 未见分割(validation-unseen/test-unseen):测试新场景适应能力
  • 兼容ALFRED数据集迁移学习

该数据集已开源并配套发布arXiv技术论文,为具身智能体研究提供新基准。研究团队特别感谢30余位Alexa AI组成员的贡献。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码

http://www.vanclimg.com/news/728.html

相关文章:

  • 完全使用TRAE和AI 开发一款完整的应用----第一周
  • CentOS Stream 9上部署FTP应用服务的两种方法(传统安装和docker-compose)
  • SeuratExtend 可视化教程(1):单细胞分析的高颜值绘图指南
  • 机械运动
  • 【2025.7.28】模拟赛T4
  • 深度学习(onnx量化)
  • Redisson
  • uni-app项目跑APP报useStore报错
  • P13493 【MX-X14-T3】心电感应 题解
  • DE_aemmprty 草稿纸合集
  • 题解:P13308 故障
  • mmap提高LCD显示效率
  • 用 Python 构建可扩展的验证码识别系统
  • Java学习Day28
  • 在运维工作中,Dockerfile中常见指令有哪些?
  • 英语_阅读_Rivers are important in culture_单词_待读
  • 题解:P12151 【MX-X11-T5】「蓬莱人形 Round 1」俄罗斯方块
  • 在运维工作中,docker封闭了哪些资源?
  • SciTech-EECS-Library: img2pdf 与 pdf2image : Python 的 pdf 与 image 双向转换库
  • 深度学习(pytorch量化)
  • 在运维工作中,Docker怎么清理容器磁盘空间?
  • 生成函数
  • CVE-2021-45232 Apache APISIX Dashboard身份验证绕过漏洞 (复现)
  • 在运维工作中,如果运行的一个容器突然挂了,如何排查?
  • IIS中配置HTTPS证书的详细步骤
  • 李超线段树
  • 非常值得学习渲染入门的一个教程
  • Linux开机自动登录的一种方法
  • 7月28日
  • 2025 ZR暑假集训 CD联考 Day2 E 环球旅行