当前位置: 首页 > news >正文

亚马逊机器人如何用多模态识别技术取代条形码

亚马逊机器人如何用新技术消除条形码需求

条形码已使用近50年,虽然无处不在且几乎不会出错,但对亚马逊来说还不够完美。在亚马逊运营中心,员工需要在商品流转至送货车的多个节点扫描条形码验证身份,这个过程需要人工定位和扫描,且可能遇到条码损坏或缺失的情况。

面对数百万种不同形状尺寸的商品,这种流程难以自动化。目前还没有机器人能灵活处理仓库中所有商品并完成扫描。亚马逊的解决方案是:用多模态识别技术(MMID)增强或取代条形码,彻底摆脱低效的人工识别。

多模态识别技术原理

MMID通过多种信息模态实现自动识别,例如从商品图像中提取外观和尺寸特征。该技术已在汉堡和巴塞罗那运营中心的传送带上投入使用,用于检测"虚拟-物理不匹配"情况(托盘商品与库存系统记录不符)。

"我们的终极目标是将其应用于机器人操作,"亚马逊柏林计算机视觉团队应用科学经理Nontas Antonakos表示,"让机器人无需寻找和扫描条形码就能处理商品,这对提升包裹投递速度和准确性至关重要。"

技术开发过程

研发团队首先需要教算法将商品与其照片匹配。由于缺乏商品在运营中心的图像数据,第一步是在传送带上方安装摄像头建立图像库。每张图像被转换为数字向量(特征描述),商品尺寸同样被向量化。通过深度学习算法,初期实验就达到75%-80%的匹配率。

经过持续优化,当前MMID匹配准确率已接近99%。关键突破在于:算法只需在单个料箱的几十种商品中进行匹配,而非亚马逊数亿商品的全量库。

实际应用场景

该技术首先在波兰什切青运营中心试点,摄像头安装在单条传送带上方,专门拍摄"单一商品托盘"(每个托盘仅含一件商品)。这种设计简化了识别难度,并能在流程早期发现错误。

"我们可以直接将错误商品回收至正确位置,"参与该项目的机器人AI应用科学家Doug Morrison解释。MMID传感器平台的优势在于非侵入性:仅在不匹配时触发处理流程,正常情况不影响产线运行。

技术挑战与改进

系统曾因Prime Day促销遇到特殊挑战:每小时数百个外观几乎相同的灰色/蓝色Echo Dot导致算法混淆。这促使团队开发了"置信度评分"功能:

  • 高分表示潜在不匹配(阻止托盘通过)
  • 低分表示不确定(不采取行动)

未来发展方向

虽然传送带环境的光照和物品速度相对可控,但将MMID整合到人工拣货环节仍面临挑战:员工手持方式会影响检测,物品在双手间传递时需要更快识别速度。机器人研究人员正在攻克这些难题。

Antonakos表示:"将MMID应用于整个履约流程以实现机器人自动化的愿景必将实现,这将是我们更快速精准投递包裹道路上的重要里程碑。"

技术领域:机器人技术/计算机视觉/运筹优化
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码

http://www.vanclimg.com/news/1496.html

相关文章:

  • js获取多个div元素的方法。如果这些div有父子关系,如何进行区分?如何由子获得父?
  • django+Vue的项目使用docker打包
  • PyTorch 构建轻量级验证码识别模型
  • Hello CnBlogs
  • 从简历到入职:Moka稳定性雷达如何预测候选人留存率
  • [POI2012] Prefixuffix 题解
  • 7.29
  • 2025 -- 云智计划 -- 【CSP-S】模拟赛 #2_总结+题解
  • 使Excel高亮显示选中表格(使选中的表格更加突出)
  • 2、统计连续登录5天的用户
  • AMD纯NPU运行AI画图StableDiffusion3.0模型
  • C#自学笔记:委托与事件
  • 电流探头去磁与调零操作对测量精度的影响
  • 企业HR如何将AI Agent作为战略引擎重构业务流程
  • 7月29日总结
  • thradlocal
  • ThreadLocal线程隔离值为NULL,直接复制使用封装类
  • 基于 Nacos + Higress 的 MCP 开发新范式,手把手教程来了!
  • 使用Vue.js实现动态表单字段
  • 特征 - kkksc03
  • 7月29日
  • 图神经网络的未来与挑战
  • 网站SSL证书怎么选?不用SSL证书会怎么样?
  • 安全可靠的PolarDB V2.0 (兼容MySQL)产品能力及应用场景 - 王权富贵
  • 2025牛客暑期多校训练营5_J
  • 【LeetCode 24】力扣算法:两两交换链表中的节点
  • Pwn2Own柏林2025:第三天赛事成果与技术漏洞全记录
  • POLIR-Laws-民事诉讼法:手机录音能否作为民事诉讼证据?怎么录音才能被法院采信?
  • MCP是如何工作的?
  • OBS