当前位置: 首页 > news >正文

使用监督学习训练图像聚类模型

基于监督学习的图像聚类新范式

传统机器学习模型依赖标注数据进行监督学习,而获取标注数据成本高昂。无监督学习的主要方法是聚类,即根据显著特征将数据点分组。传统聚类算法依赖启发式规则(如聚类中心距离阈值或分布形态)确定边界。在ICCV 2021发表的论文中,我们提出从数据中学习边界划分的方法。

技术架构

  1. 图表示构建

    • 使用元训练数据训练监督分类器(编码器-解码器结构)
    • 仅保留编码器将图像转换为特征向量
    • 基于特征空间构建k近邻图,节点代表图像
  2. 层次化图神经网络(Hi-LANDER)

    • 基础模型LANDER(链接近似与密度估计优化):
      • 通过GNN生成节点嵌入
      • 联合预测节点链接(同类别连接)和局部数据密度
    • 层次化处理:
      • 首轮聚类后将簇聚合为超节点
      • 迭代执行近邻连接和GNN处理直至无新边产生

核心创新

  • 双目标联合训练:首次在单一模型中同时优化链接预测和密度预测任务
  • 全图处理机制:突破传统子图划分限制,实现全局信息流动
  • 元训练迁移:在测试集类别与训练数据零重叠(0%)或极低重叠(<2%)时仍保持优异表现

实验成果

对比模型 F-score提升幅度
传统GNN聚类方法 +49%
无监督学习方法 +47%

当前研究正探索构建通用聚类模型,以实现在人脸、动物物种等不同数据类型间的迁移聚类能力。

更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码

http://www.vanclimg.com/news/670.html

相关文章:

  • java第二十八天
  • P2910 [USACO08OPEN] Clear And Present Danger S (Floyd算法)
  • 读《构建之法》:我的C/C++学习反思
  • 软工7.28
  • DE_aemmprty 题单合集(分类)
  • 《大道至简——软件工程实践者的思想》读后感
  • C++对象模型
  • 子串的故事(2) - 2025“钉耙编程”中国大学生算法设计暑期联赛(2)T4 题解
  • 【比赛记录】2025CSP-S模拟赛28
  • Apereo CAS 4.1 反序列化命令执行漏洞 (复现)
  • tt
  • 工程建立 - LI,Yi
  • Java基础语法学习 ———— Day1
  • 29
  • 第二十六天
  • 2025 -- 云智计划 -- 【CSP-S】模拟赛 #1_总结+题解
  • 习题-有限集
  • 人工智能驱动企业:通过情境感知AI重塑组织0引言
  • 亚马逊机器人如何应对交通拥堵
  • 00.01.Linux 应急响应:账号安全与入侵排查
  • 2025年7月28日
  • html重定向
  • 搜索结果太乱?5种重排序模型让你的搜索系统准确率提升40%
  • PCIe【6】SR-IOV
  • 服务器新手常见错误及网站搭建问题解析
  • Java面试见闻2025-7
  • 7月28日总结
  • 服务器外的文件,复制不到服务器上面
  • 数据资产到底值不值钱 - 智慧园区
  • LIS笔记