腾讯优图实验室荣获CVPR 2023视觉异常检测挑战赛冠军,助力工业AI高质量发展

近日,腾讯优图实验室在CVPR 2023(IEEE国际计算机视觉与模式识别会议)中斩获了视觉异常检测(Visual Anomaly and Novelty Detection,VAND)挑战赛的冠军,这一荣誉标志着腾讯优图在工业人工智能领域的技术实力和创新能力得到了权威机构的认可。无监督图像异常检测是计算

近日,腾讯优图实验室在CVPR 2023(IEEE国际计算机视觉与模式识别会议)中斩获了视觉异常检测(Visual Anomaly and Novelty
Detection,VAND)挑战赛的冠军,这一荣誉标志着腾讯优图在工业人工智能领域的技术实力和创新能力得到了权威机构的认可。

无监督图像异常检测是计算机视觉领域的重要研究方向,其目标是通过仅使用正常图像进行模型训练,在测试时能够准确地区分正常和异常图像。在工业外观质检、产品零件安装检测和智能安全视频等领域,无监督异常检测技术具有巨大的研究意义和应用价值。工业领域对于视觉异常检测的需求日益增长。在工业生产过程中,异常情况可能导致质量问题、安全隐患甚至设备故障。传统的异常检测方法往往需要人工参与,效率低下且易受主观因素影响。而基于人工智能的视觉异常检测技术能够通过高效的自动化方式,快速识别和定位异常情况,从而提高生产效率和产品质量。

技术解析:

腾讯优图实验室与浙江大学合作,在Zero-shot异常检测赛道中提出了创新的解决方案。通过结合文本提示和图像特征对比的方法,该方案在测试集上取得了优异的成绩,综合F1-max指标达到0.4589,超越了其他参赛队伍。这意味着提出的模型能够在未见过异常样本的情况下,准确地识别和分割异常图像。以下可分为三点;

(一)异常分类

基于WinCLIP[3]异常分类框架,我们提出了一种文本提示集成策略,在不使用复杂的多尺度窗口策略的基础上显著提升了baseline的异常分类精度。具体地,该集成策略包含template-level和state-level两部分:

1) 对于前者,我们从CLIP Surgery[4]中选定的85个模板提示中删掉了一些不适合AD任务的模板,如“a photo of the weird
[obj.]“,最终筛选35个模板提示。

2) 对于后者,我们采用通用文本来描述正常/异常对象,如“flawless,damaged“等,而没有提供过于详细的描述以保证方法的普适性,如”chip
around edge and corner“。最终使用7个正常提示和5个异常提示。

模板和状态提示与样本类别名称结合后,使用CLIP文本编码器提取文本特征,并对正常和异常特征分别求平均值。最终,将正常与异常特征各自的平均值与图像特征进行对比,经过softmax后得到异常类别概率作为分类得分,见下图中蓝色Zero-shot
Anomaly Score流程。

腾讯优图实验室荣获CVPR 2023视觉异常检测挑战赛冠军,助力工业AI高质量发展

自研Zero-shot/Few-shot异常检测统一框架

(二)异常分割

类比图像级别的异常分类方法到异常分割,一个自然而然的想法是将Backbone提取到的不同层级特征与文本特征进行相似度度量。然而,CLIP模型是基于分类的方案进行设计的,即除了用于分类的抽象图像特征外,没有将其它图像特征映射到统一的图像/文本空间。因此我们提出了一个简单但有效的方案来解决这个问题:使用额外的线性层将不同层级的图像特征映射到图像/文本联合嵌入空间中,见上图中蓝色Zero-shot
Anomaly
Map流程。具体地,不同层级的特征分别经由一个线性层进行联合嵌入特征空间变换,将得到的变换后的特征与文本特征进行对比,得到不同层级的异常图。最后,将不同层级的异常图简单加和求得最终结果,具体实现可参考技术报告和源代码。官方的测试数据集上提出的方法在综合F1-max指标上达到0.4589,相较于其他众多参赛队伍具有明显的优势,获得了该赛道冠军,证明了所提方法的优越性和泛化性。

腾讯优图实验室荣获CVPR 2023视觉异常检测挑战赛冠军,助力工业AI高质量发展

(三)
Few-shot扩展

得益于简单的结构,我们结合基于memory的PatchCore[5]思路将方法扩展到Few-shot赛道,在不进行任何调参的基础上获得了积极竞争的结果,获得了该赛道荣誉提名奖,我们会在后续工作中进一步探究该方法在Few-shot上的应用潜力与价值。

该解决方案不仅在Zero-shot异常检测赛道表现出色,腾讯优图实验室还将其扩展到Few-shot异常检测赛道,并获得了该赛道的荣誉提名奖。在Few-shot异常检测赛道中,该方案在异常检测准确率方面表现优异,展现出出色的适应能力和泛化能力。

腾讯优图实验室在工业人工智能领域的相关成就,为工业质检、产品安全和智能视频等领域的发展提供了新的可能性。未来,腾讯优图将继续致力于推动计算机视觉和人工智能技术的创新,为工业应用带来更多突破和进步,为各行业提供更智能、高效的解决方案。

关于CVPR

CVPR是由IEEE主办的一年一度的全球学术型顶级会议,全称“IEEE国际计算机视觉与模式识别会议”(IEEE Conference on
Computer Vision and Pattern Recognition),今年将于6月18日到22日在温哥华会议中心举办。

腾讯优图实验室荣获CVPR 2023视觉异常检测挑战赛冠军,助力工业AI高质量发展

关于腾讯优图实验室

腾讯优图实验室成立于2012年,是腾讯公司旗下顶级人工智能实验室。优图聚焦计算机视觉,专注人脸识别、图像识别、OCR等领域开展技术研发和行业落地,在推动产业数字化升级过程中,优图始终专注基础研究、产业落地两条腿走路的发展战略,与腾讯云与智慧产业深度融合,挖掘客户痛点,切实为行业降本增效。与此同时,优图关注科技的社会价值,践行科技向善理念,致力于通过视觉AI技术解决社会问题,帮助弱势群体。

腾讯优图实验室的研究成果已被CVPR 2023 VAND研讨会收录。将于6月18日的11:50 AM – 12:00
PM进行相关Talk和QA可以点击阅读原文了解详情。

阅文原文链接:(https://sites.google.com/view/vand-cvpr23/schedule )。

参考文献

[1] Radford, Alec, et al. “Learning transferable visual models from natural
language supervision.”International conference on machine learning. PMLR,
2021.

[2] Dosovitskiy, Alexey, et al. “An image is worth 16×16 words: Transformers
for image recognition at scale.”arXiv preprint arXiv:2010.11929(2020).

[3] Jeong, Jongheon, et al. “Winclip: Zero-/few-shot anomaly classification
and segmentation.” Proceedings of the IEEE/CVF Conference on Computer Vision and
Pattern Recognition. 2023.

[4] Li, Yi, et al. “Clip surgery for better explainability with enhancement
in open-vocabulary tasks.”arXiv preprint arXiv:2304.05653(2023).

[5] Roth, Karsten, et al. “Towards total recall in industrial anomaly
detection.”Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern
Recognition. 2022.

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 lmnmylww@163.com 举报,一经查实,本站将立刻删除。本文链接:https://www.dyyqzs.com/i/233282.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-06-14 18:08
下一篇 2023-06-14 20:06

相关推荐

  • 酷炫唤醒会玩基因,打造沉浸游戏空间:三星携多款显示器参展2023 ChinaJoy

    7月28日,第二十届中国国际数码互动娱乐展览会(ChinaJoy)于上海新国际博览中心开幕。作为目前全球最具专业性、权威性和国际性的数字娱乐产业展会之一,本届ChinaJoy以“相伴二十载,越来悦精彩”为主题,为广大游戏玩家和电竞爱好者呈现了一场以领先创新科技赋能数字娱

    行业动态 2023-07-29
    600
  • 工作表中数据分析怎么写

    摘要: 文章主题为工作表中数据分析的撰写方法。1、数据来源和数据捕集:包括描述获得的数据来源,以及提取数据的具体过程;2、数据处理:解读数据清洗、格式化、转换等步骤,指出如何确保数据的准确性;3、数据分析:详细阐述如何通过工具和方法评估和解释数据,包括定量和定性分析方法;4、数据报告编写:描述如何创建数据报告,以及如何…

    行业动态 2024-03-12
    000
  • 淘宝首页装修教程,淘宝首页装修教程分享?

    很多商家都想要开通个性化首页,今天的内容就告诉大家该如何去设置,希望对你有帮助。一、什么是个性化页面?平台根据商家首页的配置内容、效率、人群等关键因子,结合大数据,包括不仅限于

    行业动态 2022-06-09
    7400
  • 自己洗车没有洗车液用什么代替(如何正确洗车小妙招)

    居家抗疫车也覆盖了一层灰趁着劳动节自己动手洗个车吧但身边物资有限这次我们就来说说如何使用居家材料正确洗车01选择正确的洗车剂洗车时应使用专业的洗车剂清洗车辆。不要用洗衣粉或洗洁精代替洗车液。需要注意

    行业动态 2023-01-08
    9500
  • 前卫时尚设计抢眼!深蓝S7外观揭秘

    【本站】6月25日消息,深蓝S7今天公布了正式的售价,并计划于6月30日开始交付。这款中型SUV此前曾发布了预售价区间为16.99万至23.99万元,预计正式价格会稍微低于此区间。外观设计方面,深蓝S7与深蓝SL03的外观风格非常相似。车辆采用了大面积封闭式前面板和

    行业动态 2023-06-25
    1100

发表回复

登录后才能评论

联系我们

在线咨询: QQ交谈

邮件:5733401@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息