[Paper Review] Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping

Paper Review
작성자
Woongchan Nam
작성일
2025-01-17 17:05
조회
1658
  1. 논문 제목
    • Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping (CVPR 2024)
    • 링크: https://arxiv.org/abs/2312.04521
  2. Overview
    • 다양한 산업 현장 시나리오에서 고려될 수 있는 요소 (빠른 Inferencce Speed, 엄격한 FPR 허용 Ratio 등)들을 고려한 Feature Reconstruction 기반 3D Anomaly Detection 연구
    • 정상 Feature를 바탕으로 Feature를 Reconstruction하는 Deep Feature Reconstruction (DFR) 기반 3D AD 방식 제안
    • 2D Feature로 3D Feature를 예측 및 3D Feature로 2D Feature를 예측하는 Crossmodal Feature Mapping 전략 제시
    • Inference 속도를 높이고자 Feature Extraction 과정에서 Shallow Layer만을 사용하는 Layers Pruning 전략 제안
  3. 발표자료 및 발표영상
    • 발표자료 : 하단 첨부
    • 발표영상 : 추후 첨부
전체 12

  • 2025-01-31 19:51

    금일 세미나는 3D AD를 위해 두 모달리티의 feature map을 align하는 방법론을 제안하는 "Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping"을 중심으로 진행되었습니다. 해당 방법론은 사전학습된 2D/3D Encoder에서 추출한 feature map을 이용해 상대 feature map을 예측하는 작업을 수행합니다. 이를 통해 정상 이미지/3d 클라우드 상에서만 나타나는 특징으로 예측하게 되는 효과를 얻을 수 있고, 향후 anomaly score aggregation 과정에서 and 연산으로 두 모달리티 중 일부에서만 anomaly인 영역을 포착해낼 수 있습니다. 실제로 해당 연구는 타 3D 기반 방법론 대비 높은 성능을 보이면서 학습데이터가 적은 few-shot setting에서도 좋은 모습을 보이고 있습니다. 3D AD 분야의 특성상 소수의 데이터를 이용해 point cloud 데이터와 RGB 이미지 데이터를 연결하는 것이 중요한데, 직관적인 방법론으로 잘 풀어낸 논문이라는 인상을 받았습니다. 좋은 발표 감사합니다.


  • 2025-02-05 01:44

    이번 세미나에서는 “Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping” 논문을 중심으로, 사전학습된 2D/3D Encoder에서 추출한 feature map을 기반으로 정상 데이터를 Reconstruction하는 Deep Feature Reconstruction(DFR) 접근법과 Crossmodal Feature Mapping 전략을 결합하여, 두 모달리티 간의 feature alignment를 통해 3D AD 분야에서 anomaly를 효과적으로 탐지하는 방법이 소개되었습니다. 해당 방법론은 Shallow Layer만을 사용하는 Layers Pruning 전략을 도입해 Inference 속도를 향상시키면서, few-shot setting에서도 뛰어난 성능을 보이는 점이 인상적이었습니다. 또한, 두 feature를 AND 연산으로 Aggregation하여, 단일 모달리티에서 나타나는 이상 영역을 정밀하게 포착할 수 있도록 설계되었으나, One-to-many Mapping 문제와 Aggregation 과정에서 한 모달리티의 특징 누락으로 인한 영향 등 개선할 부분도 지적되었습니다. 좋은 발표 감사합니다.


  • 2025-01-30 16:49

    이번 세미나에서는 “Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping” 논문을 중심으로, 3D 이상 탐지에서 Reconstruction 기반 접근법과 Memory Bank 기반 접근법을 효과적으로 결합한 새로운 방법론을 발표해 주셨습니다. 본 연구에서는 정상 Feature를 기반으로 Reconstruction을 수행하는 Deep Feature Reconstruction(DFR) 기법을 활용하고, 2D 및 3D Feature 간의 상호 예측을 가능하게 하는 Crossmodal Feature Mapping(CFM) 전략을 제안하여 단일 모달리티의 한계를 보완하였습니다. 이를 통해 다양한 이상 패턴을 보다 효과적으로 탐지할 수 있도록 설계된 점이 인상적이었습니다. 특히, 모델의 Inference 속도를 향상시키기 위해 Layers Pruning 기법을 적용하여 실시간 이상 탐지 시스템에서의 활용 가능성을 높였으며, 실험 결과 엄격한 False Positive Rate(FPR) 조건에서도 높은 성능을 기록한 점이 실용적 의미가 크다고 판단됩니다. 또한, Few-shot 학습 환경에서도 강건한 성능을 유지하며, Pre-trained Backbone을 활용한 효율적인 일반화 능력을 입증한 점도 주목할 만한 부분이었습니다. 다만, Crossmodal Feature Mapping 전략에서 발생할 수 있는 One-to-many Mapping 문제와 특정 Feature에서 정보 손실이 발생할 가능성은 향후 보완이 필요한 부분으로 보입니다. 지금까지 3D 이상 탐지가 실용적으로 적용되기 어려운 분야라고 생각했는데, 이번 세미나를 통해 해당 기술이 산업 환경에서 더욱 정교하게 활용될 가능성이 높다는 점을 확인할 수 있었습니다. 흥미로운 주제로 좋은 발표해 주셔서 감사합니다.


  • 2025-01-17 18:50

    이번 세미나에서는 기존의 3D Anomaly Detection에서 Reconstruction 기반 방법과 Memory bank 기반 방법론을 적절히 조합한 ‘Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping’ 논문에 대하여 발표해 주셨습니다. 해당 방법론은 정상 Feature를 기반으로 Feature를 복원하는 Deep Feature Reconstruction을 활용해 3D Anomaly Detection을 수행하며, 2D Feature와 3D Feature 간의 상호 예측을 가능하게 하는 Crossmodal Feature Mapping 전략을 내세웠습니다. 이는 단일 모달리티 접근법의 한계를 보완하고, 다양한 이상치에 유연하게 대응할 수 있도록 설계된 점에서 실용성과 이론적 타당성을 모두 갖춘 접근 방식이라 생각됩니다. 또한, Shallow Layer만 활용하는 Layers Pruning 전략을 제안한 점은 Inference 속도를 크게 향상시켜서 실제 산업 현장에서 적용될 수 있는 매우 실용적인 방법론이라고 생각하였습니다. 특히 엄격한 FPR 조건에서도 높은 성능을 기록한 것은 실용적 가능성을 한층 높이는 성과라고 판단합니다. 더욱이 Few-shot 학습 설정에서도 뛰어난 성능을 입증하며, Pre-trained Backbone의 효율적 활용과 제안된 방법론의 일반화 가능성을 잘 보여주었습니다. 지금까지 3D Anomaly Detection의 효용성을 크게 느끼지 못했는데 이번 세미나를 통해 발전 가능성을 볼 수 있었습니다. 흥미로운 주제로 좋은 발표해 주셔서 감사합니다.


  • 2025-01-21 18:39

    이번 세미나는 BTF, M3DM 등과 같은 기존 Memory Bank에 기반한 3D AD 연구들이 Memory 저장 과정에서 높은 비용이 발생하고, Inference 속도가 느리다는 한계점을 가지고 있고 이를 개선하고자했던 CFM이라는 방법론을 제안한 "Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping”이라는 연구에 대한 발표를 중심으로 진행되었습니다. 해당 방법론은 Deep Feature Reconstruction(DFR) 기반 방법론으로, Crossmodal Feature Mapping을 통해 2D Feature로 3D Feature를, 3D Feature로 2D Feature를 예측하며 Layers Pruning 전략, 즉 Inference 시 Feature Extraction 과정에서 Shallow Layer만 사용하여 속도를 높이는 방법을 택합니다. 기존 2D AD 분야에서도 한계점이 명확하지만 Memory Bank에 기반한 방법론들이 좋은 성능을 보이고 있고, 이를 개선하기 위한 노력이 이어지고 있는데, 3D AD 분야에서도 비슷한 결의 좋은 연구가 해당 논문에서 수행되었다는 생각이 들었습니다. 좋은 발표 해주셔서 감사합니다.


  • 2025-01-23 14:42

    이번 세미나에서는 "Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping" 라는 논문에 대한 소개를 중심으로 진행되었습니다. 이 연구는 Deep Feature Reconstruction (DFR)을 기반으로 정상 Feature를 바탕으로 다른 Feature를 Reconstruction하는 것입니다. 또한, Crossmodal Feature Mapping을 통해 2D Feature와 3D Feature 간의 예측을 수행하여, Feature Extraction 과정에서 Shallow Layer만을 사용하는 Layers Pruning 전략을 제시함으로써 Inference 속도를 향상시키고자 했습니다. Crossmodal Feature Mapping 전략은 2D 및 3D 데이터 간의 상호작용을 통해 이상치 탐지의 정밀도를 높이고, 여러 산업 현장에서의 실질적인 적용 가능성을 염두에 두고 있습니다. 그러나 Crossmodal Feature Mapping 전략의 도입으로 발생할 수 있는 One-to-many Mapping 문제와 같은 몇 가지 한계도 지적되었습니다. 뿐만 아니라 결국 2개의 Feature를 Aggregation 하는 과정에서 두 값을 곱하는 것은 둘 중 하나의 Feature에서 특징 추출을 놓치게 되면, 최종 Feature에서 이에 대한 영향으로 판단에 방해를 줄 수 있지 않을까 생각하였습니다. 좋은 발표 준비해주셔서 감사합니다.


  • 2025-01-27 22:41

    이번 세미나는 "Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping" 논문을 중심으로 진행되었습니다. 이 연구는 3D Anomaly Detection에서 Deep Feature Reconstruction(DFR)과 Crossmodal Feature Mapping을 결합하여, 2D와 3D Feature 간의 상호 예측을 통해 이상치 탐지의 정밀도를 높였습니다. 특히 Layers Pruning 전략을 도입하여 Inference 속도를 향상시키고, 엄격한 FPR 조건에서도 높은 성능을 기록함으로써 산업 현장에서의 실용성을 강조했습니다. 하지만 Crossmodal Feature Mapping에서 발생할 수 있는 One-to-many Mapping 문제와 Feature Aggregation 과정에서의 정보 손실 우려도 지적되었습니다. 그럼에도 불구하고, 이 연구는 Few-shot 학습 설정에서도 뛰어난 성능을 보였고, Pre-trained Backbone을 효율적으로 활용하여 3D Anomaly Detection의 가능성을 크게 확장시켰습니다. 전반적으로 실용성과 이론적 타당성을 모두 갖춘 연구였습니다.


  • 2025-01-28 19:14

    이번 세미나는 3D 이미지 대상의 이상치 탐지를 주제로 진행되었습니다. 2D 이미지와 3D 이미지를 서로 다른 modality로 간주하여 2D 이미지의 feature로 3D 이미지를 복원하고 동시에 vice versa 한 방식으로 학습을 도모합니다. 나아가 기존의 memory bank 기반의 방법론들의 높은 메모리 저장 비용과 느린 추론 속도를 개선하고자 학습된 transformer layer들 중 일부만 활용하는 방식인 shallow layer 또는 layer pruning을 적용하였습니다. 실험을 통해 shallow layer의 효과, 즉 사용하는 layer 수에 따른 결과도 함께 보여준 점이 인상적이었고, 만약 각 방식에 따른 feature visualization도 함께 진행되면 어땠을까 하는 생각도 들었습니다. 흥미로운 발표 감사합니다.


  • 2025-01-30 12:10

    이번 세미나에서는 "Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping" 논문이 소개되었습니다. 이 논문은 2D 이미지와 3D 포인트 클라우드 데이터를 활용하여 산업 환경에서 이상 탐지를 수행하는 새로운 방식을 제안했습니다. 특히, 기존 방법들이 메모리 사용량과 추론 속도에서 한계를 보이는 반면, 본 연구에서는 크로스모달 feature mapping 방식을 도입하여 경량화된 구조로 빠르고 효율적인 이상 탐지를 가능하게 한 점이 인상적이었습니다.

    논문의 핵심 아이디어는 2D와 3D 특징 간의 매핑을 학습하여, 정상 샘플에서 두 특징 사이의 관계를 모델링하고, 이상 샘플에서는 예측된 특징과 실제 특징 간의 차이를 기반으로 이상을 탐지하는 방식입니다. 이를 통해 대용량 메모리 뱅크 없이도 높은 성능을 유지하면서 빠른 추론 속도를 달성했다는 점이 주목할 만합니다. 실험 결과에서도 제안된 방법이 MVTec 3D-AD 및 Eyecandies 데이터셋에서 기존 방법 대비 더 높은 탐지 성능을 기록했으며, 특히 few-shot 설정에서도 우수한 결과를 보인 점이 인상적이었습니다.

    또한, 레이어 프루닝 layer pruning 기법을 도입하여 깊은 네트워크의 일부 계층을 제거함으로써 메모리 사용량을 줄이면서도 성능을 크게 저하시키지 않는 전략을 제시한 점도 실용적인 측면에서 의미 있는 기여라고 생각됩니다.

    이 논문은 멀티모달 이상 탐지 분야에서 실용성과 성능을 동시에 고려한 중요한 연구로, 향후 다양한 산업 환경에서 활용될 가능성이 높아 보입니다. 특히, 경량 모델이 요구되는 실시간 품질 검사 시스템에서 유용하게 적용될 수 있을 것으로 기대됩니다. 좋은 발표 감사합니다!


  • 2025-01-30 13:14

    이번 세미나에서는 Multimodal Anomaly Detection을 위한 Crossmodal Feature Mapping 방법론을 제시한 논문을 중심으로 진행되었습니다. 기존 이상 탐지 모델들은 RGB(2D) 또는 Point Cloud(3D) 데이터를 개별적으로 처리하는 한계를 가지고 있었으며, 본 연구에서는 2D Feature로부터 3D Feature를 예측하고, 3D Feature로부터 2D Feature를 예측하는 Crossmodal Feature Mapping(CFM) 기법을 도입하여 이상 탐지 성능을 향상하는 전략을 제안하였습니다. CFM은 Deep Feature Reconstruction(DFR) 방식을 활용하여 2D-3D 간의 특성 변환을 학습하며, 학습된 정상 데이터의 특징을 기반으로 예측된 Feature와 실제 Feature 간의 차이를 계산하여 이상 여부를 판단합니다. 또한, Inference 속도를 높이기 위해 Layer Pruning 기법을 적용하여 높은 메모리 비용과 느린 추론 속도 문제를 해결하였으며, 실험 결과 기존 Memory Bank 기반 방식보다 더 적은 저장 비용과 빠른 속도를 유지하면서도 높은 탐지 성능을 기록했습니다.


  • 2025-01-30 13:52

    금일 세미나는 “Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping” 연구를 바탕으로 진행되었습니다. 제안 연구에서는 3D Image anomaly detection task를 위하여 정상 Feature를 바탕으로 Feature를 Reconstruction하는 Deep Feature Reconstruction (DFR) 기반 3D AD 방식을 제안하고 있으며, 이때 3D Image만을 사용하는 것이 아닌 2D Image modality를 함께 활용하는 방법을 이용함으로써 상호보완적인 이상탐지를 수행하고 있습니다. 각 모달리티를 적절히 이용하기 위하여 2D Feature로 3D Feature를 예측 및 3D Feature로 2D Feature를 예측하는 Crossmodal Feature Mapping 전략을 제시하여, 서로 다른 modality를 통하여 Reconstruction하는 새로운 방법을 제안합니다. 마지막으로, Inference 속도를 높이고자 Feature Extraction 과정에서 Shallow Layer만을 사용하는 Layers Pruning 전략을 통하여 현실적인 이상탐지 방법론을 제안해주고 있습니다. 상세한 설명과 함께 좋은 발표 정말 감사드립니다.


  • 2025-01-30 15:43

    이번 세미나는 "Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping" 논문에 대해 소개해주셨습니다. 3D anomaly detection에서는 2차원인 RGB 이미지와 3차원인 depth 이미지가 존재하는데 둘 같의 cross modal이 가능하도록 새로운 방법론인 Crossmodal Feature Mapping(CFM)을 제안하였습니다. RGB 이미지는 depth 이미지로 재구축하고 반대로 depth 이미지는 RGB 이미지로 재구축하여 두 재구축 오차에 대한 anomaly score를 결합하는 방식으로 최종적인 anomaly score를 산출합니다. 3D anomaly detection에서는 RGB로 확인이 어려운 이상치는 depth 이미지로 확인이 가능하고 그 반대의 경우도 존재하기 때문에 서로 다른 두 모달리티를 잘 고려한 방식이라 생각됩니다. 다만 두 모달리티에 대한 재구축을 위해 두 개의 모델이 필요로하지만 이에 대한 부담을 줄이기 위해 shallow 모델을 사용하여 inference 측면에서도 보완하고자 한점이 문제점을 잘 고려한 방식이라 생각됩니다. 좋은 발표 감사합니다.


전체 553
번호 제목 작성자 작성일 추천 조회
공지사항
Paper Reviews 2019 Q3
관리자 | 2020.03.12 | 추천 0 | 조회 14547
관리자 2020.03.12 0 14547
공지사항
Paper Reviews 2019 Q2
관리자 | 2020.03.12 | 추천 0 | 조회 13311
관리자 2020.03.12 0 13311
공지사항
Paper Reviews 2019 Q1
관리자 | 2020.03.12 | 추천 0 | 조회 14251
관리자 2020.03.12 0 14251
550
[Paper Review] Towards a General Time Series Anomaly Detector with Adaptive Bottlenecks and Dual Adversarial Decoders (3)
Sunghun Lim | 2026.03.01 | 추천 0 | 조회 56
Sunghun Lim 2026.03.01 0 56
549
[Paper Review] Rethinking the Power of Timestamps for Robust Time Series Forecasting: A Global-Local Fusion Perspective (5)
Suyeon Shin | 2026.02.25 | 추천 0 | 조회 69
Suyeon Shin 2026.02.25 0 69
548
[Paper Review] Recent Research Trends Foundation Model for Visual Anomaly Detection (10)
Jaehyuk Heo | 2026.02.12 | 추천 0 | 조회 199
Jaehyuk Heo 2026.02.12 0 199
547
[Paper Review] Vision-based and Multimodal Approaches for Time Series Analysis (8)
Hyeongwon Kang | 2026.02.10 | 추천 0 | 조회 198
Hyeongwon Kang 2026.02.10 0 198
546
[Paper Review] Introduction to Neural Operator (10)
Hankyeol Kim | 2026.02.03 | 추천 0 | 조회 264
Hankyeol Kim 2026.02.03 0 264
545
[Paper Review] Enhancing Time Series Forecasting through Selective Representation Spaces: A Patch Perspective (12)
Sieon Park | 2026.01.29 | 추천 0 | 조회 340
Sieon Park 2026.01.29 0 340
544
[Paper Review] ELFS: Label-Free Coreset Selection with Proxy Training Dynamics (12)
Subeen Cha | 2026.01.28 | 추천 0 | 조회 231
Subeen Cha 2026.01.28 0 231
543
[Paper Review] Model Merging for Continual Learning (11)
Hun Im | 2026.01.24 | 추천 0 | 조회 236
Hun Im 2026.01.24 0 236
542
[Paper Review] Selective Learning for Deep Time Series Forecasting (13)
Jinwoo Park | 2026.01.24 | 추천 0 | 조회 335
Jinwoo Park 2026.01.24 0 335
541
[Paper Review] Multiple Instance Learning in Time Series (9)
Doyoon Kim | 2026.01.13 | 추천 0 | 조회 423
Doyoon Kim 2026.01.13 0 423

Data Science & Business Analytics Lab.
Department of Industrial Engineering, College of Engineering,
Seoul National University

Contact Us

  • 강필성 교수 (pilsung_kang@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 301호 
  • 대학원 연구실 (총무 김재희: jaehee_kim@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 411호