[Paper Review] Recent Research Trends in Video Anomaly Detection

Paper Review
작성자
Jaehyuk Heo
작성일
2025-07-27 21:12
조회
691

Topic


  • Recent Research Trends in Video Anomaly Detection

Overview


  • Video anomaly detection은 연구실에서 오랫동안 다뤄지지 않은 분야
  • 최근 video와 관련된 연구와 사회적 관심이 증가함에 따라 video anomaly detection 연구에 대한 관심이 생김
  • Video anomaly detection 연구의 흐름을 파악하고자 세미나를 준비함
  • (1) Datasets, (2) Evaluation, (3) Methodologies using LLM 으로 내용을 공유하고자 함

발표자료 및 발표영상


  • 발표자료: 첨부 파일
  • 발표영상: 추후 첨부

참고문헌


  1. Subway Entrance & Exit Robust Real-Time Unusual Event Detection using Multiple Fixed-Location Monitors. TPAMI (2008)
  2. UCSD Ped1 & 2 Anomaly Detection in Crowded Scenes. CVPR (2010). TPAMI (2014).
  3. CUHK Avenue Abnormal event detection at 150 fps in matlab. ICCV (2013).
  4. ShanghaiTech A revisit of sparse coding based anomaly detection in stacked rnn framework. ICCV (2017).
  5. UCF-Crime Real-world anomaly detection in surveillance videos. CVPR (2018)
  6. Street Scene A new dataset and evaluation protocol for video anomaly detection. WACV (2020).
  7. IITB Corridor Multi-timescale trajectory prediction for abnormal human activity detection. WACV (2020).
  8. UBnormal New benchmark for supervised open-set video anomaly detection. CVPR (2022).
  9. NWPU Campus A New Comprehensive Benchmark for Semi-supervised Video Anomaly Detection and Anticipation. CVPR (2023).
  10. MSAD Advancing Video Anomaly Detection: A Concise Review and a New Dataset. NeurIPS (2024).
  11. IPAD Industrial Process Anomaly Detection Dataset. arXiv (2024.04.23)
  12. UCA Towards Surveillance Video-and-Language Understanding: New Dataset, Baselines, and Challenges. CVPR (2024).
  13. CUVA Uncovering What, Why and How- A Comprehensive Benchmark for Causation Understanding of Video Anomaly. CVPR (2024).
  14. UCFCrime-AR & XDViolence-AR Toward Video Anomaly Retrieval From Video Anomaly Detection- New Benchmarks and Model. IEEE Transactions on Image Processing (2024).
  15. VANE-Bench Video Anomaly Evaluation Benchmark for Conversational LMMs. NAACL (2025).
  16. SVTA Towards Scalable Video Anomaly Retrieval- A Synthetic Video-Text Benchmark arXiv (2025.06.02).
  17. SurveillanceVQA-589K A Benchmark for Comprehensive Surveillance Video-Language Understanding with Large Models. arXiv (2025.05.19).
  18. Phys-AD Towards Visual Discrimination and Reasoning of Real-World Physical Dynamics- Physics-Grounded Anomaly Detection. arXiv (2025.03.26).
  19. VAD-LLaMA Video Anomaly Detection and Explanation via Large Language Models. arXiv. (2024.01.11).
  20. LAVAD Harnessing Large Language Models for Training-free Video Anomaly Detection. CVPR (2024).
전체 11

  • 2025-07-27 22:11

    Video anomaly detection은 정말 생소한 분야였는데, 2회에 걸친 이번 세미나를 통해 전반적인 내용들을 알아갈 수 있었습니다. 우선 이미지와 달리, 영상 이상치 탐지에서는 인간의 이상행동에 주로 집중한다는 점이 흥미로웠습니다. 데이터 수집의 주요한 수단이 CCTV이다 보니 자연스럽게 인간의 이상행동을 일반적인 타겟으로 설정하게 된 것인지, 아니면 시간적으로 dynamic한 양상을 보일 만한 것이 인간의 행동 외에 잘 없기 때문인지는 모르겠으나 그래도 사물에 대한 비디오 이상치 탐지 사례들도 궁금해지는 대목이었습니다. 아무튼 주로 인간의 이상행동을 다루다보니 여러 형태의 범죄와 같은 semantic한 정보를 포착해야 하는 경우가 많고, 따라서 LLM을 자연히 쓰게 되는 흐름으로 이어진 것 같습니다. 다만 분야의 역사가 길지 않다보니 초기 연구들의 방법론에 정합성이 아직은 다소 부족해보이는 인상을 받기도 했습니다만, 그렇기에 오히려 새롭고 다양한 아이디어가 시도될 수 있는 시기인 듯해 재미있었습니다. 앞으로 여러 새로운 데이터셋들의 등장과 LLM의 발전이 video anomaly detection 분야의 성숙으로 이어지기를 기대하게 되었습니다. 새로운 분야와 초기 연구들을 소개해주셔서 감사합니다!


  • 2025-07-27 22:46

    이번 세미나는 최근 비디오 이상치 탐지 연구 분야의 흐름들, 데이터셋부터 평가, 그리고 LLM을 사용한 비디오 이상치 탐지에 대한 내용을 중심으로 진행되었습니다. 첫 번째로 Anomaly Predictor와 LLaMA를 사용한 Weakly Supervised Learning을 통해 비디오 이상치 탐지를 수행하는 VAD-LLaMA라는 방법론에 대해 소개해주셨습니다. 이 과정에서 비디오를 클립들로 분할할 때, Instance에 대한 Label은 없이 묶음 단위로 Label이 구성되어 있을 때 Multiple Instance Learning(MIL)을 사용한다는 점 및 실제 이미지에 대한 AD를 수행하는 경우에도 패치 단위로 MIL을 통해 학습할 수 있다는 점이 매우 흥미로웠습니다. 그러나 해당 방법론의 경우 LLM이 비디오 이상치 탐지에서 기여하는 부분이 매우 작다는 느낌이 들었고, 굳이 LLaMA를 왜 사용해야 했는지에 대한 고민이 생겼습니다. 두 번째로는 이미지 캡셔닝, 비디오 인코더, LLM을 활용해 Unsupervised Learning 방식으로 프레임 단위로 Anomaly Score를 생성하여 이상치 탐지를 학습하는 LAVAD라는 방법론을 소개해주셨습니다. 해당 방식에서는 Text Description을 캡셔닝 모델을 통해 생성하고, 이를 프레임마다 매칭시켜 LLM을 통해 Anomaly Score를 산출하는 방식 자체가 좀 더 LLM을 비디오 이상치 탐지에 잘 활용한 연구라는 생각이 들었습니다. 이번 세미나를 통해 비디오 이상치 탐지에 대한 관심이 많이 늘어날 수 있는 시간이 된 것 같습니다. 좋은 발표 해주셔서 감사합니다.


  • 2025-08-03 14:35

    이번 세미나에서는 “Recent Advances in Video Anomaly Detection”이라는 제목으로, 영상 기반 이상 탐지(Video Anomaly Detection, VAD)의 최신 연구 흐름을 정리해주셨습니다. 발표는 VAD의 전통적인 접근 방식에서부터 최근의 고도화된 모델까지 흐름을 따라 설명되었으며, 특히 이상 이벤트의 정의, 공간-시간 정보 활용, 주석 데이터의 한계 등 실제 응용에서 마주치는 근본적인 문제들을 중심으로 잘 정리해 주신 점이 인상 깊었습니다. 초기에는 예측 기반(Prediction-based)이나 재구성 기반(Reconstruction-based) 방법들이 주를 이뤘지만, 최근에는 정교한 지도 학습, 클립 단위 특징 활용, 및 새로운 이상 정의 기반 모델들이 활발히 연구되고 있음을 소개해 주셨습니다. 특히 이상을 정량적으로 정의하기 어려운 특성상, 비지도 학습 혹은 약지도 학습 기반 접근들이 어떻게 설계되고 있는지를 구체적인 사례와 함께 설명해 주셔서 이해에 도움이 되었습니다. 또한, 발표에서는 기존 모델들이 정적인 환경에서는 잘 작동하나, 실제 환경에서는 다양한 움직임과 배경 노이즈 등으로 인해 성능이 저하되는 문제도 언급되었고, 이를 극복하기 위한 공간-시간적 정합성 확보, 다중 모달 정보 활용 등 최신 트렌드도 함께 짚어주셨습니다. 종합적으로 이번 발표는 영상 기반 이상 탐지 분야의 기술적 흐름과 도전 과제를 균형 있게 다뤄주셔서, 향후 관련 연구를 준비하시는 분들에게 유익한 가이드가 되었을 것이라 생각됩니다. 좋은 발표 감사합니다!


  • 2025-08-03 15:50

    이번 세미나에서는 비디오 이상치 탐지에 대한 과업이 다루어졌습니다.비디오 이상치 탐지 개론에 버금가는 설명을 해주셨습니다. 비디오에서의 이상, 즉 정상이 아닌 것에 대한 정의는 다양할 수 있어 일반적인 이미지 이상치 탐지에 비해 매우 어렵습니다. 그래도 비교적 라벨링이 쉬운 상황은 에스컬레이터에서 반대방향으로 가는 승객, 지하철 입구에서 카드를 대지 않고 뛰어 넘어 가는 등의 행위가 대표적일 것입니다. 아마 많이 사용될 수 있는 곳은 보안구역 내의 침입 행위를 탐지할 때이지 않을까 생각됩니다. 더불어 여러 군의 방법론도 함께 소개되었는데, 그 중 frame 별 description을 이용하는 경우는 finetuning 용으로는 현실적이지 못하고 foundation 모델이나 pre-trained 모델을 생성할 때 활용될 수 있지 않을까 싶습니다. 현실적인 상황에서는 unsupservised 방식으로, 프레임 단위로 진행하며, 앞선 프레임들과의 비교를 통한 anomaly score를 산출하는 방식으로 보아야 하지 않을까 싶습니다. 앞으로도 연구실에서 비디오 이상치 탐지 연구들이 많이 소개되길 희망해봅니다.


  • 2025-08-04 10:16

    이번 세미나에서는 Video Anomaly Detection(VAD)이라는 비교적 생소하지만 최근 주목받고 있는 분야에 대해 다루어 주셨습니다. 이미지 이상탐지와는 달리 시간 축의 연속성과 문맥(context)의 흐름이 중요한 이 분야에서, 초기에는 주로 재구성 기반이나 예측 기반 접근이 주를 이뤘지만, 점차 지도/약지도 학습과 LLM을 활용한 방법론으로 확장되고 있다는 점이 인상 깊었습니다. 특히 Multiple Instance Learning(MIL)을 기반으로 클립 단위의 비정상 탐지를 수행하거나, 프레임별 description과 LLM을 결합해 비지도 방식으로 anomaly score를 생성하는 연구들은, VAD의 고질적인 labeling 문제를 흥미롭게 풀어내고 있다는 생각이 들었습니다. 다만 일부 방법에서는 LLM의 활용이 상대적으로 제한적인 경우도 있었고, 실제 환경에서의 적용 가능성에 대한 고민이 더해질 필요도 느꼈습니다. 그럼에도 불구하고, 본 세미나는 VAD 분야의 기술적 흐름과 그 한계, 그리고 향후 발전 방향까지 폭넓게 조망할 수 있는 좋은 기회였습니다. 좋은 발표 감사합니다!


  • 2025-08-04 15:11

    이번 세미나는 “Recent Research Trends in Video Anomaly Detection”을 주제로, 최근 VAD(Video Anomaly Detection) 분야에서 주목받고 있는 연구 흐름을 체계적으로 정리해주셨습니다. 먼저 benchmark dataset 측면에서는 기존보다 해상도가 높고, 다양한 뷰포인트와 시나리오, 이상 행동 유형을 포함한 영상들이 활용되는 추세를 소개해주셨고, 텍스트 기반 어노테이션의 추가, 합성 데이터 생성 기법의 활용 등 데이터 구성 방식의 다양화를 실감할 수 있었습니다. 또한 evaluation 관점에서는 기존의 frame-level AUROC 외에도 RBDC, TBDC 같은 시간 민감형 지표를 도입하여 단순 정확도뿐 아니라 탐지 시점의 민감도와 지연까지 정량화하려는 시도들을 소개해주셨습니다. 또한 멀티모달 LLM의 활용 사례도 함께 다뤄져 최근 VAD의 연구 방향성을 실감할 수 있었습니다. 이번 발표를 통해 VAD 분야에 대한 이해를 높일 수 있었고, 도전 과제까지 생각해볼 수 있는 유익한 시간이었습니다. 좋은 발표 감사합니다!


  • 2025-08-07 11:06

    이번 세미나는 기존 연구실에서 다소 소외되어 있던 Video Anomaly Detection 분야를 다시 조명해보는 좋은 기회였습니다. 시간 정보까지 포함한 비디오 데이터에서의 이상치 탐지가 단순히 이미지 기반의 AD와는 본질적으로 다르며, 특히 인간의 행동에 집중하는 경향이 있다는 점이 인상 깊었습니다. 발표에서 소개된 다양한 데이터셋과 그 진화 과정, 특히 pedestrian 중심의 초기 데이터에서 crime/industrial 등 다양한 도메인으로의 확장을 통해 VAD의 스케일과 복잡도가 얼마나 커졌는지를 실감할 수 있었습니다.

    또한, LLM을 활용한 방법론들(VAD-LLaMA, LAVAD 등)을 통해 기존 feature-based 접근에서 semantic-level로 넘어가려는 시도들도 엿볼 수 있었고, 이를 통해 비지도 학습과 약지도 학습의 필요성과 어려움도 함께 생각해보게 되었습니다. 특히 텍스트 설명을 기반으로 이상 여부를 판별하려는 최근 연구들이 기존의 labeling 이슈를 어떻게 풀어가고 있는지를 소개해 주신 점이 유익했습니다.

    다만, LLM이 항상 필수적인가에 대한 고민은 여전히 유효하다고 느껴졌고, 모델의 해석력이나 실제 적용 가능성 측면에서도 앞으로 더 많은 논의가 필요하겠다는 생각이 들었습니다. 그럼에도 불구하고 영상 이상 탐지 분야가 기술적, 실용적 측면 모두에서 큰 잠재력을 가지고 있다는 점에는 깊이 공감하며, 앞으로의 발전이 더욱 기대되는 분야라는 인상을 받았습니다. 2차시에 걸쳐 좋은 발표 진행해 주셔서 감사합니다 🙂


  • 2025-08-07 12:49

    금일 세미나는 Recent Video Anomaly Detection Research Trends를 주제로, 비디오 이상 탐지에 대한 개괄적인 설명과 함께 주요 벤치마크 데이터셋 및 평가 지표에 대해 다뤄주셨습니다. 또한, 최근 활발히 연구되고 있는 대규모 언어 모델(LLM) 기반의 비디오 이상 탐지 기법도 함께 소개해주셨습니다. 비디오 데이터는 기본적으로 시간 정보가 포함된 연속적인 이미지 시퀀스로 구성되어 있으며, 정적인 이미지와 달리 동적인 변화나 행동 패턴의 이상 여부를 탐지하는 것이 주요 과제입니다. 특히, MVTec 데이터셋과 같이 고장이나 불량을 다루는 기존 비정상 탐지와는 다르게, 비디오에서는 비정상적인 행동이 주요 탐지 대상이기 때문에, 이상 행동의 정의 자체가 분석의 핵심 요소가 됩니다. 비디오 이상 탐지를 위한 벤치마크 데이터셋은 기존 공개 데이터 또는 인터넷 기반 영상, 그리고 최근에는 생성 모델을 활용한 합성 데이터 등을 통해 구성되고 있습니다. 평가 방식은 주로 frame-level, pixel-level 평가로 나뉘며, 대표적인 정량 지표로는 F1-score, Average Precision (AP), AUROC 등이 사용됩니다. 여기에 더해, 공간적 정밀도를 평가하는 Region-based Detection Criterion (RBDC)와 시공간적 일관성을 측정하는 Track-based Detection Criterion (TBDC) 등의 고차원 평가 지표도 함께 활용되고 있음을 알 수 있었습니다. 또한, 최근 연구 동향에서는 LLM 기반의 prompt를 활용하여 temporal information을 반영하고, 학습 없이도 이상을 탐지하는 training-free 접근 방식도 활발히 시도되고 있음을 알게 되었습니다. 처음 접하는 분야이기 때문에 생소했지만, 상세하게 설명해주신 덕분에 수월하게 이해할 수 있었습니다. 좋은 발표 정말 감사드립니다.


  • 2025-08-08 12:45

    이번 세미나는 최근 주목받고 있는 Video Anomaly Detection (VAD) 분야의 최신 연구 흐름과 도전 과제를 폭넓게 다루어 주셨습니다.
    VAD의 기본 개념부터 시작하여, 데이터셋 구성 방식, 평가 지표, 그리고 최신 딥러닝 및 LLM(대규모 언어 모델) 기반 접근법까지 체계적으로 정리해주셨습니다.
    특히 VAD-LLaMA처럼 MIL(Multiple Instance Learning) 기법을 활용해 클립 단위로 이상 여부를 판단하거나, LAVAD와 같이 비디오의 프레임별 텍스트 설명을 생성해 이를 기반으로 LLM을 활용해 anomaly score를 산출하는 방식은 기존의 feature 기반 탐지에서 semantic 기반 탐지로 확장되고 있음을 잘 보여주었습니다.
    또한, 기존의 frame-level AUROC 등의 전통적인 평가 지표 외에도 RBDC나 TBDC 같은 시공간적 민감도를 반영한 지표들이 소개되면서, VAD 평가에서의 실질적인 고민과 그에 대한 대안까지 짚어볼 수 있었습니다.
    이번 세미나는 VAD 분야에 대한 전반적인 이해를 높이는데 도움이 되었던 시간이었습니다. 좋은 발표 준비해주셔서 감사드립니다.


  • 2025-08-10 21:30

    금일 세미나는 지속적으로 연구되어 온 Video Anomaly Detection 분야의 데이터셋 구조와 모델 구조에 대해 다양한 방법론들을 접할 수 있는 기회였습니다. 특히 데이터셋 측면에서는 기존 이미지나 시계열 데이터의 특성을 모두 가지고 있어서 프레임 단위, 비디오 단위, 객체 단위의 annotation이 존재하고 그 도메인이 일반 cctv부터 시작해 다양한 분야로 확산되고 있는 것을 알 수 있었습니다. 기존에 연구실에서 주로 다루던 공정 내 이상치와 다르게 이전 행동들과 다른 행동을 하거나 타 객체들과 다른 행동을 하는 객체들을 탐지하는데 주로 초점이 맞추어져 있었습니다. 또한, 모델 관점에서도 LLM을 기반으로 하는 temporal information을 반영하거나 training-free 접근법이 활발히 연구되는 등 기존의 Industrial AD와 크게 다르지 않은 모습을 보였습니다. 산업 공정 내에서 비디오 데이터를 통한 이상치 탐지가 기존의 이미지 기반에 비해 가질 수 있는 장점들이 분명히 존재할 것으로 보여 이에 대한 연구들이 앞으로 기대됩니다. 좋은 발표 감사합니다.


  • 2025-08-11 14:59

    이번 세미나에서는 비디오 이상 탐지(Video Anomaly Detection, VAD)의 최신 동향을 주제로, 데이터셋과 평가 방법부터 LLM을 활용한 접근까지 폭넓게 다뤄주셨습니다. 먼저 Anomaly Predictor와 LLaMA를 결합해 약지도 방식으로 학습하는 VAD-LLaMA를 소개하며, 클립 단위 라벨링에서 Multiple Instance Learning(MIL)을 적용하는 방식이 흥미로웠습니다. 다만 LLM이 기여하는 비중이 크지 않아 LLaMA 사용의 필요성은 의문이 남았습니다. 이어 이미지 캡셔닝과 비디오 인코더, LLM을 활용해 프레임별 anomaly score를 생성하는 비지도 방식 LAVAD가 소개되었는데, 이 경우 LLM을 탐지 과정에 보다 적극적으로 활용한 설계가 인상적이었습니다. 전반적으로 VAD가 이미지 이상 탐지와 달리 시간적 연속성과 문맥 정보를 다뤄야 하는 특수성을 잘 이해할 수 있었고, 약지도·비지도 학습을 통한 라벨링 한계 극복 시도가 특히 흥미로웠던 발표였습니다. 좋은 발표 감사합니다.


전체 532
번호 제목 작성자 작성일 추천 조회
공지사항
Paper Reviews 2019 Q3
관리자 | 2020.03.12 | 추천 0 | 조회 13120
관리자 2020.03.12 0 13120
공지사항
Paper Reviews 2019 Q2
관리자 | 2020.03.12 | 추천 0 | 조회 11893
관리자 2020.03.12 0 11893
공지사항
Paper Reviews 2019 Q1
관리자 | 2020.03.12 | 추천 0 | 조회 12881
관리자 2020.03.12 0 12881
519
[Paper Review] From Local to Global: A GraphRAG Approach to Query-Focused Summarization (8)
Doyoon Kim | 2025.08.15 | 추천 0 | 조회 581
Doyoon Kim 2025.08.15 0 581
518
[Paper Review] AutoUAD: Hyper-parameter Optimization for Unsupervised Anomaly Detection (5)
Woojun Lee | 2025.08.12 | 추천 0 | 조회 334
Woojun Lee 2025.08.12 0 334
517
[Paper Review] Prototype-oriented unsupervised anomaly detection for multivariate time series (10)
Suyeon Shin | 2025.08.08 | 추천 0 | 조회 588
Suyeon Shin 2025.08.08 0 588
516
[Paper Review] HDMixer: Hierarchical Dependency with Extendable Patch for Multivariate Time Series Forecasting (11)
Sunghun Lim | 2025.08.04 | 추천 0 | 조회 457
Sunghun Lim 2025.08.04 0 457
515
[Paper Review] Multi-Scale Finetuning for Encoder-based Time Series Foundation Models (9)
Hyeongwon Kang | 2025.07.29 | 추천 0 | 조회 642
Hyeongwon Kang 2025.07.29 0 642
514
[Paper Review] Recent Research Trends in Video Anomaly Detection (11)
Jaehyuk Heo | 2025.07.27 | 추천 0 | 조회 691
Jaehyuk Heo 2025.07.27 0 691
513
[Paper Review] Introduction to PINN (Some basic concepts and research directions) (11)
Hankyeol Kim | 2025.07.18 | 추천 0 | 조회 2190
Hankyeol Kim 2025.07.18 0 2190
512
[Paper Review] TimeCMA: Towards LLM-Empowered Multivariate Time Series Forecasting via Cross-Modality Alignment (10)
Sieon Park | 2025.07.14 | 추천 0 | 조회 757
Sieon Park 2025.07.14 0 757
511
[Paper Review] Exploring Intrinsic Normal Prototypes within a Single Image for Universal Anomaly Detection (9)
Subeen Cha | 2025.07.10 | 추천 0 | 조회 502
Subeen Cha 2025.07.10 0 502
510
[Paper Review] Theory of Everything (About Sequence Modeling with DL Models…) (14)
Jaewon Cheon | 2025.06.27 | 추천 0 | 조회 745
Jaewon Cheon 2025.06.27 0 745

Data Science & Business Analytics Lab.
Department of Industrial Engineering, College of Engineering,
Seoul National University

Contact Us

  • 강필성 교수 (pilsung_kang@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 301호 
  • 대학원 연구실 (총무 김도윤: doyooni303@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 411호