Topic
Overview
발표자료 및 발표영상
참고문헌
번호 | 제목 | 작성자 | 작성일 | 추천 | 조회 |
공지사항 |
Paper Reviews 2019 Q3
관리자
|
2020.03.12
|
추천 0
|
조회 10891
|
관리자 | 2020.03.12 | 0 | 10891 |
공지사항 |
Paper Reviews 2019 Q2
관리자
|
2020.03.12
|
추천 0
|
조회 9547
|
관리자 | 2020.03.12 | 0 | 9547 |
공지사항 |
Paper Reviews 2019 Q1
관리자
|
2020.03.12
|
추천 0
|
조회 10646
|
관리자 | 2020.03.12 | 0 | 10646 |
509 |
[Paper Review] Evaluation of Multilingual Image Captioning: How far can we get with CLIP models? (12)
Minjeong Ma
|
2025.06.07
|
추천 0
|
조회 140
|
Minjeong Ma | 2025.06.07 | 0 | 140 |
508 |
![]()
Minjeong Ma
|
2025.06.02
|
추천 0
|
조회 36
|
Minjeong Ma | 2025.06.02 | 0 | 36 |
507 |
![]()
Kiyoon Jeong
|
2025.06.02
|
추천 0
|
조회 33
|
Kiyoon Jeong | 2025.06.02 | 0 | 33 |
506 |
![]()
Woongchan Nam
|
2025.06.02
|
추천 0
|
조회 32
|
Woongchan Nam | 2025.06.02 | 0 | 32 |
505 |
![]()
SangMin Lee
|
2025.06.02
|
추천 0
|
조회 34
|
SangMin Lee | 2025.06.02 | 0 | 34 |
504 |
[Paper Review] Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems (12)
Siyul Sung
|
2025.05.31
|
추천 0
|
조회 231
|
Siyul Sung | 2025.05.31 | 0 | 231 |
503 |
[Paper Review] Restructuring Vector Quantization with the Rotation Trick (16)
Woojun Lee
|
2025.05.20
|
추천 0
|
조회 258
|
Woojun Lee | 2025.05.20 | 0 | 258 |
502 |
[Paper Review] Battling the Non-stationarity in Time Series Forecasting via Test-time Adaptation (16)
Jinwoo Park
|
2025.05.16
|
추천 0
|
조회 236
|
Jinwoo Park | 2025.05.16 | 0 | 236 |
501 |
[Paper Review] SD-LoRA: Scalable Decoupled Low-Rank Adaptation for Class Incremental Learning (18)
Hun Im
|
2025.05.15
|
추천 0
|
조회 219
|
Hun Im | 2025.05.15 | 0 | 219 |
500 |
[Paper Review] AA-CLIP: Enhancing Zero-Shot Anomaly Detection via Anomaly-Aware CLIP (18)
Junyeong Son
|
2025.05.08
|
추천 0
|
조회 386
|
Junyeong Son | 2025.05.08 | 0 | 386 |
이번 세미나는 이미지 데이터를 대상으로 하는 이상치탐지 과업을 주제로 소개되었습니다. 발표자 분께서 여러가지의 경우, 즉 정상/비정상 데이터의 label의 유무에 따른 다양한 경우를 잘 분류하여 설명해주셨습니다. 말씀주신대로 수업시간에 배운 이상치 탐지라 하믄 정상 데이터만으로 모델을 학습한 뒤 학습된 데이터와 특징이 다른 데이터를 찾아내게끔 하는 One-Class Classification으로만 생각을 하게 됩니다. 허나 소개해주신 바와 같이 Fully supervised 상황부터 Semi-supervised, Unsupervised 등 다양한 상황에서 적용할 수 있는 방법론들이 지속해서 연구되어오고 있습니다. 오늘 소개해주신 논문에서는 각각 비지도학습과 준지도학습의 상황에서 적용할 수 있는 방법론을 소개하고 있습니다. 비지도학습 방법론의 경우 Data-refinement라 하여 일련의 과정을 거쳐 라벨이 없는 샘플 중 이상치로 여겨지는 것들을 제외할 수 있도록 합니다. 중요한 점은 unsupervised setting의 경우 validation을 진행하지 않기 때문에 이상치의 기준(threshold)을 잘 구하는 것이 중요합니다. 결과적으로 unlabeled 데이터를 이용해 서로 다른 K개의 One-class classifier(OCC)들을 이용해서 공통적으로 이상치라고 예측되는 샘플들을 제외한 샘플들로 최종 OCC를 학습하게 되며 이는 self-supervised의 방식을 이용하는 것으로 볼 수 있습니다. 두번째 논문은 준지도학습 방식의 이상치탐지 방법론으로 labeled(정상+비정상), unlabeled 된 데이터를 모두 이용하는 방법론입니다. 본 방법론의 핵심은 unlabeled data를 partial matching method를 적용하여 정의된 기준을 통해 pseudo labeling을 한 후 이용하는 것입니다. 이때 여전히 label이 되지 않는 샘플은 활용되지 않습니다. 이미지 이상치 탐지 과업은 실생활에서 바로 적용 가능하기 때문에 개인적으로 큰 흥미를 느끼는 분야입니다. 특히 발표자 분께서 설명하신 unsupervised나 semi-supervised 상황의 방법론들의 활용도는 매우 커보입니다. 자세한 설명에 깊은 감사드립니다.
본 세미나는 허재혁 발표자님께서 "Data Refinement for Real-world Anomaly Detection Applications"이라는 논문을 바탕으로 진행해주셨습니다. 해당 논문은 Anomaly detection task에서 새로운 모델이 아닌 data를 refinement하는 framework를 제안한 논문으로써, label이 없는 현실적인 상황에서 모델을 학습하기 위한 refinement 방법론과, labeled와 unlabeled data 간 distribution이 다를 때 unlabled data를 학습에 활용하기 위한 refinement를 제안하는 방법론. 총 2개의 논문을 준비해주셨습니다. 먼저 첫 번째 논문은 Unsupervised anomaly detection을 가정하여 이상치 탐지 모델을 학습하는 것으로, Data-refinement를 반복적으로 수행하여 unlabeled data로부터 이상치 data를 제외하고 있습니다. 따라서 inference에서 모든 one-class-classifier가 이상치로 판단한 sample만 데이터에서 제외한다는 점이 크리티컬하다고 생각하였습니다. 두 번째 논문은 Semi-supervised anomaly detection을 가정하여 모델을 학습하는 것으로, anomaly ratio를 고려하여 새로운 유형의 이상치에 대해서도 robust한 성능을 뽑아내고 있습니다. 특히 ratio를 뽑기 위해, pseudo labeler를 사용하고 있는데 partial matching method로 labeled와 unlabeled score 거리가 가장 작은 threshold를 탐색하는 것이 가장 크리티컬하다고 생각하였습니다. 해당 세미나를 들으면서, anomaly detection에서 data를 refinement하는 것이 얼마나 중요하고 방법론 간 차이를 알 수 있었습니다. task에 대한 모델 뿐만이 아닌, data가 중요해지는 상황에서 트렌드에 맞는 좋은 논문들을 바탕으로 세미나 준비해주셔서 감사합니다.
금일 세미나시간에는 허재혁 박사과정이 “Data Refinement” for real-world Anomaly Detection Applications 라는 주제로 이상치 탐지에서 기존과 다른 새로운 모델 방법론의 소개가 아닌 data-refinement 시각에서의 프레임워크에 대한 접근을 소개해주었습니다. 우선 세미나 서두에서 다양한 anomaly detection의 setting에 대해서 하나씩 나열하며 정리를 하였는데, 이 부분이 너무 좋았습니다. 개인적으로도 이상치 탐지와 관련하여 논문을 작성하거나 선행연구를 follow up 하면서 항상 애매하던 부분이 이상치 탐지에 대한 setting과 용어 정리이었는데, 각 setting에 대한 친절한 데이터 시각화 자료를 통해서 용어를 잘 정리해줘서 너무나 좋았습니다. 실질적인 첫번째 논문인 “SRR:Self-supervised, Refine, Refeat” 는 unsupervised anomaly detection에 대한 연구로, self-supervised를 활용하여 단일 클래스 분류의 성능을 개선하고자 하였습니다. 제안하는 프레임워크의 큰 틀은 단순한 Gaussian density Estimation과 같은 one-class self-supervised 모델을 여러 개의 ensemble을 통해서 전체적인 이상치 탐지 성능을 끌어올리고자 하였는데, 어떻게 보면 기존 ensemble classification 모델의 Anomaly detection 버전이라는 느낌을 많이 받았습니다. 단순한 GDE같은 단일모델을 random한 data subset을 통해 다양한 모델을 구성하고 이를 통해서 모델의 성능 향상을 도모하겠다는 motivation이 매우 유사한 느낌을 받았습니다. 두번째로 소개한 “SPADE: Semi-supervised Pseudo labeler Anomaly Detection with Ensembling” 은 앞선 전자의 논문에서 좀더 고도화된 모델로 전자의 프레임워크를 Semi-supervised anomaly detection으로 확장한 연구로, label이 존재하는 데이터와 unlabeled 데이터 간의 분포차이 문제와 무관하게 OCC의 ensemble을 통한 Pseudo labeler의 수행을 통해 적절한 labeling이 가능하게 합니다. 우선 해당 Pseudo labeler의 역할 수행과정을 논문에서는 매우 불친절하게 글로만 작성된 상황에서, 이를 준비한 발표자가 세미나를 위해서 toy example을 통해서 그 과정을 하나씩 follow up 할 수 있어서 너무 쉽게 이해할 수가 있었습니다. 이점은 정말 칭찬하고 감사하다고 말하고 싶습니다.
이번 세미나는 Data Refinement for Real-world Anomaly Detection Applications이라는 주제를 바탕으로 진행되었습니다. 발표자분이 가장 핵심적으로 말하고 있던 것은 이상치 탐지를 위한 새로운 모델을 제안하고 있는 것이 아니라, 현실적인 Real-world의 이상치 탐지를 수행하기 위한 Data-refinement Framework 제안하고 있다는 것이었습니다. 먼저 첫 번째로 준비해주신 SRR: Self-supervised, Refine, Repeat 이라는 Framework에서는 Unsupervised anomaly detection을 가정하여, 즉 데이터들은 주어져 있지만 이상치인지 정상인지 Labeling이 되어 있지 않은 데이터들로부터의 이상치 탐지 모델을 학습하며, 이때 Data-refinement를 반복적으로 수행하여 Unlabeled data로부터 이상치 데이터를 제외하고 있었습니다. 다음으로 설명해주신 SPADE 라는 Framework에서는 Semi-supervised anomaly detection, 즉 Unlabeled data와 이상치, 정상 데이터가 섞여 있는 형태를 가정하여 이상치 탐지 모델을 학습하고 있었습니다. 이때, Partial matching method를 적용한 Pseudo labeler를 통하여 Anomaly ratio를 고려한 threshold를 탐색하여 더 효율적으로 Thresholding을 진행하고 있었습니다. 이러한 내용 외에도 Background로서 다양한 Anomaly detection case들에 대하여 설명해 주셨는데, 기본적으로 제가 알고 있던 Anomaly detection은 정상 데이터들만을 가지고 정상 데이터들이 가지는 Representation을 학습하고, 이후 비정상과 정상 데이터들이 섞여 있는 데이터를 통하여 Test 한다는 생각 자체가 Anomaly detection이라는 분야에서 매우 작은 부분이고, 더 다양한 Case들이 존재한다는 것을 알 수 있었습니다. 많은 것을 배워갈 수 있었던 세미나였고, 좋은 발표 정말 감사드립니다.
오늘 세미나는 이상치 탐지를 위한 data-refinement framework 제안한 두 논문을 중심으로 진행되었습니다. 구체적으론, Dataset의 레이블링이 힘든 이상치 탐지 과업에서 진정한 의미의 비지도 학습 방식의 모델링을 위한 framework를 제안합니다. 첫번째 논문인 "SRR: Self-supervised, Refine, Repeat"에선 Unlabeled data를 One-class Classifier에 입력한 뒤, 설정한 threshold와 출력된 Anomaly score를 기반으로 unlabeled data에 대한 label을 생성합니다. 이 과정에서, 모든 OCC가 positive (이상치)로 분류한 sample만 데이터 셋에서 제외합니다. 이러한 과정을 여러 번 반복하면서 unlabeled dataset에서 여러 번의 turn을 거쳐 이상치로 판단할 수 있는 sample을 제외합니다. 실제 실험에서 이러한 방식의 비지도 학습 방식을 통해 제외된 positive sample의 비율은 anomaly ratio와 유사한 것으로 보였습니다. 따라서, label이 없는 raw한 데이터를 train부터 inference까지 label이 전혀 필요 없는 진정한 비지도 학습 방식의 이상치 탐지 모델링이 가능해집니다. 두 번째 논문인 "SPADE: Semi-supervised Pseudo labeler Anomaly Detection under Distribution Mismatch" 역시도 비지도 학습을 위한 pseudo labeling 방식의 방법론을 제안합니다. 구체적으로, 여러 개의 OCC가 만장일치의 결과를 도출하였을때만 해당 sample에 대한 pseudo label을 생성한 뒤 데이터 셋에서 배제하는 것입니다. 이때 labeled와 unlabeled 데이터의 anomaly score간의 거리를 최소로 하는 threshold를 기준으로 pseudo labeling을 수행합니다. 발표자분께서도 언급하신 바와 같이, 향후 이상치 탐지 과업이 OCC 방식에 집중하여 다른 가능성을 간과하지 않고 있나 하는 생각이 들기도 했습니다. 자세하고 디테일한 설명 덕분에 좋은 내용을 수월하게 이해할 수 있었습니다. 좋은 발표 감사합니다.
금일 세미나는 실제 환경에서 Anomaly Detection 태스크를 수행하기 위한 다양한 조건 및 각 조건에서의 모델링을 위한 이슈들을 점검해볼 수 있는 시간이었습니다. 특히 모델 학습 과정에서 정상/비정상 데이터의 존재와 레이블 여부에 따라 다른 접근 방식을 취해야 한다는 발표자님의 이야기와 달라지는 고려점들에 대해 매우 인상깊은 시간이었습니다. 흔히 생각하기로 Anomaly Detection은 normal 데이터가 존재하는 상황에서 모델을 학습하고, 비정상 데이터를 탐지한다고 하지만, 실제 환경에서는 1. 데이터 자체가 충분치 못하거나 2. 데이터 내 정상/비정상의 유무를 판단하는 작업조차 힘든 경우가 많습니다. 그러므로 각 상황에 따라 발표에서는 총 7가지 분류로 나누고 있고, 단순 One-Class Classification의 접근 방식 뿐만 아니라 Full/Semi/Un-supervised Learning 환경이 고려되어야 합니다. 특히 중점적으로 다루어진 SRR은 정상/비정상 여부를 알 수 없는 상황에서 Representation Learner와 One-Clss Classifier를 분리하여 데이터를 정제하고 있습니다. 각 구조가 특별한 설계가 담겨있지 않지만, Otsu 's Method를 이용하여 Unsupervised 환경에서 Anomaly Score를 산출하는 등의 고려가 매우 극한의 Unsupervised 상황을 최대한 담고자 노력한 흔적이 돋보였습니다. 또한 SPADE에서는 학습 데이터와 다른 Distribution Shift가 발생한 경우에도 Robust한 성능을 가질 수 있도록, Semi-Supervised 상황에서 두가지 Loss를 통해 학습하는 모습을 볼 수 있었습니다. 그간 연구실에서 매우 다양한 Anomaly Detection 연구들이 다루어져 왔으나, 대부분 OCC 상황이었다는 점과 실제 프로젝트 등에서는 데이터 확보부터 문제가 된다는 점을 고려한다면, Anomaly Detection의 실제 세계 적용을 위해서는 발표자님의 말씀처럼 더욱 다양한 환경에 대한 연구가 필요할 것으로 보입니다. 좋은 발표 감사드립니다.
금일 세미나는 실제 환경에서의 이상치 탐지를 위한 Data Refinement라는 주제를 바탕으로 두가지 논문을 바탕으로 진행되었습니다. 각 논문은 어떻게 데이터를 더욱 효율적으로 활용하여 이상치를 탐지할 수 있는지에 초점을 맞추었습니다. 현실 세계에서는 완벽한 레이블링이 어려운 경우가 많기 때문에, 이러한 방식의 연구는 매우 가치 있게 다가왔습니다. 첫 번째 논문은 Self-supervised 방식을 이용하여 unlabeled data를 정제하는 과정을 자세히 살펴보았습니다. 논문에서 제시된 방법론은 기존의 방법들보다 더욱 효과적으로 데이터의 정확도를 높이면서 이상치를 탐지하는 데 기여한다는 점에서 매우 인상적이었습니다. 두 번째 논문에서는 데이터의 분포 차이를 고려하여 pseudo labeling을 수행하는 방식에 대해 깊이 있게 다루었습니다. 다양한 OCC 모델들과의 통합적인 접근을 통해, 실제 환경에서의 데이터 변동성에도 강한 이상치 탐지 모델을 구축하는 방법에 대한 통찰을 제공하였습니다. 발표자분의 철저한 준비와 설명 덕분에, 복잡한 데이터 환경에서의 이상치 탐지 문제에 대한 깊은 이해와 해결책을 얻을 수 있었습니다. 실제로, 많은 기업과 연구기관에서는 이러한 문제에 직면하는 경우가 많아, 오늘의 세미나는 매우 가치 있는 시간이었습니다. 비정상 데이터와 정상데이터가 혼재되어 있는 실제상황 아래에서 보다 다양한 관점에서의 Anomaly Detection task를 소개해주시고 설명해주셔서 감사합니다.
이번 세미나에서는 이상치 탐지를 위한 data-refinement framework를 제안하는 두 논문 : “SRR: Self-supervised, Refine, Repeat” 과 “SPADE: Semi-supervised Pseudo labeler Anomaly Detection with under Distribution Mismatch”에 대해 다뤄 주셨습니다. 해당 논문들은 기존의 Image Anomaly Detection에서 수행하던 one-class setting과 정상 데이터만 사용하는 세팅과는 다르게 완전한 unsupervised learning과 labeled 과 unabeled data의 분포가 다른 경우를 위한 data refinement에 대해 다루고 있습니다. 해당 세미나를 들으면서 각 논문들의 방법론 또한 중요하다 생각했지만, 기존의 one-class setting에만 너무 갖혀 있어 이상치 탐지 Task를 본 것은 아닌가 라는 생각을 했습니다. 또한 이상치 탐지 Task는 real-world application과 직접적으로 맞닿아 있는 Task인 만큼 현실의 시나리오를 조금 더 다양하게 고려한 다음 반영할 필요가 있다고 생각이 드는 시간이었습니다. 좋은 발표 감사합니다!
이번 세미나에서는 Data Refinement for Real-world Anomaly Detection Applications 라는 주제로 Self-supervise, Refine, Repeat: Improving Unsupervised Anomaly Detection와 SPADE: Semi-supervised Pseudo labeler Anomaly Detection with Ensembling 라는 두 논문을 다루었습니다. 먼저 Self-supervise, Refine, Repeat: Improving Unsupervised Anomaly Detection에서는 일반적으로 이상치 탐지는 전체 혹은 일부 레이블이 있는 경우에 수행되었지만 실제로는 이상치 탐지를 위한 레이블링이 어렵기 때문에 정상 데이터와 이상 데이터를 모두 포함하지만 레이블이 없는 비지도 학습 상황에서의 방법론을 제안합니다. 이를 위해 self-supervised learning 기법으로 학습된 representation을 기반으로 one-class classification의 robustness를 data refinement를 통해 개선하는 방법을 제안합니다. SPADE: Semi-supervised Pseudo labeler Anomaly Detection with Ensembling 논문에서는 Semi-supervised anomaly detection 상황을 가정하여 이상치 모델을 학습시킵니다. 이 모델의 구조는 첫 번째 논문과 거의 비슷하지만 anomaly ratio를 고려하여 threshold를 정할 수 있고 새로운 유형의 이상치에 대해서도 robust한 성능을 보인다는 특징이 있습니다. 이상치 탐지 상황에 대한 다양한 상황과 접근법을 생각해볼 수 있는 좋은 세미나 시간이었던 것 같습니다. 좋은 발표 감사합니다.
이번 세미나는 “Data Refinement” for Real-world Anomaly Detection Applications라는 주제로 진행되었습니다. 이상치 탐지를 위한 새로운 모델 구조를 제안한 연구가 아닌 Data-refinement 프레임워크를 제안한 두 가지 연구를 소개해 주셨습니다. 첫 번째 연구인 “Self-supervised, Refine, Repeat: Improving Unsupervised Anomaly Detection”에서는 Label이 없는 상황에서 이상치 탐지 모델을 학습하는 상황을, 두 번째 연구인 “SPADE: Semi-supervised Anomaly Detection under Distribution Mismatch”에서는 Labeled Data와 Unlabeled Data의 분포가 다른 경우 Unlabeled 데이터를 학습에 활용하는 상황을 가정하고 있습니다. 발표자 분께서 정하신 주제처럼 실생활에서 이상치라는 것 자체가 정상 데이터에 비해 매우 드물기 때문에 애초에 이상치 유무라는 Label이 없을 수거나 Label이 있더라도 정상 데이터와 분포가 다른 경우가 대다수일 것이라 생각합니다. 첫 번째 연구에서는 Unlabeled Data에 대해서 K개의 OCC를 수립해 독립적으로 Inference를 태우는 방식으로 이상치로 보이는 Sample을 제외하는 방식을 이용해 Data-refinement 과정을 수행했습니다. 두 번째 연구에서는 Encoder, Predictor, Pseudo Labeler, Projection Head로 구성된 모델을 이용해 새로운 유형의 이상치에 대해서도 Robust한 성능을 보이는 방법론을 제안했습니다. 발표자 분께서 도입부에서 말씀해주신 바와 같이 저 또한 정상 데이터만을 이용해 모델을 학습시킨 뒤 이상치 데이터는 Inference에서만 보게 되는 OCC 상황만을 생각했는데 이번 세미나를 통해 시야가 넓어질 수 있었습니다. 좋은 발표 감사드립니다.
이번 세미나에서는 “Data Refinement” for Real-world Anomaly Detection Applications를 주제로 총 2편의 논문을 소개해 주셨습니다. 해당 논문들에서는 라벨이 없거나, 라벨링된 데이터, 라벨링되지 않은 데이터의 분포가 다른 상황에서의 data refinement를 수행하는 내용을 다루고 있습니다. 본 발표에 앞서 다양한 정상, 이상치, 라벨링되지 않은 데이터에 대한 여러가지 anomaly detection setting 및 방법론의 큰 흐름에 대해 쭉 정리해 주셨는데, 추후 발표를 이해하는데 많은 도움이 되었으며, anomaly detection을 공부하는 측면에서 정말 좋은 자료라고 생각되었습니다. 그중에서는 라벨링된 데이터와 라벨링되지 않은 데이터의 분포가 다른 경우, domain-invariant representation을 학습하여 domain shift에도 robust란 성능을 목표로 하는 domain adaptation 세팅이 인상적으로 다가왔습니다. 첫번째 논문에서 소개하고 있는 SRR(Self-supervised, Refine, Repeat)는 라벨링되지 않은 데이터 상황하에서 반복적으로 이상치(positive) 데이터를 제외하는 data refinement를 수행하여 학습하고 있습니다. 이와 같이 라벨링되지 않은 데이터에서 이상치를 제외한다는 점에서, clustering을 기반으로 정상과 이상치 데이터를 나누고 이상치를 제거하는 DUAD와 유사하다고 생각되었습니다. refine과정에서는 K개의 subset으로 나누어 동일 개수의 OCC를 학습하며, Otsu’s method를 이용하여 threshold를 탐색하고, threshold를 기준으로 이상치와 정상 데이터를 나눕니다. 모든 OCC가 이상치로 판단한 샘플을 제외하고, 해당 과정을 반복하여 refinement를 수행합니다. 두번째 논문에서 소개하고 있는 SPADE에서는 semi-supervised anomaly detection을 가정하고 이상치 탐지 모델을 학습합니다. SPADE 의 모듈 중 하나인 pseudo labeler에서는 OCC의 결과에 따라 이상치, 정상 또는 라벨링되지 않은 데이터로 라벨링을 진행합니다. 이때, threshold는 partial matching method를 이용하여 정의하고 있습니다. 끝부분에서 “Easiness” sample만으로 학습한 모델의 실험 결과도 함께 공유해 주셔서 또다른 인사이트를 얻어갈 수 있었습니다. 두편 모두 새로운 이상치 탐지 모델을 제안한 것이 아니라, data-refinement framework를 제안했다는 점에서 재밌게 들을 수 있었습니다. 세미나에서 이상치 탐지 분야를 종종 다루어 주고 계시는데, 양질의 자료로 매번 많이 배워가고 있습니다. 좋은 발표 감사합니다!
본 세미나는 Data Refinement for Real-world Anomaly Detection Applications 라는 주제로 진행되었습니다. 본 세미나를 통해 현실 세계의 다양한 anomaly detection을 위한 setting과 framework에 대해 설명해주셨고, unsupervised 혹은 semi-supervised setting을 위한 data-refinement에 대한 연구를 소개해 주셨습니다. 먼저 unsupervised setting에서는 Self-supervise, Refine, Repeat: Improving Unsupervised Anomaly Detection 라는 주제의 논문에 대한 리뷰를 진행하였습니다. 해당 framework는 Data-refinement를 반복적으로 수행하여 unlabeled data로 부터 positive(이상치) data를 제외하는 과정을 통해 학습이 진행됩니다. 두번째 논문이었던 SPADE: Semi-supervised Anomaly Detection under Distribution Mismatch는 semi-supervised setting에서의 학습에 대한 내용을 다룬 논문입니다. 본 구조는 Semi-supervised anomaly detection (N+P+U)을 가정하여 이상치 탐지 모델을 학습하고, anomaly ratio를 고려하여 threshold를 고려할 수 있습니다. 또한 새로운 유형의 이상치에 대해서도 robust한 성능을 보인다는 특징이 있습니다. Anomaly detection의 경우 당연하게도 train data는 무조건 정상이고, test data에서 anomaly를 detect하는 task라는 관념이 있었는데, 이번 세미나를 통해 소개시켜주신 논문들 덕분에 고정관념을 깰 수 있었습니다. 좋은 발표 감사합니다.
이번 세미나는 “Data Refinement” for Real-world Anomaly Detection Applications를 주제로 진행되었습니다. anomaly detection에 있어서 가용 가능한 데이터들에 따른 세팅에 대해서 자세히 설명해주셨습니다. 첫번째로 다룬 논문인 ‘SRR: Self-supervised, Refine, Repeat’은 unsupervised 세팅으로 data-refinement를 반복하여 unlabeled data로 부터 이상 데이터를 계속 제외해나가는 방법을 사용하였습니다. 두번째 논문인 ‘SPADE: Semi-supervised Pseudo labeler Anomaly Detection under Distribution Mismatch’은 Semi-supervised 세팅으로 모든 OCC가 abnormal로 판단하는 경우 1, 모두 normal로 판단하는 경우 0, 그렇지 않은 경우 -1로 pseudo label을 진행하는 방법을 사용하였습니다. 이상 탐지라는 연구에 대해 다시 한번 생각해보는 계기가 되었으며 시계열 데이터에서의 이상탐지에서도 다시 한번 너무 갇힌 연구를 하고 있지 않나 생각해보는 세미나가 되었습니다. 좋은 발표 감사합니다.
이번 세미나는 “Data Refinement” for Real-world Anomaly Detection Applications"라는 주제를 다루어 주셨습니다. 이상치 탐지에 있어서 실제로 다양한 상황이 존재할 수가 있는데 그 때의 상황에 맞는 방법론들에 대해 알 수 있었습니다. SRR 방법론 같은 경우에는 이상치가 섞인 unlabeled data로부터 data-refinement (즉 이상치를 제외)하는 과정을 반복하며 성공적으로 이상 탐지를 수행할 수 있는 방법을 제안했습니다. SPADE의 경우에는 semi-supervised 세팅을 다루었는데 labeled data와 unlabeled 데이터가 섞인 상황에서 효과적으로 이상탐지를 진행하기 위한 방법론이었습니다. 단순히 성능 측면에서만 연구가 이루어지고 있다고 생각했는데, 다양한 상황을 가정하고 그에 맞게 여러 연구들이 제안되었다는 점이 흥미로웠고, 세미나를 통해서 이상치 탐지와 관련된 여러 경우의 수를 정리할 수 있어 좋았습니다. 좋은 발표 감사드립니다.
이번 세미나는 “Data Refinement for Real-world Anomaly Detection Applications”으로 진행되었습니다. 저희 연구실에서 많이 언급되는 주제이며 다양한 방법론들이 소개되었습니다. 이번 세미나는 framework를 다룬 연구로 Self-supervise, Refine, Repeat와 SPADE를 살펴봤습니다. 전자는 label이 없는 상황에서 사용 가능한 방법이고 후자는 labeled 데이터가 존재하지만 unlabeled data와 다른 distribution을 가질 때, unlabeled 데이터를 활용하기 위해 제안된 방법입니다. SRR은 self-supervised로 학습한 후 one-class clssifier를 사용하여 데이터를 정제하는 과정을 반복합니다. 데이터 정제시 정답 라벨이 없기 때문에 오츠 알고리즘을 활용하여 threshold를 설정하고 정상데이터를 구분합니다. SPADE는 semi-supervised 방법론으로 라벨링 되지 않은 데이터에 partial matching method를 적용하여 threshold를 정의하고 있습니다. NLP를 공부하다 보면 통계적으로 정의하기 어려운 부분들이 있어 수식과 제가 멀어지는 느낌이 들었습니다. 이번 세미나를 들으면서 threshold를 설정하기 위해 도입된 방법들을 보며 새로운 알고리즘을 알게되었고 도움이 되었습니다. 좋은 발표 감사합니다.
이번 세미나에서는 Data Refinement for Real-world Anomaly Detection Applications를 주제로 Self-supervise, Refine, Repeat: Improving Unsupervised Anomaly Detection 논문과 SPADE: Semi-supervised Anomaly Detection under Distribution Mismatch 논문을 소개해 주셨습니다. 첫 번째로 소개해 주신 논문인 SRR은 unlabeled 환경에서 self-supervised를 활용하여 성능을 개선하고자 한 연구였으며, 두 번째 SPADE는 거기서 더 발전하여 labeled 데이터와 unlabeled 데이터 간의 분포차이게 무관한 OCC ensemble을 통해 Pseudo labeling이 가능하게 합니다. 이번 세미나에서 인상적이었던 점은 기존엔 이상치 task가 오직 비지도 학습 방식에서만 유효하다고 생각했던 것을 지적해 주신 점입니다. 최초에 task가 제안된 unlabeled 환경에만 제한되지 않고, label이 있는 경우 해당 정보를 활용해 classification 기반으로 학습하더라도 이상치 볼 수 있으며, 정확한 환경을 명시하기만 한다면 더 다양하고 실용적인 연구가 가능하다는 것이었습니다. 특히 저도 개인 연구를 수행하며 해당 분야 이상치 task의 실험 환경이 통일되지 않은 것에 대해 생각이 많았는데, 이번 세미나를 듣고 다시 한번 생각해보게 되었습니다. 필요하다면 task 자체를 확장할 필요에 대해 다시 생각해 보게 되는 좋은 세미나였던 것 같습니다. 좋은 발표 감사합니다.
이번 세미나에서는 Data Refinement for Real-world Anomaly Detection Applications에 대해, "Self-supervise, Refine, Repeat: Improving Unsupervised Anomaly Detection"과 "SPADE: Semi-supervised Anomaly Detection under Distribution Mismatch"를 소개해주셨습니다. 이상치를 탐지하기 위한 목적으로, 새로운 모델을 통한 방법을 제안하기보다 data-refinement framework를 제안한 논문들이었습니다. 우선 SRR 같은 경우, input data의 representation을 OCC모델의 input으로 하며, data-refinementf를 반복 수행하여 labeling이 되어 있지 않은 데이터 속에서 이상 데이터들을 걸러내는 방법론입니다. unlabeled data를 여러 개의 subset으로 나누어 OCC 모델을 학습하고, 각 OCC 모델별로 threshold를 적용하여 anomaly를 탐색합니다. 효과적인 학습을 위해 여러 개의 occ 모델을 사용하고, 이 중 최종 하나를 선택하게 됩니다. SPADE의 경우, SRR과 동일하게 모든 occ가 abnormal로 판단한 것에 대해 1로 pseudo labeling을 하지만, 반대로 모든 occ가 normal로 판단한 것에 대해서도 0으로 pseudo labling을 하여 semi supervised 학습을 진행하는 방법론입니다. vision 분야에서 이상치를 탐지하기 위해 연구되는 다양한 아이디어에 대해 살펴볼 수 있어 좋았습니다. 좋은 발표 준비해주셔서 감사드립니다.
이번 세미나는 Data Refinement for Real-word Anomaly Detection Applications이라는 주제로, 두 편의 논문으로 진행되었습니다. 논문에 대한 세미나를 진행하기 앞서 발표자분께서 데이터의 Label이 어떻게 되어있는지에 따라 가능한 여러 이상치 탐지 케이스를 소개해주셨는데, 첫 번째 논문은 그 중에서도 Unsupervised anomaly detection을 가정하여 이상치 탐지 모델을 학습하는 Self-supervise, Refine, Repeat: Improving Unsupervised Anomaly Detection으로 진행되었으며, 두 번째 논문은 Semi-supervised anomaly detection을 가정하여 이상치 탐지 모델을 학습하는 SPADE: Semi-supervised Anomaly Detection under Distribution Mismatch로 진행되었습니다. 첫 번째 논문은 라벨링된 데이터가 없는 만큼 여러 OCC를 통해 refine 과정을 반복적으로 수행하여 이상치를 찾아내며, 두 번째 논문은 semi-supervised setting인만큼 pseudo label을 생성할 때 labeled 데이터와 unlabeled 데이터 score의 거리가 가장 작은 threshold를 활용한다는 차이가 있습니다. 여러 케이스에 대해서 먼저 설명해주신 다음 논문에 대한 세미나가 진행되어서 흥미롭게 들을 수 있었던 것 같습니다. 좋은 발표 감사합니다.