[Paper Review] How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget
작성자
Jaehyuk Heo
작성일
2024-07-11 06:33
조회
651
Topic
How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget
Overview
주어진 문제와 상황에 따라 적합한 active learning strategy를 제안
현 시점의 budget 크기를 판단하기 위해 derivative-based test를 적용
발표자료 및 발표영상
발표자료: 첨부 파일
발표영상: 추후 첨부
참고문헌
How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget (NeurIPS 2023)
전체 13
Minjeong Ma
2024-07-11 19:43
이번 세미나에서는 주어진 문제에 가장 적합한 Active Learning 전략을 선택하는 방법론을 제안하는 “How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget” 논문을 발표해 주셨습니다. 해당 방법론은 예산의 크기를 고려하여 가장 효과적인 데이터 Query Strategy를 결정하는 데 중점을 두고 있습니다. 데이터 라벨링 비용을 절감하면서도 모델 성능을 극대화할 수 있는 새로운 방법론인 SelectAL을 소개하고, 이를 통해 주어진 예산 내에서 어떻게 데이터를 최적으로 선택하고 활용할지에 대한 구체적인 방법론을 제시하였습니다. 특히 Derivative-based Test를 사용하여 현재 예산의 크기를 판단하고, 그에 따라 적절한 쿼리 전략을 적용하는 접근 방식은 매우 참신하였습니다. 하지만, 보통 관념적으로 사람이 라벨링하는 데 드는 비용을 의미하는 예산(Budget)이라는 용어를 다른 의미에서 썼다는 점과 복잡한 개념과 수식이 난해하다는 점이 개인적으로 아쉬웠습니다. 그럼에도 불구하고, 해당 논문은 Active Learning 분야에서 예산을 고려한 효율적인 데이터 선택 전략을 모색하는 데 있어 의미있는 연구라고 생각합니다. 좋은 발표 해주셔서 감사합니다.
Siyul Sung
2024-07-21 22:48
이번 세미나에서는 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget"이라는 논문에 대한 소개를 중심으로 진행되었습니다. Active Learning에서 사용하는 대부분의 Query Strategy는 예산이 큰 경우에 적합하지만, 작은 예산의 경우 적용하기 어렵기 때문에 예산 크기에 맞는 Query Strategy를 선택하는 것이 중요합니다. SelectAL은 Derivative-based Test를 통해 현 시점에서의 예산 크기를 판단하고 이에 따라 적절한 Query Strategy를 적용하는 접근 방식을 소개합니다. 먼저 라벨된 데이터에서 일부 데이터를 난이도에 따라 제외하고 모델을 학습하고, 이후 각 데이터로 학습된 모델을 평가하여 가장 높은 성능을 보이는 데이터 유형에 따라 적합한 Query Strategy를 선택합니다. 예산에 따라 High Budget Strategy (Inverse-TypiClust)와 Low Budget Strategy (TypiClust)를 적용할 수 있고, 실험 결과 예산 크기가 다양한 상황에서 모두 뛰어난 성능을 입증하였습니다. 다소 복잡할 수 있는 수식을 차근히 설명해주셔서 이해할 수 있었습니다. 좋은 발표 준비해주셔서 감사합니다.
SeungHun Han
2024-07-22 09:42
이번 세미나는 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget" 논문을 중심으로 진행되었습니다. SelectAL은 Derivative-based Test를 통해 현재 예산 크기를 판단하고, 이에 맞는 적절한 Query Strategy를 적용하는 방식을 제안합니다. 먼저 일부 라벨된 데이터를 난이도에 따라 제외하고 모델을 학습한 후, 각 데이터로 학습된 모델을 평가하여 가장 높은 성능을 보이는 데이터 유형에 따라 적합한 Query Strategy를 선택합니다. 예산에 따라 High Budget Strategy로는 Inverse-TypiClust, Low Budget Strategy로는 TypiClust를 적용할 수 있으며, 실험 결과 다양한 예산 상황에서 모두 우수한 성능을 입증했습니다. 좋은 발표 감사합니다.
Jaehee Kim
2024-07-22 15:34
금일 세미나는 Active Learning 시 학습 시점에 따라 좋은 query strategy가 다른 점을 탐구한 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget"을 중심으로 진행되었습니다. 대부분의 Active learning 연구들은 하나의 query strategy를 이용하여 학습 초반부터 후반까지 사용하는 것을 가정하고 있습니다. 하지만 수집 가능한 데이터의 수가 다른 상황에서는 당연하게도 모델 학습에 도움이 될 수 있는 데이터가 다를 수 있습니다. 이를 실제로 확인하기 위해 본 연구에서는 dereivative-based test를 진행하고, 예산이 적은 경우에는 확실한 결정경계를 확인할 수 있는 데이터가, 예산이 많은 경우에는 결정경계 근처에 있어 많은 정보를 보유한 데이터가 도움이 되는 것을 확인하였습니다. 논문에서는 예산이라는 용어로 치환하여 사용하지만, 실제 active learning 에서는 1회 수집 시 비용과 수집 횟수 등으로 나누어 구분해 볼 수 있는 점을 고려하면, 본 연구에서 주장하는 바가 다양한 시나리오에서 유의미할 수 있다는 생각을 했습니다. active learning 연구들이 실제 동작 환경에 대해 깊게 고려할 수 있는 주제들이 많은 것 같습니다. 좋은 발표 감사드립니다.
Woojun Lee
2024-07-23 17:22
이번 세미나에서는 “How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget” 논문을 소개해주셨습니다. 이 논문은 Active Learning에서 예산 크기에 따라 최적의 Query Strategy를 선택하는 방법을 다룹니다. 대부분의 Query Strategy는 큰 예산에 적합하지만, 작은 예산에 적용하기 어려운 경우가 많습니다. SelectAL 접근 방식은 Derivative-based Test를 사용해 현 시점의 예산 크기를 판단하고, 이에 맞는 Query Strategy를 적용합니다. 라벨된 데이터 중 일부를 난이도에 따라 제외하고 모델을 학습한 뒤, 각 데이터로 학습된 모델을 평가하여 가장 높은 성능을 보이는 데이터 유형에 맞는 Query Strategy를 선택합니다. 예산에 따라 High Budget Strategy (Inverse-TypiClust)와 Low Budget Strategy (TypiClust)를 적용하며, 실험 결과 다양한 예산 상황에서 뛰어난 성능을 입증하였습니다. 발표 중 복잡한 수식도 이해하기 쉽게 설명해주셔서 많은 도움이 되었습니다. 좋은 발표 감사합니다.
Kiyoon Jeong
2024-07-24 01:07
이번 세미나에서는 “How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget” 논문을 소개하셨습니다. 이 논문은 예산 크기를 고려하여 최적의 데이터 쿼리 전략을 선택하는 방법론을 제시합니다. SelectAL은 Derivative-based Test를 통해 현재 예산 크기를 판단하고 이에 맞는 적절한 쿼리 전략을 적용합니다. 예산이 큰 경우 Inverse-TypiClust, 작은 경우 TypiClust를 사용하는 방식입니다. 이 접근법은 다양한 예산 상황에서 뛰어난 성능을 보였으며, 복잡한 수식을 차근히 설명해주셔서 이해에 큰 도움이 되었습니다. 특히, 예산이라는 용어를 새로운 의미로 사용한 점이 인상적이었습니다. 좋은 발표 감사드립니다.
Jaewon Cheon
2024-07-24 13:53
이번 세미나에서는 Active Learning 상황에서의 Query Strategy를 선택하는 기준과 방법을 제시하고 있는 논문 “How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget”를 중심으로 진행되었습니다. 모델 학습 과정에서 Data Annotation Process가 차지하는 시간적 비율이 상당한만큼 학습에 가장 필요한 데이터들만 선별하여 데이터를 라벨링하는 Loop을 학습 중간중간에 반복하는 것이 컨셉인 Active Learning 특성상, 어떤 데이터가 학습에 필요한 데이터인지 결정하는 기준, 즉 Query Strategy는 학습 품질에 큰 영향을 끼치게 됩니다. 단순하게 생각했을 때, 보기 쉬운 샘플들이 아닌 희귀한 샘플들을 사용하면 좋을 것으로 생각할 수 있지만, 데이터 라벨링에 사용할 수 있는 공수가 적은 상황이 일반적인 상황일 것이며, 이에 따라 Query Strategy에도 제한이 생길 수 있습니다. 결론적으로 본 논문에서는 초반 학습의 수렴을 위해서는 쉬운 샘플의 집합을, 후반 학습에서는 모델의 고도화를 위한 어려운 샘플의 집합을 사용할 수 있도록 Query Strategy를 사용해야 함을 주장하며, 더 나아가서 그러한 초반 학습과 후반 학습을 찾아내는 방법론까지 제시하는 논문이었습니다. Active Learning 상황에서 안 쓸 이유가 없는 좋은 방법론이라는 생각이 들었습니다. 어려운 내용을 알기 쉽게 설명해주셔서 감사합니다!
Woongchan Nam
2024-07-25 04:04
금일 세미나에서는 'How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget'라는 논문을 소개해 주셨습니다. 해당 논문에서는 Labeled data에서 일부 데이터를 난이도에 따라 제외한 후 모델을 학습한 후, 각 데이터로 학습된 모델을 평가하여 모델 성능이 가장 높은 데이터의 유형에 따라 적합한 Query Strategy를 채택하는 방법을 제시하고 있습니다. 이 때, 난이도 별 데이터 선택 방법은 Budget 크기에 따라 High budget strategy와 Low budget stratey를 나누며 각각 Inverse-TypiClust, TypiClust를 적용함으로써 보다 효과적인 Query Strategy 전략을 제시하고 있습니다. 개인적으로 일반적인 Active Learning 방법론에서 더 나아가 Derivative-based Test를 제시하고, 보다 효율적인 Query Strategy 전략의 필요성, 그리고 이를 해결하기 위한 전략 및 이를 입증하는 실험 구성이 탄탄한 논문이라고 생각이 들어 의미있는 연구라고 생각이 들었습니다. 항상 Active Learning 관련하여 발표자분의 개인적인 사견을 들을 수 있음에 더욱 유의미했던 것 같습니다. 좋은 발표 감사합니다!
SangMin Lee
2024-07-25 21:52
해당 세미나는 “ How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget”이라는 논문을 중심으로 진행되었습니다. 특히 본 논문은 주어진 문제와 상황에 따라 적합한 active learning strategy를 제안한 것이 큰 특징이며, 가장 인상 깊었던 점은 현 시점의 budget 크기를 판단하기 위해 derivative-based test를 적용했다는 점이 흥미로웠습니다. 좋은 발표 준비해주셔서 감사합니다.
Saeran Park
2024-07-25 23:03
이번 세미나에서 소개된 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget" 논문은 예산 크기에 따라 최적의 Query Strategy를 선택하는 방법을 제시해 주셨습니다. SelectAL 접근 방식을 통해 예산 크기를 판단하고, 라벨된 데이터 중 일부를 제외한 후 모델을 학습, 평가하여 적합한 Query Strategy를 선택하는 방식이 인상적이었습니다. 예산에 따라 High Budget Strategy로 Inverse-TypiClust를, Low Budget Strategy로 TypiClust를 적용하는 접근이 실용적이었습니다. 복잡한 수식도 이해하기 쉽게 설명해 주셔서 큰 도움이 되었고, 실험 결과가 다양한 예산 상황에서 뛰어난 성능을 입증한 점이 특히 좋았습니다. 좋은 발표 감사합니다.
Junyeong Son
2024-07-25 23:26
이번 세미나는 Active Learning에서 주어진 예산 크기에 따라 최적의 Query Strategy를 선택하는 방법론을 제시하는 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget"라는 논문을 중심으로 진행되었습니다. Active Learning에서 활용하는 대부분의 Query Strategy는 Uncertainty에 기반하기 때문에 일반적으로 가용 예산이 큰 경우에 적합합니다. 그러나 실제 상황에서는 당연하게도 주어진 예산이 매우 다양하기 때문에, 이 예산에 맞춰 적합한 Query Strategy를 적용하는 것이 중요합니다. 본 논문에서는 데이터 난이도 별 수집된 비율로 인한 성능의 변화를 확인하기 위한 Derivative-Based Test를 통해 상황에 따라 필요한 query strategy가 서로 다름을 이론적으로 보였습니다. 또한 Labeled data에서 일부 데이터를 난이도에 따라 제외하여 모델을 학습시키고, 각 데이터로 학습된 모델을 평가하여 모델 성능이 가장 높은 데이터의 유형에 따라 적합한 query strategy 선택하는 SelectAL 접근 방식을 제안합니다. 본 논문에서 인상깊었던 점은 풀려고자 하는 문제점이 실제 성립이 되는지를 이론적으로 입증한 후에, 해당 문제점을 해결하기 위한 자신들의 방법론을 제안했다는 논리 구조가 매우 탄탄하다는 점이었습니다. 실제 논문을 읽으면서 당연하게끔 생각되는 문제 정의의 내용들도, 수학적으로 해석하고 이를 이론적으로 문제임을 증명하는 과정은 매우 어려우며 이를 해내는 것에 큰 의의가 있다는 생각이 들었습니다. 좋은 발표 해주셔서 감사합니다.
Jiyoon Lee
2024-07-26 00:50
이번 세미나에서는 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget"에 대해 소개해주셨습니다. 해당 논문에서는 Active learning 연구 분야의 핵심인 적절한 데이터를 어떻게 선택할 것인지에 대한 query strategy가 상황에 따라 다르다는 점에 집중하고 있습니다. 특히나 budget의 크기에 따라 적절한 query strategy가 달라지게 되며 이를 잘 선택 및 적용하는 것이 중요하다는 포인트를 갖습니다. 이와 관련하여 SelectAL을 제안하고 있습니다. 이는 데이터를 난이도에 따라 분류하고 이를 나누어 모델을 학습하게 되며, 가장 높은 성능을 갖는 데이터의 유형을 바탕으로 최적의 query strategy를 선택하는 프로세스로 이루어져 있습니다. 즉 해당 방법론에서 보는 가장 성능이 높은 경우란 바로 budget이다 라고 보고 있으며, 전체 데이터에서 난이도가 높은 데이터가 많을수록 budget이 커지게 되고 난이도가 낮은 데이터가 많을수록 budget이 작아지게 됩니다. 개인 연구와 논문 세미나에서 종종 소개해주시어 Active learning이라는 흥미로운 주제를 알아볼 수 있는 것 같습니다. 좋은 발표 감사드립니다.
Hyeongwon Kang
2024-07-11 12:33
이번 세미나는 “How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget” 논문을 중심으로 진행되었습니다. 논문은 Active Learning에서 query strategy가 학습 시점과 예산에 따라 달라질 필요가 있음을 강조하며, 이를 위한 방법론을 제안하고 있습니다. 대부분의 Active Learning 연구들이 하나의 query strategy를 학습 전체에 적용하는 것과 달리, 본 연구는 학습 초반과 후반에 적합한 전략이 다를 수 있음을 실험적으로 보여주었습니다. 연구에서는 예산이 적은 경우 학습 초기에는 모델이 수렴할 수 있도록 결정 경계가 명확한 데이터를 선택하는 것이 효과적이고, 예산이 많은 경우 학습 후반에는 결정 경계 근처의 복잡한 데이터를 활용해 모델 성능을 고도화하는 것이 유리하다는 점을 제시했습니다. 이를 위해 SelectAL이라는 데이터 난이도 기반 query 전략을 제안하며, 다양한 예산 시나리오에서의 실험을 통해 해당 방법론의 유용성을 입증했습니다. Active Learning의 실제 동작 환경을 고려한 이 연구는 다양한 상황에서 활용 가능성이 높아 보였습니다. 어려운 내용을 명확히 전달해주신 발표자분께 감사드리며, 매우 유익한 시간이었습니다.
이번 세미나에서는 주어진 문제에 가장 적합한 Active Learning 전략을 선택하는 방법론을 제안하는 “How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget” 논문을 발표해 주셨습니다. 해당 방법론은 예산의 크기를 고려하여 가장 효과적인 데이터 Query Strategy를 결정하는 데 중점을 두고 있습니다. 데이터 라벨링 비용을 절감하면서도 모델 성능을 극대화할 수 있는 새로운 방법론인 SelectAL을 소개하고, 이를 통해 주어진 예산 내에서 어떻게 데이터를 최적으로 선택하고 활용할지에 대한 구체적인 방법론을 제시하였습니다. 특히 Derivative-based Test를 사용하여 현재 예산의 크기를 판단하고, 그에 따라 적절한 쿼리 전략을 적용하는 접근 방식은 매우 참신하였습니다. 하지만, 보통 관념적으로 사람이 라벨링하는 데 드는 비용을 의미하는 예산(Budget)이라는 용어를 다른 의미에서 썼다는 점과 복잡한 개념과 수식이 난해하다는 점이 개인적으로 아쉬웠습니다. 그럼에도 불구하고, 해당 논문은 Active Learning 분야에서 예산을 고려한 효율적인 데이터 선택 전략을 모색하는 데 있어 의미있는 연구라고 생각합니다. 좋은 발표 해주셔서 감사합니다.
이번 세미나에서는 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget"이라는 논문에 대한 소개를 중심으로 진행되었습니다. Active Learning에서 사용하는 대부분의 Query Strategy는 예산이 큰 경우에 적합하지만, 작은 예산의 경우 적용하기 어렵기 때문에 예산 크기에 맞는 Query Strategy를 선택하는 것이 중요합니다. SelectAL은 Derivative-based Test를 통해 현 시점에서의 예산 크기를 판단하고 이에 따라 적절한 Query Strategy를 적용하는 접근 방식을 소개합니다. 먼저 라벨된 데이터에서 일부 데이터를 난이도에 따라 제외하고 모델을 학습하고, 이후 각 데이터로 학습된 모델을 평가하여 가장 높은 성능을 보이는 데이터 유형에 따라 적합한 Query Strategy를 선택합니다. 예산에 따라 High Budget Strategy (Inverse-TypiClust)와 Low Budget Strategy (TypiClust)를 적용할 수 있고, 실험 결과 예산 크기가 다양한 상황에서 모두 뛰어난 성능을 입증하였습니다. 다소 복잡할 수 있는 수식을 차근히 설명해주셔서 이해할 수 있었습니다. 좋은 발표 준비해주셔서 감사합니다.
이번 세미나는 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget" 논문을 중심으로 진행되었습니다. SelectAL은 Derivative-based Test를 통해 현재 예산 크기를 판단하고, 이에 맞는 적절한 Query Strategy를 적용하는 방식을 제안합니다. 먼저 일부 라벨된 데이터를 난이도에 따라 제외하고 모델을 학습한 후, 각 데이터로 학습된 모델을 평가하여 가장 높은 성능을 보이는 데이터 유형에 따라 적합한 Query Strategy를 선택합니다. 예산에 따라 High Budget Strategy로는 Inverse-TypiClust, Low Budget Strategy로는 TypiClust를 적용할 수 있으며, 실험 결과 다양한 예산 상황에서 모두 우수한 성능을 입증했습니다. 좋은 발표 감사합니다.
금일 세미나는 Active Learning 시 학습 시점에 따라 좋은 query strategy가 다른 점을 탐구한 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget"을 중심으로 진행되었습니다. 대부분의 Active learning 연구들은 하나의 query strategy를 이용하여 학습 초반부터 후반까지 사용하는 것을 가정하고 있습니다. 하지만 수집 가능한 데이터의 수가 다른 상황에서는 당연하게도 모델 학습에 도움이 될 수 있는 데이터가 다를 수 있습니다. 이를 실제로 확인하기 위해 본 연구에서는 dereivative-based test를 진행하고, 예산이 적은 경우에는 확실한 결정경계를 확인할 수 있는 데이터가, 예산이 많은 경우에는 결정경계 근처에 있어 많은 정보를 보유한 데이터가 도움이 되는 것을 확인하였습니다. 논문에서는 예산이라는 용어로 치환하여 사용하지만, 실제 active learning 에서는 1회 수집 시 비용과 수집 횟수 등으로 나누어 구분해 볼 수 있는 점을 고려하면, 본 연구에서 주장하는 바가 다양한 시나리오에서 유의미할 수 있다는 생각을 했습니다. active learning 연구들이 실제 동작 환경에 대해 깊게 고려할 수 있는 주제들이 많은 것 같습니다. 좋은 발표 감사드립니다.
이번 세미나에서는 “How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget” 논문을 소개해주셨습니다. 이 논문은 Active Learning에서 예산 크기에 따라 최적의 Query Strategy를 선택하는 방법을 다룹니다. 대부분의 Query Strategy는 큰 예산에 적합하지만, 작은 예산에 적용하기 어려운 경우가 많습니다. SelectAL 접근 방식은 Derivative-based Test를 사용해 현 시점의 예산 크기를 판단하고, 이에 맞는 Query Strategy를 적용합니다. 라벨된 데이터 중 일부를 난이도에 따라 제외하고 모델을 학습한 뒤, 각 데이터로 학습된 모델을 평가하여 가장 높은 성능을 보이는 데이터 유형에 맞는 Query Strategy를 선택합니다. 예산에 따라 High Budget Strategy (Inverse-TypiClust)와 Low Budget Strategy (TypiClust)를 적용하며, 실험 결과 다양한 예산 상황에서 뛰어난 성능을 입증하였습니다. 발표 중 복잡한 수식도 이해하기 쉽게 설명해주셔서 많은 도움이 되었습니다. 좋은 발표 감사합니다.
이번 세미나에서는 “How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget” 논문을 소개하셨습니다. 이 논문은 예산 크기를 고려하여 최적의 데이터 쿼리 전략을 선택하는 방법론을 제시합니다. SelectAL은 Derivative-based Test를 통해 현재 예산 크기를 판단하고 이에 맞는 적절한 쿼리 전략을 적용합니다. 예산이 큰 경우 Inverse-TypiClust, 작은 경우 TypiClust를 사용하는 방식입니다. 이 접근법은 다양한 예산 상황에서 뛰어난 성능을 보였으며, 복잡한 수식을 차근히 설명해주셔서 이해에 큰 도움이 되었습니다. 특히, 예산이라는 용어를 새로운 의미로 사용한 점이 인상적이었습니다. 좋은 발표 감사드립니다.
이번 세미나에서는 Active Learning 상황에서의 Query Strategy를 선택하는 기준과 방법을 제시하고 있는 논문 “How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget”를 중심으로 진행되었습니다. 모델 학습 과정에서 Data Annotation Process가 차지하는 시간적 비율이 상당한만큼 학습에 가장 필요한 데이터들만 선별하여 데이터를 라벨링하는 Loop을 학습 중간중간에 반복하는 것이 컨셉인 Active Learning 특성상, 어떤 데이터가 학습에 필요한 데이터인지 결정하는 기준, 즉 Query Strategy는 학습 품질에 큰 영향을 끼치게 됩니다. 단순하게 생각했을 때, 보기 쉬운 샘플들이 아닌 희귀한 샘플들을 사용하면 좋을 것으로 생각할 수 있지만, 데이터 라벨링에 사용할 수 있는 공수가 적은 상황이 일반적인 상황일 것이며, 이에 따라 Query Strategy에도 제한이 생길 수 있습니다. 결론적으로 본 논문에서는 초반 학습의 수렴을 위해서는 쉬운 샘플의 집합을, 후반 학습에서는 모델의 고도화를 위한 어려운 샘플의 집합을 사용할 수 있도록 Query Strategy를 사용해야 함을 주장하며, 더 나아가서 그러한 초반 학습과 후반 학습을 찾아내는 방법론까지 제시하는 논문이었습니다. Active Learning 상황에서 안 쓸 이유가 없는 좋은 방법론이라는 생각이 들었습니다. 어려운 내용을 알기 쉽게 설명해주셔서 감사합니다!
금일 세미나에서는 'How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget'라는 논문을 소개해 주셨습니다. 해당 논문에서는 Labeled data에서 일부 데이터를 난이도에 따라 제외한 후 모델을 학습한 후, 각 데이터로 학습된 모델을 평가하여 모델 성능이 가장 높은 데이터의 유형에 따라 적합한 Query Strategy를 채택하는 방법을 제시하고 있습니다. 이 때, 난이도 별 데이터 선택 방법은 Budget 크기에 따라 High budget strategy와 Low budget stratey를 나누며 각각 Inverse-TypiClust, TypiClust를 적용함으로써 보다 효과적인 Query Strategy 전략을 제시하고 있습니다. 개인적으로 일반적인 Active Learning 방법론에서 더 나아가 Derivative-based Test를 제시하고, 보다 효율적인 Query Strategy 전략의 필요성, 그리고 이를 해결하기 위한 전략 및 이를 입증하는 실험 구성이 탄탄한 논문이라고 생각이 들어 의미있는 연구라고 생각이 들었습니다. 항상 Active Learning 관련하여 발표자분의 개인적인 사견을 들을 수 있음에 더욱 유의미했던 것 같습니다. 좋은 발표 감사합니다!
해당 세미나는 “ How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget”이라는 논문을 중심으로 진행되었습니다. 특히 본 논문은 주어진 문제와 상황에 따라 적합한 active learning strategy를 제안한 것이 큰 특징이며, 가장 인상 깊었던 점은 현 시점의 budget 크기를 판단하기 위해 derivative-based test를 적용했다는 점이 흥미로웠습니다. 좋은 발표 준비해주셔서 감사합니다.
이번 세미나에서 소개된 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget" 논문은 예산 크기에 따라 최적의 Query Strategy를 선택하는 방법을 제시해 주셨습니다. SelectAL 접근 방식을 통해 예산 크기를 판단하고, 라벨된 데이터 중 일부를 제외한 후 모델을 학습, 평가하여 적합한 Query Strategy를 선택하는 방식이 인상적이었습니다. 예산에 따라 High Budget Strategy로 Inverse-TypiClust를, Low Budget Strategy로 TypiClust를 적용하는 접근이 실용적이었습니다. 복잡한 수식도 이해하기 쉽게 설명해 주셔서 큰 도움이 되었고, 실험 결과가 다양한 예산 상황에서 뛰어난 성능을 입증한 점이 특히 좋았습니다. 좋은 발표 감사합니다.
이번 세미나는 Active Learning에서 주어진 예산 크기에 따라 최적의 Query Strategy를 선택하는 방법론을 제시하는 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget"라는 논문을 중심으로 진행되었습니다. Active Learning에서 활용하는 대부분의 Query Strategy는 Uncertainty에 기반하기 때문에 일반적으로 가용 예산이 큰 경우에 적합합니다. 그러나 실제 상황에서는 당연하게도 주어진 예산이 매우 다양하기 때문에, 이 예산에 맞춰 적합한 Query Strategy를 적용하는 것이 중요합니다. 본 논문에서는 데이터 난이도 별 수집된 비율로 인한 성능의 변화를 확인하기 위한 Derivative-Based Test를 통해 상황에 따라 필요한 query strategy가 서로 다름을 이론적으로 보였습니다. 또한 Labeled data에서 일부 데이터를 난이도에 따라 제외하여 모델을 학습시키고, 각 데이터로 학습된 모델을 평가하여 모델 성능이 가장 높은 데이터의 유형에 따라 적합한 query strategy 선택하는 SelectAL 접근 방식을 제안합니다. 본 논문에서 인상깊었던 점은 풀려고자 하는 문제점이 실제 성립이 되는지를 이론적으로 입증한 후에, 해당 문제점을 해결하기 위한 자신들의 방법론을 제안했다는 논리 구조가 매우 탄탄하다는 점이었습니다. 실제 논문을 읽으면서 당연하게끔 생각되는 문제 정의의 내용들도, 수학적으로 해석하고 이를 이론적으로 문제임을 증명하는 과정은 매우 어려우며 이를 해내는 것에 큰 의의가 있다는 생각이 들었습니다. 좋은 발표 해주셔서 감사합니다.
이번 세미나에서는 "How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget"에 대해 소개해주셨습니다. 해당 논문에서는 Active learning 연구 분야의 핵심인 적절한 데이터를 어떻게 선택할 것인지에 대한 query strategy가 상황에 따라 다르다는 점에 집중하고 있습니다. 특히나 budget의 크기에 따라 적절한 query strategy가 달라지게 되며 이를 잘 선택 및 적용하는 것이 중요하다는 포인트를 갖습니다. 이와 관련하여 SelectAL을 제안하고 있습니다. 이는 데이터를 난이도에 따라 분류하고 이를 나누어 모델을 학습하게 되며, 가장 높은 성능을 갖는 데이터의 유형을 바탕으로 최적의 query strategy를 선택하는 프로세스로 이루어져 있습니다. 즉 해당 방법론에서 보는 가장 성능이 높은 경우란 바로 budget이다 라고 보고 있으며, 전체 데이터에서 난이도가 높은 데이터가 많을수록 budget이 커지게 되고 난이도가 낮은 데이터가 많을수록 budget이 작아지게 됩니다. 개인 연구와 논문 세미나에서 종종 소개해주시어 Active learning이라는 흥미로운 주제를 알아볼 수 있는 것 같습니다. 좋은 발표 감사드립니다.
이번 세미나는 “How to Select Which Active Learning Strategy is Best Suited for Your Specific Problem and Budget” 논문을 중심으로 진행되었습니다. 논문은 Active Learning에서 query strategy가 학습 시점과 예산에 따라 달라질 필요가 있음을 강조하며, 이를 위한 방법론을 제안하고 있습니다. 대부분의 Active Learning 연구들이 하나의 query strategy를 학습 전체에 적용하는 것과 달리, 본 연구는 학습 초반과 후반에 적합한 전략이 다를 수 있음을 실험적으로 보여주었습니다. 연구에서는 예산이 적은 경우 학습 초기에는 모델이 수렴할 수 있도록 결정 경계가 명확한 데이터를 선택하는 것이 효과적이고, 예산이 많은 경우 학습 후반에는 결정 경계 근처의 복잡한 데이터를 활용해 모델 성능을 고도화하는 것이 유리하다는 점을 제시했습니다. 이를 위해 SelectAL이라는 데이터 난이도 기반 query 전략을 제안하며, 다양한 예산 시나리오에서의 실험을 통해 해당 방법론의 유용성을 입증했습니다. Active Learning의 실제 동작 환경을 고려한 이 연구는 다양한 상황에서 활용 가능성이 높아 보였습니다. 어려운 내용을 명확히 전달해주신 발표자분께 감사드리며, 매우 유익한 시간이었습니다.