Semantically Equivalent Adversarial Rules for Debugging NLP Models
2. Overview
자연어처리에서 Downsteam Task문제들이 다양하게 존재합니다. 감성분석, Q&A 등 이러한 문제에서 입력값이 조금 바뀌게 되면 그 결과가 너무 상이한 현상이 발생합니다. 예를들어 "밥 먹었어?"라는 질문에 답이 "응"이 나온다고 하면, "밥 먹었어??"라는 의미적으로 동등한데 입력이 살짝 다른 경우 답이 "아니"라고 나올수 있습니다. 이러한 flip된 현상을 Semantically(의미론적)으로 동일한데 결과가 정반대로 나오는 것을 Adversarial example이라고 지칭합니다. 이 논문은 텍스트 분야에서 이러한 Adversaries를 찾는 rule뿐만 아니라 그 정도를 score로 산출하여 Adversarial example를 찾고 이 데이터를 fine-tuning하여 실제 비즈니스에서 적용했는데 덜 모델의 민감성을 낮추는데 목적을 두고 있습니다
3. 발표자료 및 발표영상
[1] 발표자료
[2] 발표영상
| 번호 | 제목 | 작성자 | 작성일 | 추천 | 조회 |
| 공지사항 |
Paper Reviews 2019 Q3
관리자
|
2020.03.12
|
추천 0
|
조회 13441
|
관리자 | 2020.03.12 | 0 | 13441 |
| 공지사항 |
Paper Reviews 2019 Q2
관리자
|
2020.03.12
|
추천 0
|
조회 12203
|
관리자 | 2020.03.12 | 0 | 12203 |
| 공지사항 |
Paper Reviews 2019 Q1
관리자
|
2020.03.12
|
추천 0
|
조회 13155
|
관리자 | 2020.03.12 | 0 | 13155 |
| 536 |
[Paper Review] Safety Layers in Aligned Large Language Models: The Key to LLM Security (8)
Sunmin Kim
|
2025.11.25
|
추천 0
|
조회 157
|
Sunmin Kim | 2025.11.25 | 0 | 157 |
| 535 |
관리자
|
2025.11.18
|
추천 0
|
조회 35
|
관리자 | 2025.11.18 | 0 | 35 |
| 534 |
Junyeong Son
|
2025.11.18
|
추천 0
|
조회 39
|
Junyeong Son | 2025.11.18 | 0 | 39 |
| 533 |
Siyul Sung
|
2025.11.18
|
추천 0
|
조회 43
|
Siyul Sung | 2025.11.18 | 0 | 43 |
| 532 |
Jihun Nam
|
2025.11.18
|
추천 0
|
조회 28
|
Jihun Nam | 2025.11.18 | 0 | 28 |
| 531 |
Jaewon Cheon
|
2025.11.18
|
추천 0
|
조회 40
|
Jaewon Cheon | 2025.11.18 | 0 | 40 |
| 530 |
[Paper Review] Fully-Connected Spatial-Temporal Graph for Multivariate Time-Series Data (13)
Suyeon Shin
|
2025.11.18
|
추천 0
|
조회 216
|
Suyeon Shin | 2025.11.18 | 0 | 216 |
| 529 |
[Paper Review] Fusionformer: A Novel Adversarial Transformer Utilizing Fusion Attention for Multivariate Anomaly Detection (13)
Sunghun Lim
|
2025.11.07
|
추천 0
|
조회 264
|
Sunghun Lim | 2025.11.07 | 0 | 264 |
| 528 |
[Paper Review] AXIS: EXPLAINABLE TIME SERIES ANOMALY DETECTION WITH LARGE LANGUAGE MODELS (13)
Hyeongwon Kang
|
2025.10.29
|
추천 0
|
조회 462
|
Hyeongwon Kang | 2025.10.29 | 0 | 462 |
| 527 |
Introduction to Discrete Diffusion Language Models. (14)
Jaehee Kim
|
2025.10.24
|
추천 0
|
조회 469
|
Jaehee Kim | 2025.10.24 | 0 | 469 |