1. Topic
Task Oriented dialogue 데이터를 활용하여 새로운 structure information을 추출해내는 방법론을 소개합니다.
2. Overview
해당 논문은 TOD 데이터를 활용하여 dialogue flow를 구조화 할 수 있는 새로운 정보 추출 방법을 제안함
- 일반적으로 TOD는 dialogue state가 dialogue의구조화된 정보를 의미함
- 하지만 dialogue state를 모든 대화마다 labeling하는것은 매우 어려우므로, dialogue의 흐름을 구조화할 수 있는 알고리즘을 제안함
- dialogue 각 domain별 slot의 candidate가 될수있는 값을 선정한 후, 해당 값이 변경되는 횟수를 label로 활용함
- slot boundary detection을 통해 가능한 slot들을 추출하고, slot clustering을 통해 대화에 등장하는 state를 몇개의 cluster로 분리함
- 고유한 dialogue state를 NODE, state의 transition을 EDGE로 정의하고 그래프로 나타낼 수도있음
- 새로운 structured information은 dialogue state label을 approximate하고, dialogue response task에서 좋은 성능을 보임
3. 발표자료 및 발표영상
발표자료 : 하단 첨부파일
발표영상 :
"> link
4. 참고 문헌
https://arxiv.org/pdf/2203.00073.pdf
Task-oriented dialogue에서는 task마다 정의된 목적을 달성하기 위해 다양한 형태의 entity를 잘 포착할 필요가 있습니다. 기존 DST는 predefined structure에 굉장히 종속적인 한계가 있었는데 본 연구에서는 기존과 다른 구조를 사용하여 slot에 대한 annotation을 진행합니다. 클러스터링을 통한 unsupervised approach 자체는 predefined slot에 대한 의존도를 줄여준다는 점에서 도전해볼 만한 연구주제이지만, 구조화된 output을 명확한 형태의(어쩌면 사전 정의된) API로 전달해야 하는 dialogue system 파이프라인을 고려했을 때 unsupervised approach가 현실 상황에서 잘 사용될지에 대해서는 아직 의문이 남아있습니다. 그렇지만 현재 dialog pipeline 및 DST를 포함한 subtask의 결과물 표현 구조는 반드시 개선되어야 할 필요가 있기 때문에 본 연구와 같은 새로운 방향이 많이 제안되어야 한다고 생각합니다. 잘 들었습니다.
금일 세미나는 Structure Extraction in Task-Oriented Dialogues with Slot Clustering이라는 논문을 주제로 진행되었습니다. 해당 논문에서는 Task-Oriented Dialogues 데이터를 구조화 시킬 수 있는 새로운 schema를 제안하였습니다. 이전 연구들에서는 각 domain들이 ontology를 기반으로 pre-defined slot이 할당된 구조였습니다 .하지만 현실에서는 pre-defined slot을 사용할 수 없기에 pre-defined slot에 의존하지 않고 structured information을 찾고자 하였습니다. 또한 이렇게 찾은 structure information을 data augmentation으로 사용하고자 하였습니다. 따라서 본 논문은 Extract Structure Information과 Data Augmentation, 두 파트로 나뉠 수 있습니다. Extract Structure Information 단계에서는 conventional BIO schema를 따라 학습하여 Slot Boundary Detection을 수행합니다. 그리고 나서 Kmeans, Birch, Agglomerative 등 clustering 기법을 통해 해당 slot clustering을 진행하여 특정 cluster에 속한다고 결정하여 dialogue state를 업데이트 합니다. Data Augmentation에서는 Extract Structure Information에서 결정한 cluster를 통해 같은 cluster내에 동일한 label을 가지는 state를 비슷한 맥락의 utterance로 간주하여 랜덤 utterance로 바꿔 새로운 dialogue를 생성하는 방법을 사용하였습니다. 발표자의 연구 분야에 따라서 점점 발전해나가는 연구들을 볼 수 있어 좋았으며, 이전 방법론들 보다 좀 더 현실적으로 접근한 것 같아 앞으로의 연구가 기대됩니다. 좋은 발표 감사합니다.
이번 세미나는 Structure Extraction in Task-Oriented Dialogues with Slot Clustering 라는 연구에 대해 진행되었습니다. 논문에선 task oriented dialogue 데이터로 pre-defined slot에 의존하지 않고 새로운 structural information 을 추출하는 방법을 제안합니다. 제안된 방법을 보면 structual information 을 추출하는 단계와 이를 data augmentation에 활용하는 단계로 나누어 진행하고 있습니다. Structual information 을 추출하는 단계는 slot detection와 slot clustering 으로 나눠지는 데 clustering 알고리즘으론 Kmeans, Birch, Agglomerative Clustering 같은 기존 방식들이 사용됩니다. 논문은 실제 상황에서 Pre-defined slot 이 제공되기 어렵다는 것을 문제로 설정하고 좀 더 현실 상황에 맞는 가정에서 dialogue task 의 성능을 높일 수 있음을 보여주었다는 점에서 이후 활용도가 높을 것으로 생각됩니다. 연구 논문임에도 좀 더 현실적인 문제에 집중하고 있다는 점이 인상 깊었고, 발표자분께서 구체적인 예시와 함께 설명해주셔서 잘 따라가며 들을 수 있었던 세미나였습니다. 좋은 발표 감사합니다.
금일 세미나에서는 발표자의 연구 주제인 Dialogue State Tracking 분야 중에서 ‘대화의 구조’를 과제에 반영하는 방법으로 Slot Clustering을 제안합니다. 즉, 단순히 Dialogue State Label보다 확장된 구조 정보를 대화로부터 추출하여 dialogue response task에서 더 높은 성능 향상을 보여, Dialogue 과제의 Inductive Bias를 추가했다고 봤습니다. 구조를 추출하는 이유는 DST 자체가 Ontology에 기반한 정답 평가를 많이 진행하는 데, 이럴 경우 Real Data에 대한 Inference를 진행하게 되면 훈련과 다른 Ontology에 대해 추론하기 때문에 낮은 성능을 나타낼 수 밖에 없기에, General한 접근을 진행하는 것입니다. 따라서 본 논문은 독립적인 두 가지 방법을 사용하는데, 첫 번째로 Structure Information을 추출하여 BIO Tagging을 기반으로 Slot을 탐지하고 Clustering을 진행합니다. 두 번째로는 Data Augmentation의 일환으로 같은 Slot Cluster내에서 동일한 Label을 갖는 State는 비슷한 맥락의 Utterance라 간주하는데 이 부분은 다소 연구자들의 의중이 직관적이지 못해 아쉬웠습니다. 전반적으로 발표자가 지난 개인 연구를 발전 시키기 위하여 노력하는 모습을 볼 수 있어서, 언제나 그렇듯 좋은 발표였습니다. 감사합니다!
금일 세미나는 Structure Extraction in Task-Oriented Dialogues with Slot Clustering 이라는 제목의 Dialogue State Tracking 분야의 논문이 소개 되었습니다. 논문 제목에서 알 수 있듯이 대화 속에서 structure information을 추출하는 방법론이 제시된 연구인데, 이전 연구들은 사전에 정의된 slot 안에서 구성된 데이터를 다루었기에 조금 더 실제 상황에 적합한 연구임을 알 수 있습니다. 이 점이 가능했던 이유는 slot을 사전에 정의하지 않고 clustering을 적용하여 좀 더 유연하게 대처할 수 있도록 하였습니다. 조금 더 구체적으로는 BIO 태깅을 통해 slot을 탐지한 후 클러스터링을 진행하는 것입니다. 발표자 분께서 준비해주신 예시를 통해 잘 이해할 수 있었습니다. 소개된 클러스터링 기법 중 Birch 라는 것은 처음 접하게 되었는데 찾아보니 사이킷런에도 구현되어 있으며 트리 형태의 데이터 구조를 형성하는 기법이라고 합니다. 비슷한 맥락으로 텍스트 속 attribute를 찾을 때 이와 같은 아이디어를 적용해볼 수 있지 않을까 하는 생각을 하게 되었습니다. DST 분야는 실제로 연구하기에는 좀 어려워보이지만 현실적으로 유용할 수 있는 점이 늘 매력으로 느껴집니다. 재미있는 발표 잘 들었습니다.
금일 세미나에서 다룬 논문은 Structure Extraction in Task-Oriented Dialogues with Slot Clustering 입니다. 본 논문에서는 TOD 데이터를 구조화시킬 수 있는 새로운 schema를 제안합니다. 특히, 선행 연구처럼 pre-defined slot을 사용하지 않고 현실의 문제를 보다 잘 풀고자 했습니다. 방법론은 크게 두 파트로 BIO 태그 기반으로 slot span을 찾고 clustering을 하여 slot group을 구하는 파트와 본 연구에서 사용하는 dialogue state labeling 방식을 응용하여 data augmentation을 수행해 자연스러우면서 다양한 dialogue를 생성할 수 있도록 했습니다. 본 세미나에서 data augmentation 방법이 가장 흥미로웠습니다. 랜덤한 dialogue 조합이 자연스러울까 의문이었는데 실제 augmentation 된 결과를 보니 본 기법이 어느정도는 유의미했던 것 같습니다. 데이터 label을 나름대로 잘 구조화했기 때문에 그 틀 안에서 자연스러운 augmentation이 일어난 것 같습니다. 늘 발표자분의 발표를 들으며 논문 정리력과 분석력에 감탄하고 있습니다. 항상 좋은 발표 감사합니다.
이번 세미나에서는 “Structure Extraction in Task-Oriented Dialogues with Slot Clustering”을 다루어 주셨습니다. 일반적으로 Task-Oriented Dialogues(TOD)는 dialogue state가 dialogue의 구조화된 정보를 의미합니다. 하지만, 현실적으로 모든 대화마다 dialogue state를 labeling하는것은 매우 어렵기 때문에 dialogue의 흐름을 구조화시키는 알고리즘을 본 연구에서 제안합니다.
본 논문은 이를 위해 크게 2단계로 나누어 평가를 개별적으로 수행하게 됩니다.
[1] Extract Structure Information 단계에서는 structure information을 추출합니다. 이때 dialogue 각 domain별 slot의 candidate가 될 수 있는 값을 선정한 후, 해당 값이 변경되는 횟수를 label로 활용하여 slot boundary detection과 slot clustering을 통해 대화에 등장하는 state를 몇개의 cluster로 분리해줍니다.
[2] Data Augmentation 단계에서는 Multi-response data augmentation 방법론은 제안합니다. 동일한 state와 대응되는 dialogue text를 수집하고, 같은 state를 비슷한 맥락의 utterance로서 간주하고, 이를 랜덤 utterance로 바꿔 새로운 dialogue를 생성하게 됩니다.
중간중간 발표자분께서 구체적인 예시를 들면서 설명해 주셔서 흥미롭게 발표를 들을 수 있었습니다. 좋은 발표 감사합니다.
금일 세미나는 DST 분야에서 많이 활용되는 Task Oriented Dialogue(TOD) 데이터로부터 structure 정보를 뽑는 새로운 방법에 대한 소개로 진행되었습니다. 제안하는 방법론은 BIO 태그를 활용한 Slot Boundary Detection(SBD)와 Slot Clustering 기반으로 정보를 추출합니다. 이러한 방법을 통해 slot이 속할 가능성이 높은 그룹을 찾아내며, 이후 이 방법론을 데이터 증강에 활용할 수 있음을 실험적으로 보여주어 매우 흥미로웠습니다. 자연어처리에서 이미 많이 활용되는 BIO 태깅과 clustering 기반의 structure information extraction 방법론에서 아이디어가 참신하다고 생각했으며서, 실제 대화상황을 잘 고려한 방법론이라 생각했습니다. 좋은 발표 감사합니다.
이번 세미나에서는 Structure Extraction in Task-Oriented Dialogues with Slot Clustering 논문을 다루어 주셨습니다. 해당 논문에서는 Task-Oriented Dialogue들에서 pre-defined slot에 의존하지 않고 structured information을 찾고자 합니다. 크게 두가지 파트로 이루어지는데, 첫번째 파트는 어떻게 structured information을 추출할지에 대한 파트와 data augmentation에 대한 파트입니다. 첫번째 파트는 BIO tag에 기반한 slot detection과 slot clustering 단계로 이루어져 있습니다. 이때, slot group의 이름은 사용하지 않는다는 특징이 있습니다. data augmentation에서 state가 같은 dialogue utterance를 랜덤으로 추출하여 새로운 dialogue를 구축한다는 부분이 인상적이었습니다. 해당 발표에서 다양하고 직관적인 예시들로 비교해가며 설명을 해주셔서 이해에 많은 도움이 되었습니다. 좋은 발표 감사합니다.
금일 세미나는 "Structure Extraction in Task-Oriented Dialogues with Slot Clustering"라는 주제로 진행되었습니다. 본 발표에서는 Task Oriented dialogue 데이터를 활용하여 새로운 structure information을 추출해내는 방법론이 소개되었습니다. 해당 방법론은 사전에 정의된 slot이 실제 상황에서 적합하지 않다는 점을 지적하고 slot의 카테고리 및 개수를 설정하지 않고 dialogue structure를 도출하는 문제를 정의하고 해결하였습니다. 세부적으로 가능한 slot들을 추출하는 slot boundary detection와 state들을 여러 개의 군집으로 나누는 slot clustering이 사용되었습니다. 개인적으로는 본 방법론에서 기존 task의 문제점을 언급하고 이를 해결하기 위한 task 및 방법론을 제안한 흐름이 좋았다고 생각합니다. 좋은 발표 감사합니다.
이번 세미나는 Structure Extraction in Task-Oriented Dialogues with Slot Clustering 논문을 주제로 진행되었습니다. 본 논문은 TOD 데이터를 활용하여 Dialogue flow를 구조화 할 수 있는 새로운 정보 추출 방법을 제안하였으며, 논문의 후반부에서는 이러한 새로운 state schema를 활용하여 dialogue data augmentation 다양성 성능을 높이는 방법까지 제안하였습니다. 본 논문의 핵심 아이디어는 전통적인 DST task에서 slot과 value를 미리 Ontology로 정해 놓은 것과는 달리, slot과 value를 미리 정의하지 않은 채로 Structure TOD 임베딩 공간상에 값을 뿌리고 클러스터링 방식으로 슬롯을 찾아내는 것입니다. 결과적으로 전통적인 방식에서 정의되지 않은 값이 나오면 문제가 발생하는 것을 개선한 방법이라고 할 수 있습니다. 이를 구현하는 방법은 먼저 (1)domain에 따라 미리 정의된 slot의 개수로 이루어진 Dialogue state를 만들고 초기화 합니다. 이후 (2).slot token span 탐지를 수행하고 (3)Clustering algorithm이 탐지된 토큰이 특정 slot에 포함된다고 판단된다면 Dialogue state을 업데이트 하는 것입니다. (ex. [ 0, 0, 0] -> [ 0, 0, 1] -> [ 0, 1, 1] -> [0, 2, 1]) 이러한 방식은 Dialogue가 진행되며 동일한 slot으로 판단되는 token이 감지되어도 다른 시점이라면 다른 형태의 Dialogue state로 업데이트되고 전혀 다른 내용이라도 slot(value)가 동일한 조합이면 같은 label이 되는 등 직관적이지는 않으나, 이를 활용하면 Augmentation 영역에서 더 자연스러운 flow를 생성할 수 있습니다. 앞서 적은 Dialogue state 업데이트 예시를 보면 값이 1씩 증가하는데 이를 1 step씩 진행되는 sequence로 파악이 가능합니다. 즉, 동일한 Dialogue state마다 여러 개의 문장을 만들고 그 값들 중 랜덤으로 골라서 순서대로 조합하면 Dialogue 진행 순서에 알맞은 자연스러운 flow의 Data Augmentation이 가능한 것입니다. 논문에서 제안한 방법론은 비지도 학습이라고 주장하고 있으나, 과정을 살펴보면 도메인마다 미리 정해진 슬롯의 개수를 그대로 가져와서(어떤 슬롯인지 정보는 가져오지 않고 개수만) Dialogue state의 슬롯 개수 N을 결정합니다. 정말 비지도 학습 방법론인가 고민해볼 문제이나 미리 Ontology를 정의하지 않는다는 점에서 매우 의미 있는 아이디어라고 생각됩니다. 최근 DST 분야를 공부하고 있어서 더욱 흥미롭게 들은 세미나였습니다. 좋은 발표 감사합니다.
이번 세미나는 Task-oriented Dialouges 데이터에서 slot clustering으로 구조 정보를 추출한 연구 Structure Extraction in Task-Oriented Dialogues with Slot Clustering을 주제로 진행되었습니다. 본격적인 설명에 앞서 본 논문을 작성한 저자 및 단체에 대한 설명을 해주셔서 흥미롭게 들었고, 공개된지 2주도 채 지나지 않은 논문이라는 점에서 신선하게 다가왔습니다. 또한, Dialog 관련 분야는 개인적으로 많이 생소하게 느껴지는 분야임에도 발표자분께서 연구하고 계신 분야라 그런지 명확하고 깔끔하게 설명해주셔서 이해하는데 큰 도움이 되었습니다. 본 논문은 시스템과 유저간의 대화 데이터에서 구조화된 정보를 추출하합니다. 이때 추출되는 정보는 DST에서 사용되는 label 정보 등이 있습니다. 보통 TOD는 미리 정의된 상황에 맞게 pre-defined slot이 할당되어 있습니다. 그러나 현실에서는 이러한 slot이 없는 경우가 많기 때문에 이에 의존하지 않고 구조화된 정보를 추출하기 위해서 slot boundary detection 및 clustering을 수행합니다. 또한 이렇 추출된 정보를 바탕으로 multi-response augmentation을 수행하기도 합니다. 본 논문은 TOD 데이터를 구조화하는 새로운 스키마를 제안했다는 점에서 의의를 갖습니다. 문제 정의 파트에서 DSBA 구성원 예시를 들어주셔서 이해가 수월했고 더 재밌게 들을 수 있었습니다. 발표 구성 측면에서도 많이 배울 수 있었습니다. 유익한 발표 진행해주셔서 감사합니다.
이번 세미나에서는 Structure Extraction in Task-Oriented Dialogues with Slot Clustering 제목의 논문을 살펴보았습니다. 본 논문의 저자들은 label 데이터를 구하는 것이 어렵기 때문에 supervised 방식의 기존 방법론들이 현실적으로 적합하지 않다고 주장하고 있습니다. 이를 완화하기 위하여 clustering을 통해 새로운 정보를 추출하며 이를 통해 slot이 속할 가능성이 높은 클러스터를 찾게 됩니다. 특정 테스크에서 좋은 성능을 보인다고 리포트 하였는데 개인적으로는 TOD 데이터에 대한 label을 잘 구조화 한 점이 재밌었습니다. 앞으로도 다양한 방향의 연구가 진행 되어야 할 것 같은데 그 중에 어떤 방식이 주류를 이루게 될지 궁금합니다.
본 세미나를 통해 Structure Extraction in Task-Oriented Dialogues with Slot Clustering 이라는 논문을 접했습니다. 기존의 방법론들은 pre-defined slot을 통해 structure를 추출하였지만, 이는 real scenario에서는 적용이 불가능한 방법 입니다. 본 논문에서는 clustering을 이용하여 slot을 미리 지정하지 않아도 structured information을 찾을 수 있도록 model을 설계하였고 이 부분이 가장 큰 contribution이라고 생각합니다. 처음 접해보는 내용이었지만 DSBA 연구실 구성원을 예시로 설명을 구성하여 이해를 쉽게 할 수 있었습니다.
본 논문은 structure information을 추출하는 task와 더불어 Data Augmentation을 수행하는 task도 다루고 있습니다. 추출한 structure information을 통해 Data augmentation을 진행하는 것이 그것입니다. 주목할만한 부분은 data의 labeling 방식입니다. slot이 몇 번 업데이트 되었느냐에 따라 label이 생성되며 이러한 labeling을 통해 전혀 다른 대화에서도 같은 label을 가질 수 있도록 설계됩니다. 처음 접해보는 labeling 방식이라 매우 흥미롭게 다가왔고 타 분야에도 적용이 가능할 수 있겠다는 생각이 들었습니다.
이번 세미나에선 Structure Extraction in Task-Oriented Dialogues with Slot Clustering 논문에 대해 소개해주셨습니다. 기존 TOD 태스크는 사전 정의된 slot이 존재하는 반면, 해당 논문은 slot을 사전 정의하지 않은 채로 structure information을 추출하는 새로운 방법론을 소개합니다. 논문은 structure information을 추출하는 파트와 state-text dictionary를 통해 single-turn 상황에서 augmentation하는 파트, 총 2 파트로 구성됩니다. 첫 번째 파트에서 Slot Boundary Detection(SBD)과 Clustering을 이용해 dialogue의 구조를 추출하는데, slot의 변경 횟수로 구성된 기존 DST 태스크에서 뜻하던 dialogue state와는 다른 새로운 dialogue state를 매 턴마다 update해나가는 점이 새로웠습니다. 특히, domain 별로 slot의 개수를 사전 정의해놓은 것이 pre-defined slot을 벗어나기 위한 방법론 치고 조금 인위적이란 느낌을 받았는데, 뒤에서 평가되는 domain은 train에 쓰이지 않는다는 설명을 들으며 그럼 그럴 수도 있겠다는 생각이 들었습니다. 또한, 이런 dialogue state를 이용해 single turn dialogue generation 상황에서 augmentation을 진행하는 두 번째 파트도 흥미로웠습니다. 설명하신 것처럼 dialogue generation이나 dialogue flow tracking과 같은 task에선 동네가 바뀌거나 장소 이름이 바뀌어도 말이 되는 경우가 많으므로 가능한 방법이라는 생각이 들었고, state-text dictionary를 미리 구축해놓고, 랜덤하게 원하는 dialogue state들을 조합해 데이터를 증강시키는 방법이 정말 novel하기도 하고, BLEU에서 큰 성능 향상을 보이는 걸 보고 다른데 응용해보아도 좋을 것 같다는 생각이 들었습니다. DST를 공부하면서 slot의 존재가 (문제를 풀기 위해 어쩔 수 없이 필요하다는 걸 알지만) 참 현실과 동떨어진 것처럼 느꼈던터라 pre-defined slot을 벗어나 새로운 방법론을 제안하는 이번 발표를 더 재밌게 들을 수 있었던 것 같습니다. 공개된 지 얼마 되지 않은 논문을 다양한 예시와 함께 접해볼 기회를 만들어주신 발표자님께 감사드립니다.
이번 세미나에선 기존의 DST 연구와 비슷하게 Slot clustering을 이용하여 비지도 학습 방법론을 제안한 Structure Extraction in Task-Oriented Dialogues with Slot Clustering 을 살펴보았습니다.
이전에 DST를 처음 접하였을 때 제한된 slot에 대해 예측을 수행하는 것이 실제 상황과 괴리가 있다고 생각하였는데 이 논문에 이와 관련한 해결 방안을 제시하고자 하였습니다. 본 논문에서는 두 단계로 구분하여 해당 태스크를 수행하는데 1) Extract Structure Information 단계는 slot boundary detection과 slot clustering을 통해 slot이 변경된 횟수를 저장합니다. 2) Data Augmentation을 위해 이전에 수집한 slot 변경 횟수 벡터를 레이블로 하여 동일한 레이블을 가지는 대화를 선택하여 대화를 조합합니다.
이를 통해 slot 별 이름을 부여하는 등의 작업이 없이도 유의미한 dialogue response generation task에 대한 성능을 보였습니다. 개인적으로 slot 변경 횟수를 저장한 벡터가 결국 대화 중 주제가 변화되는 것을 표현하는 것이라 이해했는데, 이러한 방식의 data augmentation이 실제로 성능에 유의미하게 영향을 미치는 것이 흥미로웠습니다. DST는 연구실에 입학하여 처음 접하게 된 태스크인데, 발표자님의 다양한 예시와 자세한 설명을 통해 비교적 수월하게 이해할 수 있었던 것 같습니다. 감사합니다.
이번 세미나에서는 Task-oriented dialogues(TOD) 데이터로부터 구조적인 정보를 pre-defined slot 없이 추출하는 새로운 방법을 소개한 논문을 소개해주셨습니다. 사전 정의된 slot을 활용하지 않기 때문에 더욱 현실적인 방법론이라고 생각됩니다. 논문에서는 크게 structure information을 추출하는 방법과 data augmentation 방법론 두 가지 방법을 제안합니다. structure 정보를 추출하기 위해서는 slot boundary detection과 clustering을 사용합니다. 특히 clustering은 label이 필요하지 않기 때문에 pre-defined slot을 사용하지 않는 시나리오에서 적합한 방법이라고 생각했습니다. 좋은 발표 감사합니다.
금일 세미나는 Structure Extraction in Task-Oriented Dialogues with Slot Clustering 연구에 대해 진행되었습니다. 본 연구는 Task oriented dialogue 데이터를 활용해 새로운 structure information을 추출해내는 접근에 대해 다루고 있습니다. 발표자분께서 설명해주셨 듯, dialogue데이터에는 labeling이 가능한 structured information이 존재합니다. 문제는 이러한 structured information을 주어진 dialogue 데이터에서 어떻게 잘 뽑아내느냐 일 것 입니다. 그리고 여기서 본 연구는 한 단계 더 나아가, pre-defined slot에 의존하지 않고 structured information을 찾고자 합니다. 이를 위해 clustering을 이용해 주어진 데이터에서 structured information을 찾아냅니다. 그동안 DST 연구에 관해 깔끔하고 깊은 이야기를 발표자분께서 전달해와주셨어서, 보다 이해를 쉽게 할 수 있었습니다. 개인적으로 clustering기법 등의 적용이 인상적이었습니다. 쉽지 않은 내용 깔끔하게 잘 설명해주셔서 감사드립니다.
금일 세미나에서는 Structure Extraction in Task-Oriented Dialogues with Slot Clustering 를 주제로 진행되었습니다. task oriented dialogue 문제에서는 structured information 이 존재합니다. 데이터에 구조화된 정보를 추출 할 수 있고, 해당 예시를 알기쉽게 보여주었습니다. 개인적으로는 Knowledge graph 관련 공부를하면서 해당 task 과 상당히 유사하다고 생각했습니다. KG Completion 에서도 문법,type,구조 등 다양한 정보를 함께 적용해서 해결하고자하는데, 해당 연구에서도 유사한 접근이 이루어 진것 같습니다. 구조정보는 BIO Tag,slot clustering 을 통해 진행되고 이를 기반으로 data augmentation 을 진행시킵니다. 결과적으로 생성된 데이터의 성능적인 향상과 자연스럽고 다양한 augmentation 을 할 수 있었던 방법론 같습니다. 잘 모르는 분야지만 적절한 예시를 통해 쉽게 받아들였습니다. 감사합니다.
이번 세미나에서는 "Structure Extraction in Task-Oriented Dialogues with Slot Clustering"라는 논문에 대해 소개해주셨습니다. 일반적으로 TOD(Task Oriented Dialogues)는 label이 존재하는 구조적인 형태의 데이터로부터 supervised learning 기반의 학습을 진행하지만, 논문의 저자들은 그러한 방식이 real-world에는 적용되기 어렵다는 점을 지적합니다. 해당 한계점에 대해서 저자들은 clustering 기반의 방법론을 제안하는데, clustering을 통해 미리 주어진 slot에 의존하는 것이 아닌, 데이터로부터 구조적인 정보를 찾아냄을 목적으로 합니다. 해당 방법론을 통해 생성된 데이터를 통해 성능 개선을 이룰 수 있다고 하는데, 어느 도메인이든 supervised의 한계점을 다른 방식으로 접근해 해결하는 방법론은 흥미로운 것 같습니다. 아직도 난해한 DST이지만 언제나 쉽게 설명해주셔서 잘 이해가 됩니다. 감사합니다.
금일 세미나는 "Structure Extraction in Task-Oriented Dialogues with Slot Clustering" 논문에 대해 소개해주셨습니다. 이번 논문은 predefined slot에 의존하지 않고 데이터에서 structured 구조를 추출할 수 있는 새로운 schema를 제안하였습니다. 오늘 내용에서는 기존에 주어진 데이터만이 아니라 현실 상황에 맞도록 데이터를 기반으로 더 많은 상황을 고려할 수 있는 방법을 제안하여 실험했다는 점에서 인상깊게 보았습니다. 실험에서 또한 제안된 방법을 augmentation 방법으로 활용하였을 때 성능이 유의미하게 향상된다는 점에서 좋은 방법이었다고 생각됩니다. 오늘도 DST에 대한 자세한 설명 감사합니다.