2021 대한산업공학회 춘계학술대회 - 정의석

대한산업공학회
작성자
Euisuk Chung
작성일
2021-07-07 09:03
조회
809
ㅤ처음으로 참가하게 된 오프라인 학회인데다가 학회 장소가 제주도였던지라 너무 기대가 많이 되었고, 그만큼 보람찼던 학회였던 것 같습니다. 팀원들과 열심히 프로젝트를 준비하고, 이를 직접 학회장에서 소개할 수 있는 소중한 경험을 했고, 이를 가능하게 해준 교수님과 팀원들께 감사한 마음 전하고 싶습니다. 2021 대한산업공학회 춘계학술대회 발표 후기와 들었던 발표 중에 가장 기억에 남는 몇가지 발표들에 대한 소감을 남깁니다.

[1] 발표 후기

[1-1] 동영상 내 핵심 내용 요약 및 키포인트 매칭

ㅤ본 학회에서 저는 소규성 석•박사 통합과정과 이윤승 석사과정과 진행한 프로젝트인 "동영상 내 핵심 내용 요약 및 키포인트 매칭"을 발표하였습니다. 발표 내용은 아래와 같습니다.

ㅤ유튜브 등 온라인 동영상 제작/유통이 굉장히 활발한 요즘, 시청자로 하여금 동영상의 정보를 미리 얻어 더욱 효율적인 영상 시청을 가능케 하는 방법론을 연구 및 개발하였습니다. 이때 KoBertSum을 학습하기 위한 데이터가 뉴스 기사 도메인에 한정되었으므로 동영상의 도메인 또한 뉴스 영상, 그 중에서도 요약 필요성이 높은 30분 이상의 긴 영상에 대한 방법론 적용을 제안하였습니다. 우선 동영상의 음성을 STT(Speech to Text) API 기반으로 텍스트화하여 KoBertSum 기반의 추출요약 모델로 요약하되, KoBertSum의 문장 임베딩 값을 활용해 영상 길이에 관련 없이 요약이 가능하도록 스크립트 분절 알고리즘을 개발 및 제안하였습니다. 이 때 스크립트 분절 알고리즘은 Convolution Neural Network 기반의 모델을 사용하며, 문장 임베딩 값을 입력하였을 때 맥락이 바뀌는지, 즉 분절 필요 여부를 예측합니다.

ㅤ제안한 스크립트 분절화 모델의 경우 다른 맥락의 기사를 입력했을 때 분절 위치 예측 성능이 91.7%로 높은 성능을 달성하였습니다. 저희 방법론의 성능을 영상 시청자의 입장에서 더욱 정확하게 평가하기 위해 정성평가를 추가로 진행하였는데, 30분 이상의 긴 유튜브 영상 스크립트를 분절화 하였을 때 1) 하나의 문단이 하나의 내용만 포함하는지에 대해서 81.7%, 2) 두 개의 이어지는 문단이 서로 다른 내용을 다루고 있는지에 대해서 91.4%로 높은 성능을 보였습니다. 추가적으로 KoBertSum이 각 문단에 대해 추출한 요약문의 질에 대해서도 TextRank 기반의 요약에 비해 월등히 좋은 평가를 받았습니다.

ㅤ프로젝트를 수행하면서 혼자서는 절대 하지 못했을 것이라고 생각하며 아이디어를 발전시키고, 같이 토론과 분석을 통해 발전시켜 나갈 동료들이 있었기에 위와 같은 좋은 결과를 낼 수 있었다고 생각합니다. 동료들 중 대표로 발표를 할 수 있어 너무 좋았고, 다음 번에 개인연구를 발표할 기회가 생긴다면 새로운 연구로 다시 한번 발표해보고 싶다는 동기부여가 생겼습니다.

[2] 참관 후기

[2-1] 주파수 기반 그래프 특징 추출 및 고장 탐지

ㅤ일반적으로 건전성 예측 및 관리 분야에서 시계열 데이터를 다루때 사용되는 시간 및 주파수의 영역 특징들은 결함을 탐지하는데 있어 중요한 역할을 할 수 있는 데이터의 구조적 관계를 반영하기 어렵습니다. 따라서, 본 발표에서는 수평 가시성 그래프를 통해 시계열 데이터에서 추출한 주파수의 구조적 정보를 표현할 수 있는 새로운 특징을 제안합니다. 이는 원본 데이터를 푸리에  변환과 수평 가시성 그래프를 통해 그래프화하고, 여기에 GCN(Graph Convolution Network)를 적용해 이러한 구조적 정보를 표현할 수 있는 새로운 특징 정보(feature)를 만들어냅니다. 이를 통해 시계열 주파수 데이터의 구조적 특징 정보를 더욱 효과적으로 담을 수 있게 됩니다. 본 연구는 방법론적 측면으로써 GCN을 활용하면 좋은 성능이 나온다는 것을 확인한 연구라, SOTA 모델들과의 비교는 수행되지 않았지만, 시계열적 데이터의 특징을 검출하는 데에 있어, 그래프 구조와 알고리즘의 효과를 확인할 수 있는 좋은 발표였습니다.

[2-2] 특허문서의 기술정보 임베딩 모델인 Tech2Vec 방법론 제안

ㅤ특허는 다양한 R&D활동을 위해 사용되는 객관적이고 증명된 기술 문서입니다. 본 발표에서는 최근 높은 성능을 보이고 있는 AI기술들을 사용하여 특허를 벡터화하는 연구들이 진행되고 있지만, 일부 데이터 유형에 한해서만 임베딩을 수행하기 떄문에 다양한 기술정보를 반영하지 못한다고 지적하고 있습니다. 따라서, 본 연구는 특허문서의 기술 특성을 반영한 기술정보 관점이 임베딩 방법론인 Tech2Vec을 제안합니다. 이는 기술 정보를 triple layer로 구조화하여 시스템, 기능, 기술과 기술 간의 관계를 ELMO를 이용하여 벡터화하고, 이를 라벨 정보와 joint embedding해줍니다. 이는 정확한 기술정보 분석을 위해 사용 가능하며, 응용 연구로 Tech2Vec 기반 기능지향 검색을 수행함으로써 정량적인 데이터분석의 적용과 처리가 가능하도록 하였습니다. 본 연구는 정량적이고, 자동화 된 기술 및 기능 주임의 임베딩 방법론이며, 특허문서가 가지고 있는 다양한 데이터들을 고려하고, 다양한 기술정보의 관점으로 임베딩을 수행한 점을 기여점으로 이야기하고 있습니다. ELMO를 활용하여 기술 정보를 임베딩하는 전반적인 프로세스가 차근차근 설명되어 듣기 너무 좋은 발표였습니다.
전체 0

전체 323
번호 제목 작성자 작성일 추천 조회
323
2025 ICLR - 김재희
Jaehee Kim | 2025.05.12 | 추천 0 | 조회 97
Jaehee Kim 2025.05.12 0 97
322
2025 ICLR
Hun Im | 2025.05.02 | 추천 0 | 조회 103
Hun Im 2025.05.02 0 103
321
2025 ICLR - 박진우
Jinwoo Park | 2025.04.28 | 추천 0 | 조회 150
Jinwoo Park 2025.04.28 0 150
320
2024 NeurIPS - 김재희
Jaehee Kim | 2024.12.20 | 추천 0 | 조회 441
Jaehee Kim 2024.12.20 0 441
319
2024 NeurIPS - 박진우
Jinwoo Park | 2024.12.19 | 추천 0 | 조회 285
Jinwoo Park 2024.12.19 0 285
318
2024 Neurips - 임훈
관리자 | 2024.12.18 | 추천 0 | 조회 339
관리자 2024.12.18 0 339
317
2024 ACL - 김재희
Jaehee Kim | 2024.12.09 | 추천 0 | 조회 213
Jaehee Kim 2024.12.09 0 213
316
2024 CVPR - 정기윤
Kiyoon Jeong | 2024.12.03 | 추천 0 | 조회 217
Kiyoon Jeong 2024.12.03 0 217
315
2024 KDD - 강형원
Hyeongwon Kang | 2024.12.02 | 추천 0 | 조회 204
Hyeongwon Kang 2024.12.02 0 204
314
2024 KDD - 김도윤
Doyoon Kim | 2024.12.02 | 추천 0 | 조회 242
Doyoon Kim 2024.12.02 0 242

Data Science & Business Analytics Lab.
Department of Industrial Engineering, College of Engineering,
Seoul National University

Contact Us

  • 강필성 교수 (pilsung_kang@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 301호 
  • 대학원 연구실 (총무 허재혁 : jaehyuk.heo@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 411호