2022 대한산업공학회 춘계학술대회 - 정용기

대한산업공학회
작성자
Yonggi Jeong
작성일
2022-06-07 15:28
조회
611
작년 추계학술대회에 온라인으로 참여했었지만 오프라인 학회는 처음이기에 여전히 새로웠고, 이번 춘계학술대회에서 생생한 현장감과 함께 재밌는 연구 발표들을 많이 들을 수 있어 좋았던 것 같습니다. 다음은 그 중 인상 깊었던 발표들을 정리하였습니다.

[1] Multi-modal metric learning by using video and keyword for BGM recommendation (연세대학교, Operations Research Lab, 장도운)

비디오에 맞는 BGM 추천을 목적으로한 연구이고,  기존 Pair based, Emotion based 방식의 한계를 극복하기 위해 영상에 대한 키워드를 추가로 사용합니다. 음악과 비디오 매칭 실험은 크게 emotion space 와 embedding space 로 나눠서 진행되는데 positive, negative pair 를 사용한 metric learning 방식으로 학습한 embedding space 방식이 좀 더 나은 성능을 보였으며 keyword 의 사용은 전반적으로 모델의 bgm 매칭(추천) 성능을 향상 시켰다고 합니다. 실험에 사용한 데이터 셋은 이미지와 음악 모두 valence, arousal label 이 존재했고 embedding space 의 학습에도 이를 pair 구성에 사용한 점이 현재 진행하고 있는 비정형데이터분석 프로젝트에도 도움이 될 것 같아 관심있게 들었던 발표였습니다. 발표 초반 관련연구에 대한 설명에서 현재 이미지 감성분석 연구들의 성능이 50% 내외로 높지 않다고 언급되었는데, 이는 프로젝트 수행 중 직면하고 있는 문제이기도 하여 소개된 제안 방법을 참고할 수 있을 것 같습니다.

[2] Computer Vision 활용한 금융혁신 연구 사례 (하나금융융합기술원 여동훈 박사)
다양한 연구 적용 사례에 대해 예상했던 것과는 다르게 금융 문서 데이터를 다루기 위해 개발된 OCR 솔루션에 대해 소개되었습니다. 그 중에서도 주로 데이터셋 구축과 정제, 레이블링 방식에 대한 내용이 주로 다뤄졌고 관련해서 하나금융융합기술원(융기원)에서 발표한 여러 특허에 대해서도 간단히 설명되었습니다. 그 중 human label 을 정제하는 과정에서 개발된 텍스트 검출 영역을 조정하는 특허가 기억에 남습니다. OCR 학습에 필요한 데이터 레이블은 텍스트 내용 뿐만 아니라 텍스트의 위치(boundary box) 도 포함하는데 레이블된 영역이 사람마다 편차가 크면 학습 성능을 저해할 수 있다고 합니다. 융기원에선 텍스트로부터 2px 떨어진 boundary box 를 표준으로 하고 여러 입력 레이블 데이터에 대해 이를 표준화해주는 별도의 모델을 개발하여 데이터 정제에 사용합니다. 이 밖에도 너무 과도하게 분절된 레이블들을 합치는 정제 방식 등도 추가로 사용하여 OCR 성능을 향상 시킬 수  있었다고 합니다. 모델 성능 향상을 위해 모델 구조나 학습 방식을 고도화 하는 것이 아닌 올바르게 데이터를 정제하는 것이  중요함을 다시 한 번 확인할 수 있었던 발표였습니다.

[3] Can a pre-trained language model be a superior counsel in equity research report-driven investment strategy? (한양대학교 산업공학과 김남형)
특정 기업 관련 equity report 를 참고하여 투자 전략을 세우는 경우 이를 성능이 좋은 AI 모델로 대체할 수 있다면 시간 대비 높은 투자 수익률을 기대할 수 있을 것입니다. 위 발표에선 이러한 연구에 사전 학습 된 언어 모델을 사용하는 것이 report의 추천을 그대로 따르는 것보다 수익률이 좋다는 것을 back-testing 결과를 통해 보여줍니다. 모델을 학습하기엔 제한적인 수의 report 가 존재하기에 사전 학습 된 large language model 을 사용한다는 아이디어로 연구가 진행되었고 BERT, SimCSE, Sentence-T5 등의 모델 중 여러 downstream task 에서 가장 좋은 성능을 보였던 ST5 를 선정하여 실험을 진행했다고 합니다. 아이디어는 단순하지만 결과적으로 높은 투자 수익률을 기록했다는 점이 인상 깊었고, multi-report 를 활용한 모델, report 별 가중치 조절 및 portfolio optimization 등의 후속 연구가 기대되는 발표였습니다.

짧지 않은 일정 동안 제주도에서 열리는 학회에 참석할 수 있도록 도움 주신 교수님께 감사드립니다.

여러 일정 기획, 예약, 차량 운전 등으로 고생해주신 총무 강형원 연구원을 비롯한 여러 연구원분들께도 감사드립니다.

감사합니다.
전체 0

전체 345
번호 제목 작성자 작성일 추천 조회
345
2025 한국데이터마이닝학회 하계학술대회 - 박시언
Sieon Park | 2025.10.13 | 추천 0 | 조회 335
Sieon Park 2025.10.13 0 335
344
2025 한국데이터마이닝학회 하계학술대회 - 장진우
Jinwoo Jang | 2025.09.13 | 추천 0 | 조회 216
Jinwoo Jang 2025.09.13 0 216
343
2025 한국데이터마이닝학회 하계학술대회 - 김한결
Hankyeol Kim | 2025.09.05 | 추천 0 | 조회 267
Hankyeol Kim 2025.09.05 0 267
342
2025 한국데이터마이닝학회 하계학술대회 - 김선민
Sunmin Kim | 2025.09.05 | 추천 0 | 조회 281
Sunmin Kim 2025.09.05 0 281
341
2025 한국데이터마이닝학회 하계학술대회 - 고재용
Jaeyong Ko | 2025.09.05 | 추천 0 | 조회 249
Jaeyong Ko 2025.09.05 0 249
340
2025 한국데이터마이닝학회 하계학술대회 - 성시열
Siyul Sung | 2025.08.31 | 추천 0 | 조회 299
Siyul Sung 2025.08.31 0 299
339
2025 한국데이터마이닝학회 하계학술대회 - 차수빈
Subeen Cha | 2025.08.31 | 추천 0 | 조회 241
Subeen Cha 2025.08.31 0 241
338
2025 한국데이터마이닝학회 하계학술대회 - 이준기
Jungi Lee | 2025.08.30 | 추천 0 | 조회 221
Jungi Lee 2025.08.30 0 221
337
2025 한국데이터마이닝학회 하계학술대회 - 김도윤
Doyoon Kim | 2025.08.30 | 추천 0 | 조회 212
Doyoon Kim 2025.08.30 0 212
336
2025 한국데이터마이닝학회 하계학술대회 - 손준영
Junyeong Son | 2025.08.30 | 추천 0 | 조회 303
Junyeong Son 2025.08.30 0 303

Data Science & Business Analytics Lab.
Department of Industrial Engineering, College of Engineering,
Seoul National University

Contact Us

  • 강필성 교수 (pilsung_kang@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 301호 
  • 대학원 연구실 (총무 김재희: jaehee_kim@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 411호