2025 한국데이터마이닝학회 하계학술대회 - 김도윤

작성자
Doyoon Kim
작성일
2025-08-30 18:12
조회
25
2025 한국데이터마이닝학회 하계학술대회에 발표자로 참가하였습니다.

작년에 이어 연구실 생활 중 두번째로 참가하게 되었는데, 지금까지 참여했던 여러 국내 학회들 중에서 가장 유익했던 학회 중 하나입니다. 연구실 생활 저년차에도 참가했으면 어땠을까 하는 아쉬움이 남을 정도로 비교적 발표 연구들의 내용도 우리 연구실의 분야와 겹치는 부분이 많아 볼거리가 많았습니다.

학,석,박사 과정 모두 산업공학을 전공하는 학생으로서 데이터마이닝의 의미를 다시금 생각해보았습니다. 개인적으로도 고등학교 시절 산업공학 진학을 선택 및 목표한 이유도 데이터마이닝 때문이었습니다. 즉, 기업의 경영 중 발생하는 문제를 해결하기 위해 데이터 기반의 의사결정을 필요할 때 바로 데이터마이닝 기술이 접목되는 것이고, 머신러닝 기법이 데이터마이닝 기술 중 하나가 되는 것이며 이제는 소위 초거대 딥러닝 모델이 활용되고 있는 것이라 생각됩니다. 또한 우리 연구실의 존재의 목적이기도 한 데이터 사이언스는 데이터의 규모가 커지게 되면서 데이터 마이닝의 영역이 확장된 것이라 생각됩니다. 다만, 이 모든 것이 AI라는 단어 안에 포함되면서, 데이터 마이닝 및 데이터 사이언스 의미가 소실된 것 같아 아쉽습니다. 더불어, 컴퓨터 사이언스의 영역에도 많은 부분 겹쳐 보여 차이가 없는 듯 해보이지만, 결국 우리의 지향점은 데이터에 있어야 한다고 생각합니다.

이러한 점에서 흥미롭게 설명을 들었던 연구들을 소개해보려 합니다.
  1. 미래 기술 문서 생성을 위한 교차 모달 오토인코더 및 임베딩 역변환 기반 접근법 / 유명상 / 서울과학기술대학교
    본 연구는 현재 보유 한 기술 문서 간의 인용 관계를 나타낸 그래프로부터 현존하는 노드들을 기반으로 clique를 이루는 가상의 노드를 생성하고 이를 훈련된 node-to-text와 vec-to-text 모델을 통해 문서를 생성하는 프레임워크를 제안합니다. 기본적으로 제가 이번에 발표한 연구와 지향하는, 즉 미래 유망 기술을 발굴하여 이를 구체적인 문서 및 자연어 형태로 생성하고자 하는 점이 유사하였습니다. 이를 통해 이렇게도 그래프와 자연어처리 기술을 융합하는 과업을 실행할 수 있겠다는 아이디어를 얻었습니다. 포스터 세션에서 대부분의 시간을 발표자 분과 이야기를 나누는데 소비한 듯 합니다. 발표자분과 명함도 주고 받으며 관련한 이야기들을 계속해서 나누기로 했습니다.
  2. 철도 예약 로그 데이터 기반 사용자 행동 분석을 통한 이상거래 탐지 모델 개발 / 신승용 / 한양대학교
    본 연구는 철도(SRT) 예약 시스템에서 반복적 또는 조직적인 부정 예메 사례를 고객의 이용 행태와 연결하여 탐지해내는 것을 목표로 진행되었습니다. 자세한 방법론은 명확히 이해되지는 않아 다시 한 번 자료를 요청하여 확인해 보아야겠지만, 수행하고자 하는 과업은 우리 연구실에서도 충분히 시도할 수 있는 주제인 것 같습니다. 개인적으로 제조 및 공정 과정에서의 시계열/이미지 이상치 탐지 과업도 중요하지만, 실제 고객의 로그 데이터 기반의 이상치 탐지 기술도 거래가 이루어지는  어느 분야에서든지 필요한 기술이라 생각됩니다. 본 연구의 참고문헌들을 특별히 좀 살펴보아 유관 분야의 연구들을 참고하고자 합니다.
  3. 아이템 빈도 정보를 활용한 인기 편향 완화 순차 추천 / 서성종 / 한양대학교
    본 연구는 sequential recommendation 과업을 수행함에 있어서 아이템의 소비 횟수(frequency)를 직접적으로 반영한 임베딩 벡터를 훈련시켜 아이템 임베딩에 포함시키는 과정을 보여주었습니다. 인상깊었던 점은 cold/warm 아이템들을 구분하여 해당 정보의 유무에 따른 성능 비교를 하였을 때, 두 상황 모두다 성능이 올라간 점이었습니다. 다만, 제가 생각했을 때 아이템 frequency는 사실 상대적인 정보가 더 중요할 것이라 생각됩니다. 즉, 최대 frequency가 100일 때의 frequency가 10이 갖는 의미와, 최대 frequency가 20일 때의 frequency가 10이 갖는 의미가 달라질 것입니다. 물론 frequency 임베딩에 절대적 정보를 비롯한 상대적 정보도 함께 반영되는 것일 수도 있습니다. 이러한 이야기를 발표자 분과도 주고 받으며 의미 있는 내용을 얻어갈 수 있었습니다.
이제는 우리 연구실이 주최자로서 학회에 참여할 예정입니다. 어떠한 역할이 주어지든 잘 수행해내며, 지금처럼 많은 참가자분들이 만족할 수 있는 학회가 될 수 있도록 열심히 도와드리겠습니다.

소중한 경험의 기회를 주신 교수님께 감사드립니다.

 

 
전체 0

전체 340
번호 제목 작성자 작성일 추천 조회
340
2025 한국데이터마이닝학회 하계학술대회 - 성시열
Siyul Sung | 2025.08.31 | 추천 0 | 조회 29
Siyul Sung 2025.08.31 0 29
339
2025 한국데이터마이닝학회 하계학술대회 - 차수빈
Subeen Cha | 2025.08.31 | 추천 0 | 조회 25
Subeen Cha 2025.08.31 0 25
338
2025 한국데이터마이닝학회 하계학술대회 - 이준기
Jungi Lee | 2025.08.30 | 추천 0 | 조회 27
Jungi Lee 2025.08.30 0 27
337
2025 한국데이터마이닝학회 하계학술대회 - 김도윤
Doyoon Kim | 2025.08.30 | 추천 0 | 조회 25
Doyoon Kim 2025.08.30 0 25
336
2025 한국데이터마이닝학회 하계학술대회 - 손준영
Junyeong Son | 2025.08.30 | 추천 0 | 조회 21
Junyeong Son 2025.08.30 0 21
335
2025 한국데이터마이닝학회 하계학술대회 - 박진우
Jinwoo Park | 2025.08.29 | 추천 0 | 조회 26
Jinwoo Park 2025.08.29 0 26
334
2025 한국컴퓨터종합학술대회 - 임훈
Hun Im | 2025.08.04 | 추천 0 | 조회 47
Hun Im 2025.08.04 0 47
333
2025 한국컴퓨터종합학술대회 - 박시언
Sieon Park | 2025.08.03 | 추천 0 | 조회 48
Sieon Park 2025.08.03 0 48
332
2025 한국컴퓨터종합학술대회 - 임성훈
Sunghun Lim | 2025.07.28 | 추천 0 | 조회 44
Sunghun Lim 2025.07.28 0 44
331
2025 한국컴퓨터종합학술대회 - 박진우
Jinwoo Park | 2025.07.26 | 추천 0 | 조회 67
Jinwoo Park 2025.07.26 0 67

Data Science & Business Analytics Lab.
Department of Industrial Engineering, College of Engineering,
Seoul National University

Contact Us

  • 강필성 교수 (pilsung_kang@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 301호 
  • 대학원 연구실 (총무 김도윤: doyooni303@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 411호