2024.04 ~ 2024.07 | BECUAI

  1. 뉴스 도메인에 특화된 검색 증강 기반 언어 모델 파이프라인 개발
  2. 사용자 쿼리 고도화를 통한 검색 품질 향상 및 답변 고도화
  3. 답변의 신뢰성 향상을 위한 컨텍스트 처리 및 답변 구조 개발

[상세 내용] 

1. 뉴스 도메인에 특화된 검색 증강 기반 언어 모델 파이프라인 개발

본 프로젝트에서는 뉴스 도메인에서의 언어 모델 활용을 극대화하기 위해 검색 증강 기반의 (Retrieval-augmented) 언어 모델 파이프라인을 구축한다. 뉴스의 경우 실시간으로 새로운 정보가 등장하기 때문에 답변을 언어 모델의 파라미터 능력에만 의존하지 않고 외부 데이터베이스로부터 관련 정보를 검색하고 답변에 활용한다.

2. 사용자 쿼리 고도화를 통한 검색 품질 향상 및 답변 고도화

본 프로젝트에서는 사용 환경에 따라 다양한 형태로 나타나는 사용자 쿼리의 형태를 재설계한다. 실제 사용 환경에서 발생하는 언어적 생략 등의 현상은 사용자의 의도에 맞는 문서 검색에 방해가 되기 때문에 쿼리를 검색에 용이한 형태로 변형시켜 답변에 활용될 근거 문서의 신뢰도를 높이는 것을 목표로 한다.

3. 답변의 신뢰성 향상을 위한 컨텍스트 처리 및 답변 구조 개발

본 프로젝트에서는 검색된 근거 내에서도 답변에 최적화된 내용을 추출 및 정렬하여 초거대 언어모델의 정보 활용성을 향상시킨다. 또한 사용자 관점에서 신뢰를 줄 수 있는 인터페이스를 설계하여 같은 내용이라도 구조적으로 더 선호되는 답변을 제공하는 파이프라인을 구성한다.

Data Science & Business Analytics Lab.
Department of Industrial Engineering, College of Engineering,
Seoul National University

Contact Us

  • 강필성 교수 (pilsung_kang@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 301호 
  • 대학원 연구실 (총무 허재혁 : jaehyuk.heo@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 411호