경북대학교 컴퓨터학부 박혜영 교수 연구팀, 컴퓨터 비전 분야 우수 학회 WACV 2026 논문 발표승인
페이지 정보

작성자 최고관리자
댓글 0건 조회 56회 작성일 2025-11-24 15:58
본문
경북대학교 컴퓨터학부의 박혜영 교수와 컴퓨터학부 졸업생 신정완 박사(현 DGIST 박사후과정, 이노코어사업)와 허찬 박사과정 학생이 참여한 논문 “ReFineVQA: Iterative Refinement of Video Description via Feedback Generation for Video Question Answering”이 컴퓨터비전 분야 국제학술대회 WACV 2026 (IEEE/CVF Winter Conference on Applications of Computer Vision)에 게재 승인되었다. IEEE CVF WACV는 인공지능 및 컴퓨터 비전 분야에서 저명 학회로, 정보과학회 우수학술대회로 지정되어 있다.
이번 연구에서는 최근 주목받고 있는 멀티모달 언어모델인 VideoLM (Vision Language Model)을 이용한 비디오 질의 응답 (Video Question & Answering, VQA) 문제에서 시간적 변화 정보를 효과적으로 파악하기 위해 LLM 에이전트를 이용한 반복적 피드백을 수행하는 방법을 제안하였다. 기존의 VideoLM 모델에 바로 결합되어 학습없이 활용될 수 있으며, 특히 작은 규모의 LLM 모델 (3.8B) 만으로도 상당한 성능 향상 효과를 가져올 수 있는 점이 높이 평가되었다.
이번 논문 발표는 박혜영 교수 연구실에서 CVPR 2025, NACCL 2025 SRW에 이어 VideoLM과 관련된 세 번째 발표로, 당 연구실의 VLM 분야의 전문성을 보여주는 사례이다.
아래 사진은 순서대로, 컴퓨터학부 졸업생 신정완 박사(현 DGIST 박사후연구원), 허찬 박사과정, 그리고 박혜영 교수.
첨부파일
- 박혜영교수님 연구실.png (184.3K) 6회 다운로드 | DATE : 2025-11-24 15:59:34
- 다음글경북대학교 컴퓨터학부 이재협 교수, Adobe Research Gift Fund 수주 25.11.24
댓글목록
등록된 댓글이 없습니다.

