오픈소스 AI 모델 중 한국어 기반 VQA 작업에서 가장 뛰어난 성능 보여
한국 문화∙지식 이해도 낮았던 기존 영어 기반 VQA 모델 한계 극복

(사진=)
사진=엘리스그룹

[스타트업투데이] 인공지능(AI) 교육 솔루션 기업 엘리스그룹(대표 김재원)이 멀티모달 AI 모델 ‘AI 헬피 프로(Pro)’를 공개한다고 18일 밝혔다. 이는 엘리스의 생성형 AI 챗봇 ‘AI 헬피’에 이미지 인식 기능을 더한 것으로 한국어와 한국 문화를 잘 이해할 수 있도록 특화됐다.

AI 헬피 프로에는 엘리스그룹이 자체 개발한 AI 모델이자 텍스트와 이미지를 이해하고 분석할 수 있는 ‘헬피-V’(Helpy-V)가 탑재된다. 이미지에 관련된 질문을 받을 경우 답변을 설명하는 시각적 질의응답(Visual Question and Answering, 이하 VQA)이 가능하다. 기존 AI 헬피가 할 수 있었던 정확하고 빠른 질의응답에 더불어 원하는 이미지 생성 기능도 제공된다. 생성형 AI의 문제점이었던 할루시네이션은 실시간 정보 검색 기능으로 크게 완화했다.

AI 헬피 프로는 한국어와 한국 문화를 읽고 분석하는데 탁월한 성능을 보인다. 유명 한국인 사진을 보고 설명할 수 있는 것은 물론 국악과 같은 전통문화, 전통 음식 이미지를 이해하고 정확하게 설명할 수 있다.

한국어 VQA 작업 영역에 대해 진행한 CVQA 벤치마크에서도 빅테크를 포함한 오픈소스 AI 모델 중 최고의 성능을 기록하며 기술력을 입증했다. 이는 기존 공개된 VQA 모델들이 영어를 기반으로 개발돼 한국 문화나 지식에 대한 이해도가 낮았던 한계를 해결하고, 신뢰도 높은 한국어 기반 정보를 제공한다는 의의를 가진다.

엘리스그룹은 실제 교육을 운영하던 중 시각 정보 습득에 어려움을 겪는 학습자를 위해 VQA 기능이 필요하다고 인식해 개발에 나섰다. 모든 학습자가 학습에 참여할 수 있는 보편적 학습 설계(Universal Design For Learning, UDL)를 추구하고 있다. AI 헬피 프로는 4,000곳 이상의 기관 AI 교육에 활용 중인 엘리스LXP에 순차적으로 적용될 예정이다.  

AI 헬피 프로를 사용할 경우 국내 초∙중등 학습 교재 내 이미지에 대해 정확한 한국어 설명을 제공할 수 있다. 과학 수업 중에는 실험 기구 상태를 화면으로 파악하고 질의응답을 진행할 수 있다. 이 밖에도 산업 현장에서 영상이나 이미지로 위험을 감지하는 등 다양한 교육∙산업 영역에서 활용 범위를 넓혀갈 계획이다.

AI 모델 연구를 주도한 엘리스그룹 김수인 최고연구책임자(CRO)와 권도현 AI 엔지니어는 “지난해 생성형 AI 챗봇 AI 헬피 공개 두 달 만에 15만 건 이상 질의응답이 진행되며 실제 학습자들에게 매우 큰 도움이 됐다”며 “이를 통해 교육에 가치를 더하는 AI 모델이라는 생각에 확신을 갖게 됐다”고 말했다. 이어 “앞으로도 더 많은 사람이 활용할 수 있는 신뢰도 높은 교육 특화 AI 모델을 개발할 계획”이라고 전했다.

[스타트업투데이=김지민 기자] news@startuptoday.kr

관련기사

저작권자 © 스타트업투데이(STARTUPTODAY) 무단전재 및 재배포 금지