LG, 국내 첫 모델 ‘엑사원 딥’ 공개
사진=게티이미지뱅크
LG가 국내 첫 추론형 인공지능(AI) 모델을 18일 공개했다. 추론형 모델은 사람처럼 논리적이고 단계적인 사고 과정을 거쳐 답을 내놓는 AI 모델이다. 이미 학습한 데이터 가운데 답을 찾는 기존 모델과 차이가 있다. 최근 저비용·고성능 AI 모델로 세계에 충격을 준 중국의 딥시크가 대표적 추론형 모델이다. 딥시크를 비롯해 오픈AI 등 주요 빅테크들이 추론형 모델 개발에 뛰어든 가운데, 한국에서도 이들과 경쟁할 모델이 개발된 것이다. LG는 AI 모델을 일반인이 쓸 수 있도록 하지는 않고, 그룹 자체적으로만 제품 개발 등에 활용하고 있다.
그래픽=양진경
◇수학·과학 성능 뛰어나
LG AI연구원은 이날 ‘엑사원 딥(EXAONE Deep)’을 공개했다. 주력 모델은 ‘엑사원 딥-32B’다. AI가 학습·추론을 할 때 데이터를 서로 연결해 주는 단위인 매개변수가 320억개다. 매개변수는 많을수록 AI의 성능이 좋아지지만, 이를 구동하려면 그만큼 AI 반도체가 많이 필요하다. 이 때문에 최근엔 매개변수를 최소화하면서 성능을 높이는 경쟁이 치열하다.
딥시크-R1은 매개변수가 6710억개다. 엑사원 딥-32B는 딥시크-R1의 약 5%에 불과하지만 성능은 이에 필적한다. 실제 딥시크·알리바바 등 주요 추론형 모델과 성능을 비교한 결과, 엑사원 딥-32B는 특히 수학에서 뛰어난 결과를 보였다. 2024년 미국 수학 올림피아드 문제에서는 90점으로 딥시크-R1(86.7점)을 뛰어넘었다. 매개 변수가 같은 알리바바의 QwQ-32B(86.7점)도 앞섰다. 한국의 2025년 수능 수학 영역에서도 94.5점으로 다른 모델과 비교해 가장 높은 점수를 기록했다. 박사 수준의 과학 문제에서는 66.1점으로 알리바바 QwQ-32B의 63.3점보다 높았다.
다만 코딩 능력과 언어 능력에서는 다른 모델보다 뒤떨어졌다. 언어 능력을 평가하는 항목인 ‘다중 과제 언어 이해’에서는 83점으로, 알리바바(87.4), 딥시크(90.8)에 못 미쳤다. 업계 관계자는 “추론형 모델은 수학이나 과학 문제를 푸는 데 특화됐다”며 “언어 능력은 매개변수가 큰 모델에 비해 성능이 떨어질 수밖에 없다”고 했다.
LG AI연구원은 매개변수를 더 줄인 경량 모델 ‘엑사원 딥-7.8B’, 온디바이스 모델 ‘엑사원 딥-2.4B’도 공개했다. LG AI 연구원은 “경량 모델은 32B 모델의 24% 크기임에도 성능을 95%까지 유지하고, 기기에 탑재되는 온디바이스 모델은 7.5% 규모임에도 성능이 86%에 달한다”고 했다. LG는 AI 모델의 설계도라고 할 수 있는 ‘소스 코드’를 다른 개발자들이 활용할 수 있도록 ‘오픈 소스’ 방식으로 공개했다. 딥시크도 이런 오픈 소스 방식이다.
LG는 ‘소스 코드’를 무료로 공개하지만, AI 모델은 기업 내부적으로만 활용하고 있다. 챗GPT처럼 일반인이 사용할 수 있게 하려면 거대한 데이터센터가 필요한데, 최소 수조 원이 들어가야 하기 때문이다.
◇가볍고 싼 추론형 AI 개발
국내 기업 중 LG처럼 AI 모델을 개발하는 곳으로 네이버가 있다. 네이버는 2023년 AI 모델 ‘하이퍼클로바X’를 개발했다. 최근 이를 업그레이드하면서 매개변수는 약 60% 줄이고 추론 성능을 강화하고 있다. 네이버는 “하이퍼클로바X의 새로운 모델의 운영 비용은 기존 모델 대비 50% 이상 개선됐다”고 했다. 네이버는 별도로 추론에 특화된 AI 모델도 개발 중이다. 국내 대표 AI 스타트업인 업스테이지도 최근 추론형 AI 개발에 본격 착수했다.
국내 기업들이 추론형 모델 개발에 뛰어드는 것은 ‘AI 에이전트(비서)’를 구현하려는 것이다. 사람과 가까운 AI를 만들기 위해서 사람처럼 사고하는 방식의 추론형 모델이 필요하다. AI 에이전트들이 다양한 상황을 파악해 항공권 예매나 식당 예약 등의 일을 대신하도록 하겠다는 구상이다. 김정호 KAIST 교수는 “현재 챗GPT 같은 생성형 AI는 대부분 묻고 답하는 용도로 사용하지만, 추론형 AI를 스마트폰과 TV에 넣으면 사용자가 해야 하는 일을 상당 부분 AI가 대체할 것”이라고 말했다.
☞추론형 모델
챗GPT 같은 생성형 AI는 기존에 학습한 내용 중에 정답과 가장 가깝다고 판단한 내용을 답변으로 내놓는다. 반면 추론형 모델은 사람처럼 논리적이고 단계적인 사고 과정을 거쳐, 학습한 것이 아니라도 기존 데이터를 토대로 새로운 답을 낼 수 있다. 수학 문제를 풀 때 여러 단계의 풀이 과정을 거쳐 답을 찾는 것과 같다.
Copyright © 조선일보. 무단전재 및 재배포 금지.