[솔루션 가이드] 페블러스 '데이터 클리닉', 데이터 품질 진단 및 최적화 서비스 제공
디지털 시대에서 데이터는 기업의 핵심 자산으로 자리 잡았지만, 데이터 품질 저하는 AI 성능 저하와 운영 비효율을 초래하는 주요 원인이다. 특히 AI 모델의 학습에 사용되는 데이터의 신뢰성과 정밀성이 부족할 경우, 기업들은 비효율적인 의사결정을 내릴 가능성이 커진다. 이에 따라 데이터 품질을 체계적으로 진단하고 관리하는 솔루션이 필수적이며, 페블러스의 '데이터 클리닉'이 이러한 요구에 부합하는 혁신적인 기술로 주목받고 있다.
페블러스는 '데이터 클리닉(Data Clinic)' 서비스를 통해 기업들이 보유한 데이터를 종합적으로 진단하고 최적화하는 방안을 제공한다. 데이터 클리닉은 △데이터 품질 진단 △정밀 타기팅 합성데이터 생성 △데이터 다이어트 및 중복 제거 △비정형 데이터 관리 등을 통해 AI 성능을 극대화하는 것을 목표로 한다. 이주행 대표는 “기업이 건강을 위해 정기 건강검진을 받듯, 데이터도 정기적으로 품질 진단을 받아야 한다”며 데이터 관리의 중요성을 강조했다.
페블러스 데이터 클리닉 서비스
데이터 품질 개선을 통한 AI 성능 향상 사례
페블러스의 데이터 클리닉은 실제 기업들의 AI 성능 개선에 기여하고 있다. A사는 차량 센서 데이터를 활용한 위치 추정 AI 개발 과정에서 데이터 취득의 어려움을 겪었으나, 페블러스의 데이터 품질 진단과 정밀 타기팅 합성데이터 생성을 통해 데이터 취득 기간을 15일에서 1시간으로 단축하고, AI 성능을 200% 향상시켰다.
또한, B사는 가상 아이돌 제작을 위한 얼굴 캡쳐 시스템 개발 중 중복된 데이터 문제로 인해 AI 학습시간이 증가하는 문제를 경험했으나, 페블러스의 데이터 다이어트 및 최적화 과정을 거쳐 데이터 용량을 15% 줄이고 AI 학습시간을 1주일에서 1일로 단축할 수 있었다.
가트너 보고서에서 인정받은 데이터 품질 관리 기술
페블러스의 데이터 품질 관리 기술은 2025년 2월 18일 발표된 가트너 보고서 “Develop Unstructured Data Management Capabilities to Support GenAI-Ready Data(G00821728)”에서도 언급되었다. 보고서에서는 비정형 데이터 관리의 중요성이 커지고 있으며, 고품질 데이터 확보를 위해 정교한 품질 진단 및 관리 솔루션이 필요하다고 강조했다.
특히 페블러스는 글로벌 데이터 품질 측정 기업인 어노말로(Anomalo) 및 쉘프아이오(Shelf.io)와 함께 신뢰할 수 있는 데이터 품질 관리 솔루션 제공자로 선정되며 기술력을 입증받았다.
보고서는 AI와 데이터 분석 프로젝트에서 사용되는 데이터의 60%가 합성 데이터로 대체되고 있으며, 이로 인해 데이터 품질의 중요성이 더욱 강조된다고 지적했다. 또한, 페블러스의 정밀 타기팅 합성데이터 기술이 실제 취득이 어려운 데이터를 생성하여 AI 모델의 성능을 극대화하는 데 기여하고 있으며, 이 기술이 가트너의 향후 보고서에서도 우수 사례로 소개될 예정이라고 밝혔다.
정밀 타겟팅 합성데이터 기술과 3D 대화형 데이터 탐색 시스템 ‘페블로스코프’
페블러스의 데이터 클리닉 서비스는 '진단 렌즈' 기술을 통해 데이터를 다차원적으로 분석한다. 사람이 육안으로 판단하기 어려운 데이터 품질 문제를 AI 기반 분석을 통해 도출하며, 데이터의 균질성, 밀도, 편향성, 결측치 등을 자동으로 평가한다.
페블러스 3D 대화형 데이터 탐색 시스템 '페블로스코프'
또한, 데이터 품질 진단 결과는 정형화된 보고서 형태로 제공되며, 10만 개 이상의 데이터셋을 1시간 이내에 분석할 수 있다. 이 과정에서 정밀 타겟팅 합성데이터 기술이 활용되며, 실제 취득이 어려운 데이터도 생성 AI를 통해 생산함으로써 데이터 품질을 향상시키고 AI 성능을 극대화할 수 있다.
3D 대화형 데이터 탐색 시스템 '페블로스코프(Pebbloscope)'는 방대한 데이터를 효율적으로 탐색하고 활용할 수 있다. 대부분의 데이터는 고차원 형태로 존재하며 직관적인 분석이 어려운 문제점을 가진다.
페블로스코프는 페블러스의 데이터 렌즈 기술을 활용하여 데이터를 저차원으로 변환하고, 3D 시각화를 통해 사용자가 데이터의 구조와 특성을 직관적으로 파악할 수 있도록 돕는다. 또한, 다중 속성 탐색 기능을 제공해 데이터의 관계를 분석하고, 드래그 앤 드롭 방식의 사용자 친화적 인터페이스(UI)를 지원해 누구나 쉽게 데이터를 탐색할 수 있도록 설계되었다.
페블러스는 CES 2025 및 MWC 2025 참가를 계기로 데이터 클리닉 SaaS 서비스를 공식 출시했다. 'dataclinic.ai'를 통해 데이터 품질 진단, 요금 안내, 샘플 진단 보고서 제공 등의 기능을 제공하며, 고객들은 플랫폼에서 직접 데이터 품질 진단을 체험할 수 있다. 또한, API 기반 SaaS 서비스 및 온프레미스 방식의 'Pebblous-to-Go' 방문 진단 서비스도 계획하고 있다.
페블러스는 현재 23건의 연구 과제를 수행하고 있으며, 36건의 국내 특허 및 3건의 미국 특허를 보유하고 있다. 향후 금융, 헬스케어, 공공 행정 분야에서도 데이터 품질 평가 및 생성 서비스를 확대해 나갈 예정이다. 데이터가 인공지능 성능의 90%를 결정한다는 원칙 아래, 페블러스는 데이터 품질 관리의 혁신을 지속적으로 주도할 계획이다.
[알림] 전자신문인터넷과 GTT KOREA가 오는 3월 27일 서울 양재동 엘타워에서 개최하는 'Data Insight & Security Summit 2025'에서는 “데이터와 AI 통합, 비즈니스 혁신의 중심에 서다”를 주제로 가속되는 데이터와 AI 통합을 중심으로 기업들이 직면한 문제를 해결하고, 비즈니스 혁신을 실현하기 위한 전략을 제시한다.
유은정 기자 judy6956@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.