
데이터 클리닉 진단 신청하기
데이터 클리닉의
차별화된 기술로
데이터 품질 진단을
시작해보세요!

FAIRY PENGUIN


추천
Data Bulk-Up
데이터 벌크업
Data Bulk-Up
데이터 벌크업

추천
Data Repelica
데이터 레플리카
Data Repelica
데이터 레플리카

Data Diet
데이터 다이어트
Data Diet
데이터 다이어트

진단 절차를 소개합니다
고객 커뮤니케이션
고객 프로젝트의 성공적인 수행을 위해서 고객의 비즈니스 목표 이해, 데이터 품질 및 기술 요구사항 도출, 제약 조건 확인, 도메인 지식 등 프로젝트 수행에 필요한 기반을 다지고 이를 바탕으로 진단 항목과 타임라인을 설정합니다.

종합 평가
레벨 I, II, III 진단 결과를 종합하여 데이터 품질에 대한 평가를 하고 개선 방향을 제안합니다.


Level I 진단
레벨 I 진단은 가장 기초적인 EDA를 수행하는 단계입니다. 이 단계에서는 데이터 정합성 평가, 결측치 검사, 클래스 균형 측정, 통계 측정을 실시하게 됩니다. 이 단계는 이후 레벨 II, III 진행에 필요한 사전 작업에 해당합니다.

클래스 균형 측정, 통계 측정
Level II 진단
레벨 II 진단은 기존에 널리 사용되는 신경망, 즉 범용 데이터렌즈(DataLens)를 활용하여 데이터를 분석합니다. 이 단계에서는 데이터렌즈 선택 및 이미징을 선행한 후, 기하 속성 관찰 및 분포 속성 관찰을 실시하게 됩니다. 기하 속성 관찰에서는 매니폴드의 형상 및 데이터 간 거리 등 다차원 임베딩 공간에서의 특성을 관찰하며, 분포 속성 관찰에서는 전체 데이터 포인트의 통계적 분포를 관찰합니다.

이미징 신경망

특징 추출
Level III 진단
레벨 III은 데이터 도메인 및 작업 특성을 고려하여 제작된 맞춤형 데이터렌즈를 활용하여 데이터를 분석합니다. 이 단계에서는 데이터렌즈 가공, 즉 데이터 특이적인 커스텀 신경망을 디자인하여 학습하는 과정이 포함됩니다. 레벨 III 데이터렌즈의 특징은 측정 렌즈와 생성 렌즈가 한 쌍으로 가공되기 때문에, 향후 합성데이터 생성에도 바로 사용될 수 있다는 점입니다. 측정 방식은 레벨 II와 동일합니다.

이미징 신경망

특징 추출

생성형 신경망
더 자세히 알고 싶다면?

데이터 클리닉이란?
데이터 품질 진단에서 개선까지.데이터를 위한 종합병원 <데이터 클리닉>을 소개합니다.
데이터 클리닉은 어떻게 동작할까요?
데이터 클리닉은 첨단 기술의 집약체입니다. 데이터 렌즈, 이미징, 품질 진단, 데이터 벌크업/다이어트 까지 주요 기술을 알기 쉽게 소개합니다.
진단리포트 100% 활용하기
데이터 클리닉의 진가는 진단리포트에 그대로 녹아 있습니다. 진단리포트를 통해 데이터 품질을 이해하는 방법을 소개합니다.
진단리포트 샘플 보기
한국의 AI Hub 그리고 세계적인 Kaggle 및 HuggingFace 등 주요 출처의 공개 데이터셋에 대한 진단리포트들이 준비되어 있습니다.Pro 요금제부터 가능한 고객 데이터 진단
이미지 외(텍스트, 멀티모달, 정형 등) 데이터셋 진단 상담 필요
요금제 지불 방법
Free
무료 이용 가능!
데이터 클리닉의 기본 기능 및 페블러스 추천 컨텐츠를 체험할 수 있습니다.
Basic
1만원/월
다양한 퍼블릭 데이터를 활용하여 데이터 클리닉의 기본 기능을 체험할 수 있습니다.
Pro
50만원/월
20만장 진단 크레딧 제공!
고객의 데이터에 대한 데이터클리닉 진단이 가능한 요금제입니다.
Enterprise
500만원/월
200만장 진단 크레딧 제공!
더 큰 볼륨의 데이터 품질 진단이 가능합니다. 또한 데이터 다이어트와 벌크업 같은 품질 개선 서비스도 가능한 요금제입니다.