AI
AI를 통한 개인정보 식별 및 분석 개선
두줄요약
QueryPie는 개인정보 식별을 위해 문맥 분석 기반 AI 분류기를 도입했습니다. BERT 계열 모델과 데이터 정제, 증강으로 정확도와 규제 준수를 높였습니다.
문제 상황
- 대규모 데이터베이스에서 주소, 이름, 의료 정보 등 개인정보를 정확히 분류하기 어려운 상황
- 정규 표현식 기반 고정 패턴 방식은 다양한 표현과 신규 패턴 대응에 한계
- GDPR, CCPA, HIPAA, ISO/IEC 27701 등 규제 준수 요구가 복잡한 환경
원인 분석
- 개인정보 데이터의 형식이 표준화되어 있지 않고 표현 변형이 많음
- 기존 규칙 기반 방식은 패턴 변경 때마다 수정이 필요해 운영 효율 저하
- 분류 정확도와 규제 대응을 동시에 만족시키기 어려움
해결 방법
- 문맥 분석과 패턴 인식을 결합한 AI 분류기 도입
- BERT, KoElectra 기반 모델과 유형별 맞춤 모델 조합
- 사전 필터링, 데이터 수집·정제, 파인튜닝, 데이터 증강으로 정확도 개선
- 컨테이너 기반 배포와 자원 제어로 실시간 분류 효율 확보
성능/운영 포인트
- 유형별로 높은 분류 정확도 확보
- 과적합 방지를 위해 Early Stopping, Dropout, Batch Normalization 적용
- 불필요한 텍스트 사전 필터링으로 리소스 절감
- 글로벌 규제와 다국어 환경을 고려한 확장 계획
