데이터 전처리: 데이터 거버넌스

ㅁ 데이터 거버넌스

ㅇ 정의:
조직 내 데이터의 품질, 보안, 활용, 규제 준수 등을 총괄적으로 관리하는 체계와 정책.

ㅇ 특징:
데이터의 생성부터 폐기까지 전 주기 관리, 표준화, 책임자 지정, 규제 준수 포함.

ㅇ 적합한 경우:
대규모 데이터 환경, 규제 산업(금융, 의료 등), 다부서 데이터 공유 필요 시.

ㅇ 시험 함정:
단순한 데이터베이스 관리와 혼동, IT 부서만의 역할로 한정하는 오해.

ㅇ 시험 대비 “패턴 보기” 예시:
(O) 데이터의 전 주기 관리와 규제 준수를 포함한다.
(X) 데이터베이스 성능 튜닝만을 의미한다.

================================

1. 데이터 라인리지

ㅇ 정의:
데이터가 생성·변환·이동되는 전 과정을 추적하고 시각적으로 표현하는 기술.

ㅇ 특징:
데이터 출처, 변환 규칙, 이동 경로를 명확히 파악 가능, 추적성과 감사 용이.

ㅇ 적합한 경우:
데이터 오류 원인 분석, 규제 보고, 데이터 품질 개선.

ㅇ 시험 함정:
데이터 계보를 단순한 백업 관리로 혼동.

ㅇ 시험 대비 “패턴 보기” 예시:
(O) 데이터 흐름을 시각적으로 표현하여 추적성을 확보한다.
(X) 데이터 라인리지는 데이터 암호화 기법이다.

================================

2. 데이터 카탈로그

ㅇ 정의:
조직 내 모든 데이터 자산의 메타데이터를 중앙에서 관리·검색할 수 있도록 한 시스템.

ㅇ 특징:
데이터 검색성 향상, 메타데이터 자동 수집, 태깅, 권한 관리 기능 포함.

ㅇ 적합한 경우:
데이터 셀프 서비스 분석 환경 구축, 데이터 자산 파악 필요 시.

ㅇ 시험 함정:
단순 파일 디렉토리 구조와 동일시.

ㅇ 시험 대비 “패턴 보기” 예시:
(O) 메타데이터를 기반으로 데이터 자산을 검색한다.
(X) 데이터 카탈로그는 데이터 압축 형식을 제공한다.

================================

3. GDPR

ㅇ 정의:
유럽연합(EU)의 일반개인정보보호규정으로, 개인정보 처리와 이동에 대한 엄격한 규제.

ㅇ 특징:
정보 주체의 권리 강화, 동의 기반 처리, 위반 시 막대한 과징금 부과.

ㅇ 적합한 경우:
EU 거주자 대상 서비스 운영, 개인정보 대량 처리.

ㅇ 시험 함정:
EU 외 국가에는 적용되지 않는다고 단정.

ㅇ 시험 대비 “패턴 보기” 예시:
(O) GDPR은 정보 주체의 삭제 요청권을 포함한다.
(X) GDPR은 단순한 기술 표준이다.

================================

4. 데이터 품질 관리

ㅇ 정의:
데이터의 정확성, 완전성, 일관성, 적시성을 유지·개선하는 활동과 절차.

ㅇ 특징:
품질 지표 설정, 정기적 검증, 오류 수정, 표준화.

ㅇ 적합한 경우:
의사결정의 정확성이 중요한 환경, 데이터 기반 서비스 운영.

ㅇ 시험 함정:
품질 관리를 데이터 수집 단계에서만 수행한다고 오해.

ㅇ 시험 대비 “패턴 보기” 예시:
(O) 데이터 품질 관리는 전 주기에 걸쳐 수행된다.
(X) 데이터 품질 관리는 입력 단계에서만 필요하다.

ㅁ 추가 학습 내용

정리 내용
1. 데이터 거버넌스
– 구성 요소: 정책, 표준, 역할, 책임을 명확히 구분
– 데이터 라인리지(Data Lineage)와 데이터 카탈로그(Data Catalog)는 메타데이터 관리와 밀접한 관계
– 메타데이터 유형
• 기술 메타데이터: 데이터 구조, 형식, 저장 위치 등
• 비즈니스 메타데이터: 데이터 정의, 용어, 업무 규칙 등
• 운영 메타데이터: 데이터 처리 이력, 접근 기록, 변경 내역 등
– 메타데이터 수집 방법: 자동 수집, 수동 수집

2. GDPR(일반개인정보보호법)
– 개인정보 처리 6대 원칙: 적법성·공정성·투명성, 목적 제한, 데이터 최소화, 정확성, 보관 기간 제한, 무결성과 기밀성
– 정보 주체의 권리
• 열람권
• 정정권
• 삭제권
• 처리 제한권
• 이동권
• 반대권
– 위반 시 과징금 기준: 전 세계 연간 매출액의 최대 4% 또는 2천만 유로 중 더 큰 금액

3. 데이터 품질 관리
– 품질 측정 지표: 정확성, 완전성, 일관성, 적시성, 유효성
– 품질 개선 절차: 데이터 프로파일링, 데이터 클렌징, 데이터 모니터링
– 데이터 품질 관리와 데이터 거버넌스의 차이점 숙지 필요(품질 관리는 데이터의 상태·수준 향상, 거버넌스는 데이터 관리 체계 전반)

시험 대비 체크리스트
[ ] 데이터 거버넌스의 정책·표준·역할·책임 정의와 차이점 암기
[ ] 데이터 라인리지와 데이터 카탈로그의 개념 및 메타데이터 관리와의 관계 이해
[ ] 기술·비즈니스·운영 메타데이터의 정의와 예시 구분 가능
[ ] 메타데이터 자동 수집과 수동 수집 방식의 특징 숙지
[ ] GDPR 개인정보 처리 6대 원칙 정확히 암기
[ ] GDPR 정보 주체의 6가지 권리와 의미 이해
[ ] GDPR 위반 시 과징금 기준 수치 암기
[ ] 데이터 품질 측정 지표 5가지 정의와 예시 파악
[ ] 데이터 품질 개선 절차 3단계 순서와 내용 숙지
[ ] 데이터 품질 관리와 데이터 거버넌스의 목적과 범위 차이 설명 가능

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*