데이터 전처리: 동기화 기법 – 실시간 동기화
ㅁ 동기화 기법
ㅇ 정의:
ㅇ 특징:
ㅇ 적합한 경우:
ㅇ 시험 함정:
ㅇ 시험 대비 “패턴 보기” 예시:
================================
1. 실시간 동기화
ㅇ 정의:
– 데이터가 생성되거나 변경되는 즉시 네트워크를 통해 다른 시스템이나 저장소에 반영하는 방식의 동기화 기법.
– 지연 없이 데이터 일관성을 유지하는 것을 목표로 함.
ㅇ 특징:
– 이벤트 기반 또는 스트리밍 기반으로 동작.
– 메시지 큐, 웹소켓, Change Data Capture(CDC) 기술 활용.
– 네트워크 및 처리 지연이 최소화되어야 함.
– 시스템 부하가 높아질 수 있음.
ㅇ 적합한 경우:
– 금융 거래, 주식 시세, 실시간 모니터링 등 데이터의 시의성이 중요한 서비스.
– 여러 시스템 간 데이터 불일치가 치명적인 경우.
ㅇ 시험 함정:
– ‘실시간’이라는 용어를 ‘즉시 처리’와 혼동할 수 있음. 실제로는 수 밀리초~수 초의 지연이 있을 수 있음.
– 배치 동기화와 구분 문제에서 주기적 갱신을 실시간으로 오인하는 경우.
ㅇ 시험 대비 “패턴 보기” 예시:
– O: “변경 즉시 다른 시스템에 반영되는 데이터 동기화 방식”
– X: “하루에 한 번 동기화하는 방식”
– O: “금융 거래와 같이 지연이 허용되지 않는 서비스에 적합”
– X: “네트워크 부하와 무관하게 항상 효율적임”
ㅁ 추가 학습 내용
실시간 동기화에서는 데이터 전송 방식으로 푸시(push)와 풀(pull)이 있으며, 네트워크 프로토콜로는 WebSocket, gRPC, MQTT 등이 자주 사용된다. 장애 발생 시 재처리 메커니즘으로는 재전송과 로그 기반 복구가 있다. CAP 이론 관점에서 실시간 동기화는 일관성을 우선시하는 경우가 많으며, 이로 인해 고가용성과의 트레이드오프가 발생한다. 시험에서는 실시간 동기화와 준실시간(near real-time) 동기화를 구분하는 문제가 나올 수 있으므로, 지연 허용 범위와 구현 기술의 차이를 명확히 이해해야 한다.