데이터 전처리: 데이터 저장 – 클라우드 스토리지
ㅁ 데이터 저장
ㅇ 정의:
데이터를 장기 보관하거나 분석, 공유를 위해 물리적 또는 가상 저장소에 보관하는 과정.
ㅇ 특징:
– 대용량 데이터를 안정적으로 저장 가능
– 접근 권한 관리 및 보안 기능 제공
– 백업 및 복구 기능 포함
ㅇ 적합한 경우:
– 수집된 데이터를 장기간 보관해야 하는 경우
– 여러 지역/조직에서 동일 데이터에 접근해야 하는 경우
ㅇ 시험 함정:
– 저장소의 종류와 전송 방식(스트리밍/배치)을 혼동
– 저장소 성격(휘발성/비휘발성) 구분 오류
ㅇ 시험 대비 “패턴 보기” 예시:
O: “데이터 저장소는 장기 보관과 접근 제어 기능을 제공한다.”
X: “데이터 저장소는 실시간 처리 속도를 높이기 위해 사용된다.”
================================
1. 클라우드 스토리지
ㅇ 정의:
인터넷을 통해 원격 서버에 데이터를 저장하고 관리하는 서비스로, 사용자는 네트워크를 통해 데이터에 접근 가능.
ㅇ 특징:
– 확장성이 뛰어나 필요 시 저장 용량을 유연하게 조절 가능
– 초기 인프라 구축 비용이 낮음
– 데이터 백업과 재해 복구 기능 내장
– 다양한 디바이스에서 접근 가능
ㅇ 적합한 경우:
– 글로벌 팀이 동일 데이터에 접근해야 하는 경우
– 데이터 양이 예측 불가능하게 증가하는 프로젝트
– IT 인프라 관리 부담을 줄이고 싶은 경우
ㅇ 시험 함정:
– 클라우드 스토리지와 로컬 NAS(Network Attached Storage)를 혼동
– 클라우드 스토리지가 항상 무료이거나 무제한인 것으로 오해
– 전송 속도와 저장 속도를 동일하게 보는 오류
ㅇ 시험 대비 “패턴 보기” 예시:
O: “클라우드 스토리지는 인터넷을 통해 원격 서버에 데이터를 저장한다.”
X: “클라우드 스토리지는 반드시 물리적으로 사용자의 사무실에 설치된다.”
ㅁ 추가 학습 내용
클라우드 스토리지는 퍼블릭, 프라이빗, 하이브리드 형태로 구분되며, 형태에 따라 보안 수준과 비용 구조가 다르다. 시험에서는 보안 규제 준수(GDPR, HIPAA 등)와 데이터 저장 위치(Region) 선택이 중요한 포인트다. 객체 스토리지(Object Storage)와 블록 스토리지(Block Storage)의 차이를 이해해야 하며, 전송 중 암호화(TLS)와 저장 시 암호화(At-rest encryption) 개념도 숙지해야 한다. 비용 구조에서는 저장 용량뿐 아니라 데이터 전송량(egress) 과금 방식이 함정으로 출제될 수 있다.