데이터 전처리: 데이터 소스 및 저장소 – 로컬 파일시스템

ㅁ 데이터 소스 및 저장소

ㅇ 정의:
– 로컬 파일시스템은 데이터가 사용자의 컴퓨터나 서버의 내부 저장 장치(HDD, SSD 등)에 저장되는 방식으로, 네트워크를 거치지 않고 직접 접근 가능한 저장소를 의미함.

ㅇ 특징:
– 접근 속도가 빠르고 네트워크 연결이 불필요함.
– 외부 의존성이 낮아 보안성이 높을 수 있으나, 물리적 장애에 취약함.
– 저장 용량이 장치의 물리적 한계에 종속됨.

ㅇ 적합한 경우:
– 소규모 데이터 분석, 개인 프로젝트, 네트워크가 불안정한 환경.
– 초기 데이터 수집 및 실험 단계.

ㅇ 시험 함정:
– 로컬 파일시스템은 항상 안전하다는 오해 → 백업 없으면 데이터 손실 위험 큼.
– 대규모 분산 처리에 적합하다고 착각하는 경우.

ㅇ 시험 대비 “패턴 보기” 예시:
– O: “로컬 파일시스템은 네트워크 없이 데이터 접근이 가능하다.”
– O: “로컬 파일시스템은 저장 장치의 물리적 용량에 제한을 받는다.”
– X: “로컬 파일시스템은 클라우드 기반이므로 인터넷 연결이 필수적이다.”
– X: “로컬 파일시스템은 장애 발생 시 자동으로 다른 서버에서 복구된다.”

ㅁ 추가 학습 내용

로컬 파일시스템은 단일 장치 기반으로 동작하며 네트워크 연결이 필요 없다. 장애 발생 시 자동 복구 기능이 없으므로 수동 복구가 필요하다. NAS나 HDFS와 비교할 때 이러한 점이 주요 차이점으로 시험에 자주 출제된다.
파일 접근 방식에는 절대 경로와 상대 경로가 있으며, 파일 권한 관리는 읽기, 쓰기, 실행 권한으로 구분된다. 운영체제별로 사용하는 파일시스템 종류가 다르며, 예를 들어 Windows는 NTFS, Linux는 ext4를 사용한다.
백업 전략으로는 정기적으로 외부 저장소에 복사하는 방법이 있고, 보안 측면에서는 물리적 접근을 제한하는 것이 중요하다.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*