데이터 전처리: 데이터 수집 기법 – DB 연결(ODBC
ㅁ 데이터 수집 기법
1. DB 연결(ODBC)
ㅇ 정의:
ODBC(Open Database Connectivity)는 다양한 데이터베이스에 표준화된 방식으로 연결하고 데이터를 조회·수집할 수 있도록 하는 API 규격.
ㅇ 특징:
– DBMS 종류에 관계없이 동일한 인터페이스로 접근 가능
– 드라이버를 통해 연결하며, SQL 쿼리 실행 가능
– 운영체제 및 애플리케이션 독립적
– 대규모 데이터 수집 시 네트워크 및 쿼리 최적화 필요
ㅇ 적합한 경우:
– 서로 다른 종류의 DBMS에서 데이터를 통합 수집해야 하는 경우
– 표준화된 데이터 접근 방식이 필요한 경우
– ETL 도구나 BI 툴에서 다중 데이터베이스를 연결할 때
ㅇ 시험 함정:
– ODBC는 특정 DBMS 전용이 아니라 표준 인터페이스임
– JDBC와 혼동하기 쉬움 (JDBC는 Java 전용, ODBC는 언어 독립)
– ODBC 자체가 데이터를 저장하는 기능은 없음
ㅇ 시험 대비 “패턴 보기” 예시:
– O: ODBC는 서로 다른 DBMS에 동일한 방식으로 접근하도록 해주는 표준 API이다.
– O: ODBC를 사용하면 애플리케이션은 DBMS 종류에 상관없이 데이터에 접근할 수 있다.
– X: ODBC는 오직 MySQL에만 연결할 수 있는 전용 드라이버이다.
– X: ODBC는 데이터베이스를 생성하고 관리하는 기능을 제공한다.
ㅁ 추가 학습 내용
ODBC 사용 시 각 DBMS에 맞는 ODBC 드라이버를 설치해야 하며, 드라이버 매니저가 애플리케이션과 드라이버 사이에서 중개 역할을 한다. 시험에서는 ODBC와 JDBC의 차이, OLE DB와의 관계, DSN(Data Source Name) 설정 절차가 자주 출제된다. 또한 보안 측면에서 ODBC 연결 시 인증 방식(Windows 인증, SQL Server 인증 등)과 네트워크 암호화 여부를 확인하는 문제가 나올 수 있다.