시계열: Holt-Winters

ㅁ 시계열 ㅇ 정의: 시계열 데이터는 시간에 따라 관측된 데이터로, 시간 순서에 따라 변화하는 패턴을 분석하고 예측하는 데 사용되는 데이터 유형이다. ㅇ 특징: – 데이터가 시간 순서에 따라 정렬되어 있음. – 계절성, 추세, 불규칙성을 포함한 다양한 구성 요소를 가짐. – 예측 모델링과 과거 패턴 분석에 적합. ㅇ 적합한 경우: – 주식 시장, 날씨 데이터, 매출

시계열: Prophet

ㅁ 시계열 ㅇ 정의: 시계열은 시간에 따라 관측된 데이터를 분석하고 미래를 예측하는 기법으로, 주로 경제, 기상, 금융 등의 분야에서 활용된다. ㅇ 특징: 시간 순서에 따른 데이터의 패턴을 분석하며, 계절성, 추세, 불규칙성을 포함한 다양한 구성 요소를 다룬다. ㅇ 적합한 경우: 시간에 따른 데이터 패턴을 이해하거나 예측이 필요한 경우, 예를 들어 주식 시장 예측, 날씨 예보, 판매량

시계열: ARIMA

ㅁ 시계열 ㅇ 정의: 시간의 흐름에 따라 관측된 데이터를 분석하고 예측하는 통계적 방법론. ㅇ 특징: – 시간 순서에 따른 데이터의 패턴 및 변화를 분석. – 계절성, 추세, 불규칙성을 포함한 구성 요소를 식별 가능. ㅇ 적합한 경우: – 주식 시장, 기후 변화, 경제 지표 등 시간에 따라 변화하는 데이터를 다룰 때. ㅇ 시험 함정: – 계절성과

ROC/PR/랭킹: NDCG

ㅁ ROC/PR/랭킹 ㅇ 정의: – ROC/PR/랭킹 지표는 모델의 성능을 평가하기 위해 사용되는 기법으로, 주로 분류 문제나 랭킹 문제에서 활용됨. ㅇ 특징: – 주로 이진 분류나 다중 클래스 분류의 성능을 시각화하고 평가하는 데 사용됨. – 랭킹 기반 지표는 추천 시스템과 같은 응용 분야에서 모델의 성능을 평가하는 데 적합함. ㅇ 적합한 경우: – 모델의 예측 결과를 순위화하고

ROC/PR/랭킹: Cohen’s Kappa

ㅁ ROC/PR/랭킹 ㅇ 정의: ROC/PR/랭킹은 분류 및 랭킹 문제에서 모델의 성능을 평가하기 위한 지표들의 집합으로, 주로 이진 분류 및 다중 클래스 문제에서 활용됨. ㅇ 특징: – ROC 곡선은 민감도(Sensitivity)와 특이도(Specificity)의 관계를 시각화함. – PR 곡선은 Precision과 Recall의 관계를 나타냄. – 랭킹 지표는 주어진 데이터의 순위 예측 성능을 평가함. ㅇ 적합한 경우: – ROC는 불균형 데이터에서도

ROC/PR/랭킹: MCC

ㅁ ROC/PR/랭킹 ㅇ 정의: ROC/PR/랭킹 지표는 분류 모델의 성능을 평가하기 위해 사용되는 다양한 지표로, 모델의 예측 결과를 정밀도, 재현율, 정확도 등의 관점에서 분석합니다. ㅇ 특징: – 다양한 평가 지표를 통해 모델의 강점과 약점을 파악할 수 있음. – 데이터의 불균형 문제를 고려한 지표 제공 가능. ㅇ 적합한 경우: – 불균형 데이터셋에서 모델의 성능을 평가해야 하는 경우.

ROC/PR/랭킹: AUC-PR

ㅁ ROC/PR/랭킹 ㅇ 정의: ROC/PR/랭킹 지표는 분류 모델의 성능을 평가하기 위해 사용되며, 주로 이진 분류 문제에서 활용된다. 이 지표들은 모델의 예측값과 실제값 간의 관계를 시각화하거나 수치화하여 평가한다. ㅇ 특징: – ROC(Receiver Operating Characteristic) 곡선은 TPR(민감도)과 FPR(1-특이도)의 관계를 나타냄. – PR(Precision-Recall) 곡선은 정밀도와 재현율 간의 관계를 나타냄. – 랭킹 지표는 모델이 출력한 점수 기반으로 순위를 매겨

ROC/PR/랭킹: AUC-ROC

ㅁ ROC/PR/랭킹 ㅇ 정의: ROC/PR/랭킹 지표는 분류 모델의 성능을 평가하기 위한 그래프 기반의 지표로, 모델의 예측 결과와 실제 값 간의 관계를 시각적으로 표현합니다. ㅇ 특징: – ROC 곡선은 TPR(민감도)과 FPR(1-특이도)을 비교하여 모델의 분류 성능을 나타냄. – PR 곡선은 Precision(정밀도)과 Recall(재현율)을 비교하여 불균형 데이터셋에서의 성능 평가에 유리함. – 랭킹 지표는 예측값의 순위를 기반으로 모델의 성능을 평가함.

운영/검증: Feature Drift

ㅁ 운영/검증 ㅇ 정의: – 운영 중인 머신러닝 모델이 입력 데이터의 특성이 시간이 지남에 따라 변화하는 현상을 의미. ㅇ 특징: – 데이터 분포의 변화로 인해 모델 성능이 저하될 수 있음. – 주로 외부 환경 변화, 사용자 행동 변화, 데이터 수집 방식의 변경 등으로 발생. – 모델의 예측 결과가 신뢰성을 잃게 되는 주요 원인 중 하나.

운영/검증: A/B Testing

ㅁ 운영/검증 ㅇ 정의: A/B Testing은 두 가지 이상의 버전을 비교하여 어떤 버전이 더 나은 성과를 내는지 검증하는 실험 방법이다. ㅇ 특징: – 사용자 그룹을 무작위로 나누어 각기 다른 버전을 제공한다. – 성능 지표(클릭률, 전환율 등)를 기준으로 비교 분석한다. – 실험 결과는 통계적으로 유의미한 데이터를 기반으로 해석한다. ㅇ 적합한 경우: – 새로운 기능이나 UI 변경이