[25.06.08] 데이터 인코딩(원 핫 인코딩, 레이블 인코딩, 순서 인코딩)
정리구분설명예시원-핫 인코딩(One-Hot)각 카테고리에 대해 차원 하나를 할당, 해당 위치만 1, 나머지 0red → [1, 0, 0]green → [0, 1, 0]blue → [0, 0, 1]레이블 인코딩(Label)각 카테고리에 정수 코드 부여 (순서 의미 없음)red → 0green → 1blue → 2순서(순위) 인코딩(Ordinal)정수 코드에 순위 정보 포함 (간격 의미는 보장 안 됨)small → 0medium → 1large → 2원-핫:장점: 모델에 순서나 크기를 절대 주지 않음단점: 카테고리 수만큼 차원 폭발레이블:장점: 차원 증가 없음, 메모리·속도 유리단점: 알고리즘이 “0순서:장점: 등급·순위처럼 명백한 순서가 있을 때 의미 전달단점: 코드 간 간격(0→1 vs. 1→2)이 동일..
2025. 6. 8.