파이온 - Python Online Learning

지도학습 vs 비지도학습

비유로 이해하기

지도학습 (Supervised) - "답안지 있는 공부"

선생님: "이 사진은 강아지야 (정답)"
        "이 사진은 고양이야 (정답)"
        ...
        (1000장 학습)

학생:   "새 사진을 보고 강아지/고양이 맞춰볼게요!"

비지도학습 (Unsupervised) - "답 없이 분류하기"

선생님: "여기 사진 1000장이 있어. 비슷한 것끼리 묶어봐"
        (정답은 안 알려줌)

학생:   "음... 털 있는 것과 없는 것? 큰 것과 작은 것?
        스스로 패턴을 찾아봐야겠어요"

핵심 차이점

비교	지도학습	비지도학습
정답(y)	✅ 있음	❌ 없음
데이터	X와 y 모두 필요	X만 있음
목적	정답 예측	패턴/그룹 발견
평가	정확도 측정 가능	평가 어려움

지도학습 예시

1. 분류 (Classification)

X = [이메일1, 이메일2, ...]   # 입력
y = [스팸, 정상, ...]         # 정답 (사람이 라벨링)

# 모델 학습 후
model.predict(새이메일)  # → "스팸" 또는 "정상"

2. 회귀 (Regression)

X = [[평수, 위치, 층], ...]   # 입력
y = [3억, 5억, ...]           # 정답 (실제 거래 가격)

# 모델 학습 후
model.predict([35평, 강남, 10층])  # → "7억"

비지도학습 예시

1. 군집화 (Clustering)

X = [고객1정보, 고객2정보, ...]   # 입력만 있음
# 정답 없음!

# 모델이 스스로 발견
# → "VIP 그룹, 일반 그룹, 신규 그룹"

2. 차원 축소

# 100개 특성을 2~3개로 줄임
# 시각화나 데이터 압축에 사용

어떻게 선택할까?

질문: "맞춰야 할 정답이 있나요?"

  YES → 지도학습
        ├─ 결과가 카테고리? → 분류 (스팸/정상, A/B/C)
        └─ 결과가 숫자?    → 회귀 (가격, 점수)

  NO  → 비지도학습
        ├─ 그룹 찾고 싶음? → 군집화
        └─ 특성 줄이고 싶음? → 차원 축소

실전 적용 사례

문제	학습 종류	알고리즘
이메일 스팸 분류	지도학습	로지스틱 회귀
집값 예측	지도학습	선형 회귀
고양이/강아지 사진 분류	지도학습	CNN(Convolutional Neural Network)
고객 세분화	비지도학습	K-Means
추천 시스템	비지도학습	협업 필터링

강화학습은?

지도/비지도와는 다른 제3의 학습 방법
보상을 통해 시행착오로 학습 (게임 AI 등)

게임 AI: 승리 → +100점 (보상)
         패배 → -100점 (벌점)
         → 점수를 최대화하는 행동 학습

💡 핵심: 정답(y)이 있으면 지도학습, 없으면 비지도학습. 머신러닝의 80%는 지도학습입니다.

지도학습과 비지도학습의 차이

지도학습 vs 비지도학습

비유로 이해하기

지도학습 (Supervised) - "답안지 있는 공부"

비지도학습 (Unsupervised) - "답 없이 분류하기"

핵심 차이점

지도학습 예시

1. 분류 (Classification)

2. 회귀 (Regression)

비지도학습 예시

1. 군집화 (Clustering)

2. 차원 축소

어떻게 선택할까?

실전 적용 사례

강화학습은?

용어사전