머신러닝 데이터의 X와 y

40 P
QUESTION 01 #397
머신러닝에서 데이터를 X와 y로 나눕니다. 다음 중 X와 y에 대한 설명으로 옳은 것은?
다음 중 옳은 것을 고르세요

머신러닝의 X와 y, 어렵지 않아요!

머신러닝은 결국 "입력을 보고 답을 맞추는 시험" 같은 것입니다.

시험 비유로 이해하기

시험 문제지: "24도, 습도 80%일 때 아이스크림 판매량은?"
시험 답안지: "100개"
비교 머신러닝 시험
X (Feature) 입력 특성 (24도, 습도 80%) 문제지
y (Label) 정답 라벨 (100개) 답안지

왜 대문자 X와 소문자 y로 쓸까?

  • X (대문자): 여러 개의 특성이 모여 표(행렬) 형태이므로 대문자
  • y (소문자): 한 줄짜리 벡터(목록) 형태이므로 소문자
X = [
    [24, 80],   # 첫 번째 데이터: 온도 24, 습도 80
    [28, 75],   # 두 번째 데이터: 온도 28, 습도 75
    [30, 90]    # 세 번째 데이터: 온도 30, 습도 90
]
y = [100, 120, 150]  # 각각의 판매량 정답

학습 과정

  1. 모델에게 X와 y를 함께 보여줍니다 ("이런 날씨엔 이만큼 팔려")
  2. 모델은 X와 y 사이의 규칙(패턴)을 스스로 찾습니다
  3. 새로운 X(예: 온도 26, 습도 85)를 주면 → y(판매량)를 예측합니다

다양한 예시로 익히기

문제 X (입력) y (정답)
집값 예측 [평수, 방 개수, 위치] 가격
스팸 분류 [단어 수, 특수문자 개수] 스팸 여부 (0/1)
학점 예측 [출석률, 과제 점수] 학점

💡 핵심: 머신러닝의 첫 단계는 항상 "무엇이 X(입력)이고 무엇이 y(정답)인가?"를 정하는 것입니다.