PROGRESS
1 / 17
머신러닝 데이터의 X와 y
40 P
QUESTION 01 #397
머신러닝에서 데이터를 X와 y로 나눕니다. 다음 중 X와 y에 대한 설명으로 옳은 것은?
다음 중 옳은 것을 고르세요
머신러닝의 X와 y, 어렵지 않아요!
머신러닝은 결국 "입력을 보고 답을 맞추는 시험" 같은 것입니다.
시험 비유로 이해하기
시험 문제지: "24도, 습도 80%일 때 아이스크림 판매량은?"
시험 답안지: "100개"
| 비교 | 머신러닝 | 시험 |
|---|---|---|
| X (Feature) | 입력 특성 (24도, 습도 80%) | 문제지 |
| y (Label) | 정답 라벨 (100개) | 답안지 |
왜 대문자 X와 소문자 y로 쓸까?
- X (대문자): 여러 개의 특성이 모여 표(행렬) 형태이므로 대문자
- y (소문자): 한 줄짜리 벡터(목록) 형태이므로 소문자
X = [
[24, 80], # 첫 번째 데이터: 온도 24, 습도 80
[28, 75], # 두 번째 데이터: 온도 28, 습도 75
[30, 90] # 세 번째 데이터: 온도 30, 습도 90
]
y = [100, 120, 150] # 각각의 판매량 정답
학습 과정
- 모델에게 X와 y를 함께 보여줍니다 ("이런 날씨엔 이만큼 팔려")
- 모델은 X와 y 사이의 규칙(패턴)을 스스로 찾습니다
- 새로운 X(예: 온도 26, 습도 85)를 주면 → y(판매량)를 예측합니다
다양한 예시로 익히기
| 문제 | X (입력) | y (정답) |
|---|---|---|
| 집값 예측 | [평수, 방 개수, 위치] | 가격 |
| 스팸 분류 | [단어 수, 특수문자 개수] | 스팸 여부 (0/1) |
| 학점 예측 | [출석률, 과제 점수] | 학점 |
💡 핵심: 머신러닝의 첫 단계는 항상 "무엇이 X(입력)이고 무엇이 y(정답)인가?"를 정하는 것입니다.