PROGRESS
3 / 17
QUESTION 03 #399
머신러닝에서 사용하는 2차원 데이터에서 행(row)과 열(column)이 의미하는 것은?
다음 중 옳은 것을 고르세요
데이터의 2차원 구조 이해하기
머신러닝 데이터는 엑셀 표와 똑같이 생겼습니다.
엑셀로 이해하기
이름 나이 키 몸무게
행1: → [김철수, 25, 175, 70 ]
행2: → [이영희, 30, 165, 55 ]
행3: → [박민수, 22, 180, 80 ]
↑ ↑ ↑ ↑
열1 열2 열3 열4
행(Row)과 열(Column)의 의미
| 구분 | 의미 | 예시 |
|---|---|---|
| 행 (Row) | 데이터 하나 (한 사람, 한 제품) | 김철수의 정보 한 줄 |
| 열 (Column) | 특성 하나 (속성, 변수) | 모든 사람의 "나이" |
파이썬 리스트로 표현
X = [
[25, 175, 70], # ← 1행: 김철수의 데이터
[30, 165, 55], # ← 2행: 이영희의 데이터
[22, 180, 80] # ← 3행: 박민수의 데이터
]
# ↑ ↑ ↑
# 열1 열2 열3
# 나이 키 몸무게
용어 정리
| 용어 | 같은 의미 | 영어 |
|---|---|---|
| 행 | 데이터, 샘플, 레코드 | Row, Sample, Record |
| 열 | 특성, 속성, 변수 | Column, Feature, Attribute |
머신러닝에서의 의미
데이터 100개를 학습한다 = 100행을 학습한다
특성이 5개다 = 5개 열로 예측한다
shape 확인하기
넘파이/판다스로 데이터 모양을 확인할 수 있습니다:
import numpy as np
X = np.array([[25, 175, 70], [30, 165, 55], [22, 180, 80]])
print(X.shape) # (3, 3) → 3행 3열
shape = (행 개수, 열 개수)(100, 5)→ 데이터 100개, 특성 5개(1000, 20)→ 데이터 1000개, 특성 20개
실전 데이터 예시
타이타닉 생존자 예측 데이터:
성별 나이 좌석등급 운임 생존
승객1: [ 남, 22, 3, 7.25, 0 ]
승객2: [ 여, 38, 1, 71.28, 1 ]
승객3: [ 여, 26, 3, 7.92, 1 ]
↑ ↑
데이터(행) 마지막 열은 정답(y)
💡 핵심: 데이터 = 행 단위, 특성 = 열 단위. 엑셀 표를 떠올리면 됩니다.