머신러닝 데이터의 행과 열

30 P
QUESTION 03 #399
머신러닝에서 사용하는 2차원 데이터에서 행(row)과 열(column)이 의미하는 것은?
다음 중 옳은 것을 고르세요

데이터의 2차원 구조 이해하기

머신러닝 데이터는 엑셀 표와 똑같이 생겼습니다.

엑셀로 이해하기

         이름   나이   키    몸무게
행1: → [김철수, 25,   175,  70  ]
행2: → [이영희, 30,   165,  55  ]
행3: → [박민수, 22,   180,  80  ]
         ↑      ↑     ↑     ↑
        열1    열2   열3   열4

행(Row)과 열(Column)의 의미

구분 의미 예시
행 (Row) 데이터 하나 (한 사람, 한 제품) 김철수의 정보 한 줄
열 (Column) 특성 하나 (속성, 변수) 모든 사람의 "나이"

파이썬 리스트로 표현

X = [
    [25, 175, 70],   # ← 1행: 김철수의 데이터
    [30, 165, 55],   # ← 2행: 이영희의 데이터
    [22, 180, 80]    # ← 3행: 박민수의 데이터
]
#    ↑   ↑    ↑
#    열1 열2  열3
#   나이  키  몸무게

용어 정리

용어 같은 의미 영어
데이터, 샘플, 레코드 Row, Sample, Record
특성, 속성, 변수 Column, Feature, Attribute

머신러닝에서의 의미

데이터 100개를 학습한다 = 100행을 학습한다
특성이 5개다 = 5개 열로 예측한다

shape 확인하기

넘파이/판다스로 데이터 모양을 확인할 수 있습니다:

import numpy as np
X = np.array([[25, 175, 70], [30, 165, 55], [22, 180, 80]])
print(X.shape)  # (3, 3) → 3행 3열
  • shape = (행 개수, 열 개수)
  • (100, 5) → 데이터 100개, 특성 5개
  • (1000, 20) → 데이터 1000개, 특성 20개

실전 데이터 예시

타이타닉 생존자 예측 데이터:
         성별  나이  좌석등급  운임   생존
승객1: [ 남,  22,    3,     7.25,   0  ]
승객2: [ 여,  38,    1,    71.28,   1  ]
승객3: [ 여,  26,    3,     7.92,   1  ]
  ↑                                  ↑
  데이터(행)              마지막 열은 정답(y)

💡 핵심: 데이터 = 행 단위, 특성 = 열 단위. 엑셀 표를 떠올리면 됩니다.