PROGRESS
11 / 17
단원
데이터 구조화: AI 전처리 17
데이터의 규칙: 예측 로직 14
옷의 시너스: 판단 로직 1
예와 아니오: 판단 로직 6
닮은꼴 찾기: 관계 로직 7
최적의 경로: 강화 로직 7
층층이 지능: 신경망 로직 7
전체 목록
QUESTION 11 #334
분리된 데이터셋의 개수가 맞는지 확인하기 위해 리스트의 길이를 구하는 함수를 사용해 보세요.
main.py
X = [[20, 70], [25, 80], [30, 85]]
# 데이터의 총 개수 확인
data_count = (X)
print(f"데이터 개수는 {data_count}개입니다.")
HINT
영단어 Length의 약자 세 글자를 입력하세요.
실행 결과 예시
데이터 개수는 3개입니다.
INTERACTIVE SHELL
Shift + Enter 로 즉시 실행
📏 데이터 개수 확인이 왜 중요한가?
머신러닝 모델을 학습시킬 때, 입력 데이터(X)의 개수와 정답 데이터(y)의 개수가 일치하지 않으면 오류가 발생합니다.
len() 함수의 역할
X = [[20, 70], [25, 80], [30, 85]]
y = [50, 80, 110]
print(len(X)) # 3
print(len(y)) # 3
len()은 리스트에 포함된 요소의 개수를 반환합니다.
데이터 검증 패턴
학습 전에 항상 아래와 같은 검증을 수행합니다:
# 데이터 개수 일치 확인
assert len(X) == len(y), "X와 y의 개수가 다릅니다!"
# 각 데이터의 특성 개수 확인
print(f"데이터 개수: {len(X)}개")
print(f"특성 개수: {len(X[0])}개")
2차원 리스트에서의 len()
| 코드 | 결과 | 의미 |
|---|---|---|
| len(X) | 3 | 데이터(행)의 개수 |
| len(X[0]) | 2 | 첫 번째 행의 특성(열) 개수 |
실무에서 자주 발생하는 오류
# 오류 상황: X는 100개, y는 99개
X = [[...]] * 100
y = [...] * 99
model.fit(X, y)
# ValueError: X와 y의 샘플 수가 다릅니다!
이런 오류를 방지하기 위해 학습 전 len() 확인은 필수적인 습관입니다.