파이온 - Python Online Learning

AI/머신러닝 기초 과정

데이터 구조화: AI 전처리

PROGRESS

11 / 17

단원 데이터 구조화: AI 전처리 17 데이터의 규칙: 예측 로직 14 옷의 시너스: 판단 로직 1 예와 아니오: 판단 로직 6 닮은꼴 찾기: 관계 로직 7 최적의 경로: 강화 로직 7 층층이 지능: 신경망 로직 7 전체 목록

이전 문제 다음 문제

데이터 구조 확인(len)

40 P

QUESTION 11 #334

분리된 데이터셋의 개수가 맞는지 확인하기 위해 리스트의 길이를 구하는 함수를 사용해 보세요.

main.py

X = [[20, 70], [25, 80], [30, 85]]

# 데이터의 총 개수 확인
data_count = (X)

print(f"데이터 개수는 {data_count}개입니다.")

HINT

영단어 Length의 약자 세 글자를 입력하세요.

실행 결과 예시

데이터 개수는 3개입니다.

INTERACTIVE SHELL Shift + Enter 로 즉시 실행

📏 데이터 개수 확인이 왜 중요한가?

머신러닝 모델을 학습시킬 때, 입력 데이터(X)의 개수와 정답 데이터(y)의 개수가 일치하지 않으면 오류가 발생합니다.

len() 함수의 역할

X = [[20, 70], [25, 80], [30, 85]]
y = [50, 80, 110]

print(len(X))  # 3
print(len(y))  # 3

len()은 리스트에 포함된 요소의 개수를 반환합니다.

데이터 검증 패턴

학습 전에 항상 아래와 같은 검증을 수행합니다:

# 데이터 개수 일치 확인
assert len(X) == len(y), "X와 y의 개수가 다릅니다!"

# 각 데이터의 특성 개수 확인
print(f"데이터 개수: {len(X)}개")
print(f"특성 개수: {len(X[0])}개")

2차원 리스트에서의 len()

코드	결과	의미
len(X)	3	데이터(행)의 개수
len(X[0])	2	첫 번째 행의 특성(열) 개수

실무에서 자주 발생하는 오류

# 오류 상황: X는 100개, y는 99개
X = [[...]] * 100
y = [...] * 99

model.fit(X, y)
# ValueError: X와 y의 샘플 수가 다릅니다!

이런 오류를 방지하기 위해 학습 전 len() 확인은 필수적인 습관입니다.

용어사전