데이터 구조화: AI 전처리
파이썬의 핵심을 찌르는 단계별 퀴즈를 풀어보세요.
결측값(NaN)이란?
데이터에서 "결측값(NaN)"이 발생하는 가장 일반적인 이유는?
데이터 정규화(Scaling)가 필요한 이유
머신러닝 학습 전에 데이터를 정규화(0~1 사이 값으로 변환)하는 가장 큰 이유는?
지도학습과 비지도학습의 차이
지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning)의 가장 큰 차이는?
특성(X)과 라벨(y)의 분리
데이터셋의 각 행에서 입력 데이터(기온, 습도)와 결과 데이터(판매량)를 분리하여 각각의 리스트에 담는 과정입니다. 빈칸을 채워보세요.
데이터셋에서 0번 인덱스 추출
리스트 컴프리헨션을 이용하여 전체 데이터셋에서 기온 데이터(0번 인덱스)만 추출해 X_temp 리스트를 만들어보세요.
음수 인덱스를 활용한 라벨 추출
데이터셋의 마지막 열이 항상 정답(y)일 때, 인덱스 번호를 직접 세지 않고 뒤에서부터 접근하는 음수 인덱스를 사용해 보세요.
슬라이싱을 이용한 다중 특성 분리
기온(0번), 습도(1번) 두 개의 열을 한꺼번에 슬라이싱하여 X 리스트에 담으려고 합니다. 빈칸에 적절한 범위를 입력하세요.
데이터 구조 확인(len)
분리된 데이터셋의 개수가 맞는지 확인하기 위해 리스트의 길이를 구하는 함수를 사용해 보세요.
특정 조건 데이터 필터링
데이터셋에서 기온(0번 인덱스)이 25도 이상인 데이터의 판매량(y)만 추출하려고 합니다. 조건문을 완성해 보세요.
리스트 컴프리헨션으로 라벨 추출
리스트 컴프리헨션을 사용하여 데이터셋의 마지막 열(판매량)만 추출하여 y 리스트를 만들어보세요.
zip()으로 X와 y 동시 순회
분리된 입력 데이터(X)와 정답 데이터(y)를 zip() 함수로 묶어 함께 출력하는 코드를 완성하세요.
딕셔너리를 리스트로 변환
딕셔너리 형태의 데이터를 2차원 리스트로 변환하여 머신러닝 입력 형태로 만드는 코드를 완성하세요.
데이터 정규화(Min-Max)
입력 데이터의 값 범위를 0~1 사이로 변환하는 Min-Max 정규화를 구현하세요.
훈련/테스트 데이터 분리
전체 데이터를 훈련용(앞 3개)과 테스트용(뒤 2개)으로 나누는 코드를 완성하세요.