728x90
데이터 분석을 시작할 때, 데이터프레임의 열 타입을 정확히 파악하는 것은 매우 중요합니다.
Pandas에서는 df.info()와 df.dtypes를 사용하여 각 열의 데이터 타입과 결측치 정보를 쉽게 확인할 수 있습니다.
📌 예제 데이터프레임 생성
import pandas as pd
df = pd.DataFrame({
'이름': ['철수', '영희', '민수'],
'나이': [23, 25, 21],
'성별': ['남', '여', '남'],
'점수': [85.5, 90.0, 88.0]
})
✅ df.info() 메서드로 열 정보 확인하기
df.info() 메서드는 데이터프레임의 각 열에 대한 요약 정보를 제공합니다.
df.info()
출력 예시:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 4 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 이름 3 non-null object
1 나이 3 non-null int64
2 성별 3 non-null object
3 점수 3 non-null float64
dtypes: float64(1), int64(1), object(2)
memory usage: 224.0 bytes
설명:
- Non-Null Count: 각 열에서 결측치가 아닌 값의 개수를 나타냅니다.
- Dtype: 각 열의 데이터 타입을 보여줍니다.
- memory usage: 데이터프레임이 사용하는 메모리 용량을 나타냅니다.
🔍 df.dtypes 속성으로 열 데이터 타입 확인하기
df.dtypes 속성은 각 열의 데이터 타입만을 확인할 때 유용합니다.
df.dtypes
출력 예시:
이름 object
나이 int64
성별 object
점수 float64
dtype: object
설명:
- object: 문자열 또는 다양한 Python 객체를 포함하는 열입니다.
- int64: 64비트 정수형 데이터를 나타냅니다.
- float64: 64비트 부동소수점 숫자를 나타냅니다.
🧠 실전 팁: 특정 데이터 타입의 열만 선택하기
select_dtypes() 메서드를 사용하면 특정 데이터 타입의 열만 선택할 수 있습니다.
▶ 숫자형 열만 선택하기
df.select_dtypes(include=['number'])
▶ 문자열(object) 열만 선택하기
df.select_dtypes(include=['object'])
이 방법은 데이터 전처리나 모델링 시, 특정 타입의 열만 선택하여 작업할 때 매우 유용합니다.
728x90
'BackEnd > 파이썬' 카테고리의 다른 글
| 👉 Pandas에서 결측값 채우기 완전 정복: fillna, ffill, bfill 사용법 정리 (0) | 2025.06.12 |
|---|---|
| 🐼 Pandas에서 행 합계 계산하기: sum(axis=1) 완벽 가이드 (0) | 2025.06.11 |
| 🐼 Pandas에서 열 추가 및 삭제하기: 실전 예제로 마스터하기 (1) | 2025.06.10 |
| 🐼 Pandas에서 조건에 맞는 행 추출하기: 실무 예제로 마스터하기 (0) | 2025.06.08 |
| 🐼 Pandas의 iloc vs loc 완벽 정리: 실무 예제로 이해하기 (0) | 2025.06.07 |