본문 바로가기

BackEnd/파이썬

🐼 Pandas에서 데이터프레임 열 타입 확인하기: df.info()와 df.dtypes 활용법

728x90

데이터 분석을 시작할 때, 데이터프레임의 열 타입을 정확히 파악하는 것은 매우 중요합니다.

Pandas에서는 df.info()와 df.dtypes를 사용하여 각 열의 데이터 타입과 결측치 정보를 쉽게 확인할 수 있습니다.

 

 

📌 예제 데이터프레임 생성

import pandas as pd

df = pd.DataFrame({
    '이름': ['철수', '영희', '민수'],
    '나이': [23, 25, 21],
    '성별': ['남', '여', '남'],
    '점수': [85.5, 90.0, 88.0]
})

 

✅ df.info() 메서드로 열 정보 확인하기

df.info() 메서드는 데이터프레임의 각 열에 대한 요약 정보를 제공합니다.

df.info()

 

출력 예시:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 4 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   이름     3 non-null      object
 1   나이     3 non-null      int64
 2   성별     3 non-null      object
 3   점수     3 non-null      float64
dtypes: float64(1), int64(1), object(2)
memory usage: 224.0 bytes

 

설명:

  • Non-Null Count: 각 열에서 결측치가 아닌 값의 개수를 나타냅니다.
  • Dtype: 각 열의 데이터 타입을 보여줍니다.
  • memory usage: 데이터프레임이 사용하는 메모리 용량을 나타냅니다.

 

🔍 df.dtypes 속성으로 열 데이터 타입 확인하기

df.dtypes 속성은 각 열의 데이터 타입만을 확인할 때 유용합니다.

df.dtypes

 

출력 예시:

이름     object
나이     int64
성별     object
점수     float64
dtype: object

 

설명:

  • object: 문자열 또는 다양한 Python 객체를 포함하는 열입니다.
  • int64: 64비트 정수형 데이터를 나타냅니다.
  • float64: 64비트 부동소수점 숫자를 나타냅니다.

 

🧠 실전 팁: 특정 데이터 타입의 열만 선택하기

select_dtypes() 메서드를 사용하면 특정 데이터 타입의 열만 선택할 수 있습니다.

 

▶ 숫자형 열만 선택하기

df.select_dtypes(include=['number'])

 

▶ 문자열(object) 열만 선택하기

df.select_dtypes(include=['object'])

 

이 방법은 데이터 전처리나 모델링 시, 특정 타입의 열만 선택하여 작업할 때 매우 유용합니다.

 

 

 

 

 

728x90