본문 바로가기

💻프로그래밍/python

pandas_profiling(판다스 프로파일링) 설치부터 파일 저장까지

반응형

EDA를 자동으로 해주는 판다스 프로파일링을 소개하고자 한다.👀

 

 

01. pandas_profiling(판다스 프로파일링) 설치

 

〰️프롬프트에서 설치

pip install -U pandas-profiling

 

혹은

 

〰️ 주피터 노트북에서 설치

!pip install pandas_profiling

 

 


02. pandas_profiling(판다스 프로파일링) 적용할 데이터 불러오기 

 

import pandas as pd
import pandas_profiling

데이터를 불러오기 위해 pandas를 import 해주고,

설치한 pandas_profiling도 import 한다.

 

 

 

df = pd.read_csv('test.csv')
df.head()

pd.read_csv('파일명')으로 데이터를 불러오고, df로 선언해주었다.

pandas_profile 사용할 준비 완료!

 

 

 

 


03. profilie_report(프로파일 리포트) 생성

 

df.profilie_report()

불러온 df(데이터 프레임)에 profilie_report( )를 적용하여 프로파일 리포트를 생성해준다. 

 

 

 

profilie_report가 완성되었다.

스크롤 내려서 확인해보면 자동적으로 EDA 한 결과들이 출력되어있다.

 

 

 

 


04. profile_report(프로파일 리포트) 파일로 저장

 

내가 만든 프로파일 리포트(profile_report)를 하나의 파일로 저장하고 싶다면?

total = df.profile_report()
total.to_file('profile_report.html')

df.porfile_report()를 변수(total)로 선언한 뒤,

total.to_file('파일명.html')을 통해 프로파일 리포트를html 파일로 저장한다.

 

 

 

 

html 파일로 저장하기 완료!

 

 

 

생성한 html 파일은 어디에 있느냐 하면!

해당 작업을 하고 있는 주피터 노트북 파일이 있는 위치에 profile_report.html이 생성된다.

 

 

 

열어보자!

 

profile_report.html을 열어보면 데이터 EDA 결과가 리포트 형식으로 만들어져 있다!

 

끝!

반응형