본문 바로가기

반응형

💻프로그래밍/python

(39)
[pandas] DataFrame.mean( ) 데이터프레임 열과 행 별 평균 구하기 01. 데이터 프레임의 열 별 평균 구하기 위의 샘플 데이터는 성별, 나이, BMI, 군집의 4가지 특성으로 구성되어 있다. 이때, 각 열의 평균값을 구해보자 df.mean() df(데이터 프레임)에 mean( )함수를 사용하면, 각 열의 평균값을 구할 수 있다. 위의 output을 보면 'sex', 'age', 'BMI', 'ClusterKmeans' 별 mean(평균) 값이 출력되었음을 알 수 있다. 02. 데이터 프레임의 행 별 평균 구하기 이번 샘플데이터는 군집(1,2,3)별 성별, 나이, BMI에 관련된 데이터이다. 샘플 데이터에서, 각 군집값들의 평균을 구해보자 (각 행의 평균값 구하기) df.mean(axis='columns') 데이터 프레임(sample)에 mean( ) 함수를 사용하고, ..
[파이썬] Unnamed: 0없이 csv파일 불러오기 (index_col=0) 01. pd.read_csv - Unnamed : 0 pd.read_csv로 csv파일을 불러올때 매번 거슬렸던것! 자꾸 Unnamed : 0이라는 칼럼이 새로 추가되어 파일이 불러와진다. 02. 해결방법 : pd.read_csv(index_col=0) df = pd.read_csv('데이터파일명',index_col=0) 위와 같은 경우, pd.read_csv()의 인자에 'Index_col=0'을 설정해주면 Unnamed : 0없이 깔끔하게 csv파일을 불러올 수 있다.
맥 아나콘다 제거 방법 (How to remove anaconda from Mac os completely?) 주피터 노트북을 사용하다 보면 생각보다 아나콘다를 제거할 일이 가끔 생긴다. 나는 거의 판다스 프로파일링(pandas_profiling) 사용하다가 그런 일이 생겼던 것 같은데, 라이브러리들끼리 버전 안맞는 문제들 때문에 계속 에러 뜨다가 화나서 '아... 그냥 지우고 다시 깔자...'이렇게 되는 경우가 저번에도 있었는데, 오늘도 발생했다. 후... 그래서 기록해두는 Mac os에서 아나콘다(Anaconda) 깔끔히 제거하는 방법! 보통 맥북의 런치패드에서 어플을 길게 누르면 이렇게 바로 삭제할 수 있게 되는데, 아나콘다(Anaconda-Navigator)는 삭제 버튼이 없다.. 아나콘다가 지워지지도 않는다....(분노 1 추가) 그렇다... 직접 경로 따라 들어가서 지워야 한다. 'Finder' -> ..
pandas_profiling(판다스 프로파일링) 설치부터 파일 저장까지 EDA를 자동으로 해주는 판다스 프로파일링을 소개하고자 한다.👀 01. pandas_profiling(판다스 프로파일링) 설치 〰️프롬프트에서 설치 pip install -U pandas-profiling 혹은 〰️ 주피터 노트북에서 설치 !pip install pandas_profiling 02. pandas_profiling(판다스 프로파일링) 적용할 데이터 불러오기 import pandas as pd import pandas_profiling 데이터를 불러오기 위해 pandas를 import 해주고, 설치한 pandas_profiling도 import 한다. df = pd.read_csv('test.csv') df.head() pd.read_csv('파일명')으로 데이터를 불러오고, df로 선언해주..
[파이썬] pd.date_range 시계열 데이터 처리 01. pd.date_range 1-1) pd.date_range 기본 사용법 pd.date_range함수를 사용하여 시작일과 종료일(또는 기간)을 입력하면 해당 범위 내의 데이터를 생성할 수 있다. pd.date_range의 기본적인 사용법은 다음과 같다. pd.date_range("start",'end") start : 데이터의 시작 날짜/시간 지정 end : 데이터의 끝 날짜/시간 지정 1-2 ) pd.date_range 사용 예시 1 pd.date_range('2022-07-01', '2022-07-31') 해석) '2022년 07월 01'부터 '2022년 07월 31일'까지 날짜를 생성한다. 이때, 기본적으로 일별 생성이 디폴드값이다.(freq ='D') 1-3) pd.date_range 사용 ..

반응형