본문 바로가기

반응형

pandas dataframe

(3)
[pandas] DataFrame.mean( ) 데이터프레임 열과 행 별 평균 구하기 01. 데이터 프레임의 열 별 평균 구하기 위의 샘플 데이터는 성별, 나이, BMI, 군집의 4가지 특성으로 구성되어 있다. 이때, 각 열의 평균값을 구해보자 df.mean() df(데이터 프레임)에 mean( )함수를 사용하면, 각 열의 평균값을 구할 수 있다. 위의 output을 보면 'sex', 'age', 'BMI', 'ClusterKmeans' 별 mean(평균) 값이 출력되었음을 알 수 있다. 02. 데이터 프레임의 행 별 평균 구하기 이번 샘플데이터는 군집(1,2,3)별 성별, 나이, BMI에 관련된 데이터이다. 샘플 데이터에서, 각 군집값들의 평균을 구해보자 (각 행의 평균값 구하기) df.mean(axis='columns') 데이터 프레임(sample)에 mean( ) 함수를 사용하고, ..
[ pandas ] 6. 데이터 프레임 인덱스 설정 (set_index , reset_index) 📌 set_index( ) set_index( ) 는 기존에 있던 행 인덱스를 제거하고 데이터 열(columns)중 하나를 인덱스로 재설정하는 방법이다. 먼저 전체 데이터 프레임(total)에서 기존의 인덱스 대신 파란색으로 표시된 '주문일'이라는 columns를 set_index( )를 이용하여 인덱스로 새롭게 설정해보자. set_index( )의 괄호 안에 인덱스로 설정하고 싶은 columns 이름을 적어주면 된다. 출력된 결과를 확인해보면 우리가 설정한 '주문일'이라는 columns가 인덱스로 설정되었음을 확인할 수 있다. 이때 set_index( )를 사용하여 새롭게 인덱스를 설정해주면 기존에 있던 인덱스는 사라진다. 📌 reset_index( ) reset_index( ) 는 기존에 설정되어 있..
[pandas] 3. 데이터 파악하기 (head, tail, shape, columns, dtype, isnull.sum, describe, info, unique, nunique) 데이터를 불러왔다면, 기본적으로 데이터를 파악하는 과정을 거치게 된다. 따라서 이번 게시물에서는 데이터를 파악하는 기본적인 방법들에 대해 정리하고자 한다. 🖇 (참고 : 데이터 불러오는 방법 (클릭)) 01. 상위 5개의 행 출력 : head( ) df.head() head( ) 를 사용하면 전체 데이터 프레임에서 상위 5개의 행을 출력한다. 이때 ( )안에 숫자를 적어주면 그 숫자 만큼의 행을 출력해준다. 이 경우 괄호( )안에 2를 적어 상위 2개의 행만 출력되었음을 알 수 있다. 02. 하위 5개의 행 출력 : tail( ) df.tail() head( )와 반대로 tail( ) 은 하위 5개의 행을 출력한다. 이때 head()와 마찬가지로 ( )안에 숫자를 적어주면 그 숫자만큼의 하위 행을 출력한..

반응형