[pandas] DataFrame.mean( ) 데이터프레임 열과 행 별 평균 구하기
01. 데이터 프레임의 열 별 평균 구하기 위의 샘플 데이터는 성별, 나이, BMI, 군집의 4가지 특성으로 구성되어 있다. 이때, 각 열의 평균값을 구해보자 df.mean() df(데이터 프레임)에 mean( )함수를 사용하면, 각 열의 평균값을 구할 수 있다. 위의 output을 보면 'sex', 'age', 'BMI', 'ClusterKmeans' 별 mean(평균) 값이 출력되었음을 알 수 있다. 02. 데이터 프레임의 행 별 평균 구하기 이번 샘플데이터는 군집(1,2,3)별 성별, 나이, BMI에 관련된 데이터이다. 샘플 데이터에서, 각 군집값들의 평균을 구해보자 (각 행의 평균값 구하기) df.mean(axis='columns') 데이터 프레임(sample)에 mean( ) 함수를 사용하고, ..
[pandas] 3. 데이터 파악하기 (head, tail, shape, columns, dtype, isnull.sum, describe, info, unique, nunique)
데이터를 불러왔다면, 기본적으로 데이터를 파악하는 과정을 거치게 된다. 따라서 이번 게시물에서는 데이터를 파악하는 기본적인 방법들에 대해 정리하고자 한다. 🖇 (참고 : 데이터 불러오는 방법 (클릭)) 01. 상위 5개의 행 출력 : head( ) df.head() head( ) 를 사용하면 전체 데이터 프레임에서 상위 5개의 행을 출력한다. 이때 ( )안에 숫자를 적어주면 그 숫자 만큼의 행을 출력해준다. 이 경우 괄호( )안에 2를 적어 상위 2개의 행만 출력되었음을 알 수 있다. 02. 하위 5개의 행 출력 : tail( ) df.tail() head( )와 반대로 tail( ) 은 하위 5개의 행을 출력한다. 이때 head()와 마찬가지로 ( )안에 숫자를 적어주면 그 숫자만큼의 하위 행을 출력한..