💻프로그래밍/python

[TIL] 2021-02-19 : 데이터 재구조화 : stack함수 사용법

빅데희터 2021. 2. 20. 13:08
반응형

📌  stack 

 

정형 데이터에서 가장 중요한것은 각각의 columns들이 모두 독립적이어야 한다는것이다. 하지만 위의 데이터 프레임을 보면 점포가 각각의 columns로 들어가있기때문에 서로 독립이 되어있지 않음을 알 수 있다. 즉, 각 점포에 제품별 판매량이 합계로 합쳐지기 때문에 columns가 서로 영향을 주고 있는것이다. 이러한 경우 stack( )을 사용하여 데이터 프레임을 재구조화 시켜주어야 한다.  

 

 

 

stack을 적용할때 index를 설정하지 않고 하는방법과 특정 columns을 인덱스로 지정해서 stack하는 방법이 있다. 

 

 

 

📌  index 를 설정하지 않고 stack( ) 

 

 

 

 

 

➰ 데이터 프레임 형태로 변환 : pd.DataFrame( ) 

 

 

 

📌  index를 지정한 뒤 stack  : set_index( ) 

stack을 사용할때 index를 지정해주고 싶다면, set_index( )의 괄호안에 내가 기준으로 삼고싶은 칼럼이름을 적어주면 된다. 

 

 

 

➰ 데이터 프레임 형태로 변환 : pd.DataFrame( ) 

 

 

 

 reset_index( ) 

 

 

 

반응형