파이썬 Datetime 사용법 (날짜 데이터 처리1)
01. 데이터 불러오기 & 확인
먼저 판다스를 import 해준다. 그리고 pd.read_csv을 이용하여 처리하고자 하는 csv파일을 불러온 뒤, 기본적인 전체 데이터 프레임의 row, columns, values를 확인한다. 오늘은 그중에서 날짜 데이터 타입에 초점을 맞춰 처리하는 방법에 대해 알아보자.
02. 날짜 columns 가져오기 : [ ]
대괄호[ ]를 이용하여 series 형태로 '날짜'라는 column에 있는 값들을 불러온다. 이때 데이터 타입(dtype)을 확인해보면 object(문자형태)로 인식하고 있음을 알 수 있다.
*series(시리즈) : 칼럼이 하나뿐인 구조체, 데이터의 순번과 데이터로만 구성된 것
*cf) DataFrame(데이터프레임) : 칼럼이 여러개인 데이터 구조체
03. object를 Datetime형태로 변환 : to_datetime( )
pandas에서는 문자형, 숫자형 등의 데이터 타입뿐만 아니라 'Datetime'이라는 날짜 형태의 데이터 타입도 있다. 따라서 02번에서 object로 인식된 데이터들을 to_datetime( )이라는 함수를 사용하면 날짜 형태로 바꿔줄 수 있다. 이때 데이터 타입(dtype)을 확인해 보면 datetime으로 변경되었음을 알 수 있다.
04. 새로운 columns 생성
다음으로는 03. 에서 Datetime으로 데이터 타입을 변경한 데이터들을 하나의 새로운 칼럼('날짜_datetime')으로 생성한다. 위의 코드를 보면,
1) df1['날짜']에 있는 데이터들을 to_datetime( )으로 데이터 타입을 변경해주고,
2) 그것을 df1['날짜_datetime']으로 선언하여 df1에 '날짜_datetime'이라는 칼럼을 새롭게 만들어 주었다.
3) 그 결과 df1이라는 데이터 프레임을 확인해보면 '날짜_datetime'이라는 새로운 칼럼이 추가된 것을 확인할 수 있다.
05. 년도, 월, 일 추출 : .dt.year/ month / day / day_name( )
이번에는 .dt 를 이용하여 df1['날짜_datetime']의 칼럼에 있는 값들을 각각 year(년), month(월), day(일), day_name(요일)로 따로 뽑아 새로운 칼럼들을 만들어준다.
이렇게 날짜 형태의 데이터를 이용하면 요일 별 출고수량 같이 세부적으로 데이터들을 나눠서 확인할 수 있게 된다.