본문 바로가기

🤖딥러닝

딥러닝 기초 (생활코딩 정리1) - 텐서플로우(Tensorflow)를 이용한 레모네이드 판매 예측

반응형

 

 

📌 라이브러리에서 AI까지 이어지는 계층 구조

 

 

 


📌 지도 학습 과정

1) 과거의 데이터 준비하기

2) 모델의 구조 만들기

3) 데이터로 모델 학습(fit)시키기

4) 모델을 이용하여 값을 예측하기

 

 

 

➰ 과거의 데이터 준비

레모네이드 = pd.read_csv('lemonade.csv')
독립 = 레모네이드[['온도']]
종속 = 레모네이드[['판매량']]

 

 

 

➰ 모델의 구조 만들기

X = tf.keras.layers.Input(shape=[1])
Y = tf.keras.layers.Dense(1)(X)
model = tf.keras.models.Model(X,Y)
model.compile(loss='mse')

 

 

 

데이터로 모델 학습(fit)시키기

model.fit(독립, 종속, epochs=1000)

 

 

 

➰ 모델을 이용하여 값 예측

print("Predictions: ",model.predict([[15]]))

 

 

 


📌 loss의 의미

이번 학습이 몇 번째 학습인지 알려주는 부분

각 학습마다 얼마나 시간이 걸렸는지 알려주는 부분

학습이 얼마나 진행되었는지 알려주는 부분. 각 학습이 끝날 때마다 그 시점에 모델이 얼마나 정답과 가까운지 평가하는 지표

 

 

 

 

먼저 독립변수(X)와 종속변수(Y)를 준비하여 모델을 만든다. 그 후, 독립변수를 모델에 넣어주면 모델은 그에 따른 예측결과를 만들어낸다.

 

 

 

우리가 만든 모델이 얼마나 좋은지 평가하기위해, 준비한 실제 정답인 종속변수와 모델에 의해 나온 예측 결과를 비교한다.

 

 

 

모든 예측과 실제 결과를 비교하여 그 차이를 구한다.(예측-실제 결과) 각 차이의 제곱을 한 결과들의 평균을 구하고 그 값을 'loss'라고 한다.

 

 

 

만약 우리가 만든 모델이 실제 결과를 완벽히 예측했다면 예측값과 실제 값의 차이는 0이 될것이다.(즉 loss가 0) 따라서 loss가 0에 가까울수록 학습이 잘 되었다고 보면 된다. 때문에 우리는 학습을 시킬 때 loss값을 보면서 epoch마다 loss가 0에 가까워지고 있는지 확인하는 것이 중요하다.(loss가 떨어지고 있으면 학습이 되고 있다는 의미이다.) loss가 원하는 수준으로 떨어질때 까지 반복해서 학습을 시키면 된다.

 

 

 

 


📌 실습 : 레모네이드 판매 예측

 

➰ 라이브러리 사용

import tensorflow as tf
import pandas as pd

 

 

 

➰ 데이터 준비

raw.githubusercontent.com/blackdew/tensorflow1/master/csv/lemonade.csv

파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/lemonade.csv'
데이터 = pd.read_csv(파일경로)
데이터.head()

 

 

 

➰ 독립변수 & 종속변수 분리

독립 = 데이터[['온도']]
종속 = 데이터[['판매량']]
print(독립.shape, 종속.shape)

 

 

 

➰ 모델 만들기

X = tf.keras.layers.Input(shape=[1])
Y = tf.keras.layers.Dense(1)(X)
model = tf.keras.models.Model(X, Y)
model.compile(loss='mse')

 shape =[1] : 독립변수의 개수 

 Dense (1) : 종속변수의 개수

 compile  : 모델이 학습할 방법

 

 

 

➰ 모델 학습시키기

model.fit(독립, 종속, epoch=10)

독립변수와 종속변수를 넣어주고 학습시킬 수(epoch) = 10으로 설정한 뒤 학습시킨다(fit) 

 

10번 학습 시켰을때의 loss = 3498.2590 (굉장히 높은 편)

즉 우리가 만든 모델이 실제 정답을 맞히기에는 매우 부족한 모델이라는 의미이다.

( loss값이 0에 가까워져야 정답을 잘 맞힌다는 의미, 때문에 loss값은 '모델이 얼마나안 좋냐'라고 보면 된다.)

 

loss 값을 낮추기 위해 학습 횟수를 늘려보자.

 

학습을 10번 더 시켰을 때 loss값은 약 3466으로 이전보다는 loss값이 감소했다. 하지만 이 정도로는 모델이 실제 값을 정확하게 예측하기에 부족하므로 학습량을 더 많이 늘려보자.

 

 

 

model.fit(독립, 종속, epoch = 10000, verbose=0)

이번에는 epoch를 10000으로 설정하고 verbose = 0으로 하여 모델이 학습하는 동안 화면 출력을 하지 않게 설정한다.

 

 

 

학습의 결과를 다시 확인해보면 loss값이 2.2406e-04로 떨어졌다.

(e-04는 10의-4승(= 0.0001)이라는 의미로, 2.2406에 0.0001을 곱해주면 된다.)

따라서 최종 loss 값은 0.0002

loss값이 0에 가까워졌으므로 모델이 실제 값을 잘 예측한다고 볼 수 있다.

 

 

 

➰ 모델 이용하기

 

model.predict(독립)

완성된 모델에 우리가 준비한 독립변수를 넣어서 종속변수를 잘 맞추는지 확인해보자.

 

모델에 의한 예측값과 실제 값을 비교해보면 어느 정도 비슷하게 값을 맞추고 있음을 알 수 있다.

 

 

 

model.predict([[15]])

 

이제 완성된 모델을 이용해보자. 내일 온도가 15도라면 몇 개의 레모네이드를 준비해야 될까? predict에 15를 적고 값을 출력해보면 30이라는 값이 출력된다. 즉 30개의 레모네이드를 준비하면 되는 것이다.

 

 

 


참고 사이트

opentutorials.org/course/4570

반응형