본문 바로가기

반응형

🤖딥러닝

(17)
seq2seq 개념 01. Seq2Seq란? seq2seq는 'sequence to sequence(시계열에서 시계열로)'로, 한 시계열 데이터를 다른 시계열 데이터로 변환하는 것을 의미한다. 기본적으로 seq2seqs는 RNN기반의 모델 두 개를 연결하여 구현할 수 있으며, 이를 encoder(인코더)-decoder(디코더) 모델이라고도 한다. 인코더는 입력된 정보를 취합/저장하는 역할을 하고, 디코더는 인코더로부터 축약된 정보들을 풀어서 반환/생성해주는 역할을 한다. 하나의 문장을 시퀀스로 볼 수 있는데, 이때 어떠한 언어 문장(ex. 안녕!)을 또 다른 언어의 문장(ex.Hi!)으로 번역하는 것이 seq2seq의 대표적인 예이다. 02. Seq2Seq원리 seq2seq는 인코더&디코더라는 두 개의 모듈로 구성된다. 이..
다중 분류 손실함수(categorical_crossentropy 와sparse_categorical_crossentropy 차이) 손실 함수(loss function)는 해당 데이터를 가지고 어떤 형태의 예측을 할 것인지에 따라 선택하면 되는데, 그중, 다중 클래스 분류를 위해 사용되는 손실 함수에 대해 정리해보고자 한다. 일반적으로 다중 클래스 분류 시 'categorical_crossentropy'를 손실함수로 사용한다. 그런데 'sparse_categorical_crossentropy'또한 다중 클래스 분류 시 손실 함수로 사용할 수 있다. 그렇다면 두 손실함수는 어떤 차이가 있을까? 결론적으로, 훈련데이터의 label(y / target) 값이 원-핫 벡터 형태인경우 categorical_crossentropy 를 사용하고 훈련 데이터의 label(y / target) 값이 정수(Int) 형태인 경우에는 sparse_cate..
[딥러닝] Object detection (2)(R-CNN / Fast R-CNN / Faster R-CNN 총정리) 01. R-CNN ➰ R-CNN의 작동원리 1️⃣ Input 이미지를 가지고 CPU상에서 selective search를 진행하여 물체가 존재할 것 같은 지역(ROI)을 2000개 정도 뽑아낸다. 2️⃣ 이렇게 뽑아낸 ROI(Refions Of Interest)들은 각각 다른 크기와 위치를 가진다. 때문에 이를 corp & warp 하여 CNN에 들어가기 좋은 정사각 형태로 만든다. 3️⃣ 각각의 ROI들을 ConvNet으로 돌려 feature vector를 추출한다. 4️⃣ 추출된 feature vector들을 SVMs을 이용하여 어떤 클래스에 해당되는지, 그리고 Regressor를 이용하여 정확한 물체의 위치가 어딘지 bounding box를 조절한다. ✔️ 위의 단계를 조금 더 구체적으로 보자면, ..
[딥러닝] Object detection(Region proposal / Sliding window / Selective search) 1. Object detection 이미지 내에서 사물을 인식하는 방법에는 다양한 유형이 존재하는데, 그중 Object detection에 대해 정리하고자 한다. Object detection은 이미지내에 불특정 다수의 object가 있을때, 각 object의 위치와 클래스정보를 알려주는 것이다. object detection을 접근하는 아이디어는 크게 2가지가 있다. 예를 들어, 한 장의 이미지에 고양이, 강아지, 오리 등의 다양한 object가 있을 때 고양이(클래스)는 여기에(위치), 강아지는 저기에 이러한 정보를 맞추는 것이다. ➰ 아이디어1️⃣: Regression 앞서 Localization을 regression으로 간주했듯, regression을 기반으로 object detection을 접근..
[딥러닝] CNN(Convolutional Neural Networks)(1) : convolutional layer / activation map (feature map) / filter / stride / zero padding / pooling layer / Max pooling / parameter sharing 1. CNN(Convolutional Neural Networks) 구조 2. Convolutional Layer 가장 먼저, CNN에서 가장 주요한 구성 요소인 Convolutional layer(합성곱 층)의 구성 요소와 작동 원리를 알아보자. 기본적으로 Convolution Layer에는 input값인 이미지와 필터(= 합성곱 커널:convolution kernel)가 있다. 위의 그림처럼, 필터(= 커널: kernel)가 이미지의 위에서부터 차례대로 내려오면서(sliding) dot products를 해나간다. 다시 말해 32 * 32 * 3의 크기의 이미지에 5 * 5* 3의 필터로 차례대로 훑고 내려오면서 5 * 5* 3(즉 75번)의 dot product 연산을 하는 것이다. 또한 각각의 d..

반응형