파이썬 날코딩으로 알고 짜는 딥러닝
-
14장 Encoder - Decoder파이썬 날코딩으로 알고 짜는 딥러닝 2020. 12. 17. 00:50
인코더 - 디코더 구조 입출력 입력 형태와 출력 형태가 서로 독립적이다. 입력 x --(Encoder)--> Context Vector --(Decoder)-->출력 y 언어 처리에 매우 유용한 구조를 갖는다. Context Vector 인코더의 출력이자 디코더의 입력 보통 입출력에 비해 작고 간단한 형태로 설계 정보의 압축 효과 기대 입력의 형태를 변경하기에 용이 활용 입력 형태와 출력 형태가 다른 응용 분야 시각 --> 언어 : 사진의 내용을 설명하는 캡션 문구 생성 언어 --> 음원 : 텍스트 내용을 음성 합성으로 음원 생성 입력과 출력이 모두 시계열 데이터지만 입출력 사이의 시간대 의미가 서로 다른 경우 Source 언어를 Target 언어로 번역하는 경우 입출력 언어 사이의 길이나 어순, 각종 ..
-
13장 Autoencoder파이썬 날코딩으로 알고 짜는 딥러닝 2020. 12. 11. 15:28
1. 오토인코더 레이블 정보 없이 입력을 재현하는 방식으로 스스로 학습하는 비지도학습 방식의 신경망 입력 재현을 통해 데이터의 분포 특성 및 핵심 개념이나 패턴을 파악 인코더-디코더 구조를 갖음 Encoder : 입력 데이터를 정보가 압축된 중간 표현에 해당하는 코드로 변환 Decoder : 인코더에서 압축한 중간 표현으로부터 입력과 비슷한 출력 생성 입력 --(Encoder)--> 코드 --(Decoder)--> 출력 활용 보통 잘 학습된 인코더를 다른 용도로 활용한다. 오토인코더를 통해 학습된 인코더 --> 레이블 데이터가 적은 지도학습에 활용 ( 준지도 학습 ) 레이블 없이 데이터 내용만으로 유사한 데이터를 찾는 시맨틱 해싱 코드 인코더에 의해 압축된 중간 표현, 디코더는 이 정보를 처리하여 출력 ..
-
12장 CNN + RNN [장면 전환 판별 신경망]파이썬 날코딩으로 알고 짜는 딥러닝 2020. 12. 11. 14:00
1. 비순환 계층 (CNN) 에서의 시계열 데이터 처리 동영상 동영상은 초당 30장 정도의 프레임 이미지로 구성된 대표적인 시계열 데이터이다 이를 효과적으로 처리하기 위해 이미지 데이터 처리를 위한 CNN과 시계열 데이터 처리를 위한 RNN의 결합이 필요하다. RNNExtModel 시계열 데이터에 대해 CNN 같은 비 순환 계층의 처리 지원을 위한 seqwrap 계층이 있다. 동영상의 장면 전환 검출 신경망 구성에 활용된다. 동영상 데이터의 미니배치 일반적인 이미지 데이터는 [이미지행, 이미지열, 채널]로 구성된 3차원 데이터이다. 동영상 미니배치 데이터는 [미니배치, 시간, 이미지행, 이미지열, 채널]로 구성된 5차원 데이터이다. CNN은 [미니배치, 이미지행, 이미지열, 채널] 형태의 4차원 데이터 ..