[DL] Sequence Model이란?

오늘의 인기 글

최근 글

최근 댓글

07-08 19:35

관리 메뉴

우노

AI/Deep Learning

운호(Noah) 2021. 2. 15. 20:37

Sequence Model이란, 연속적인 입력(Sequential Input)으로부터 연속적인 출력(Sequential Output)을 생성하는 모델입니다.
예를 들어, 챗봇(Chatbot)과 기계 번역(Machine Translation)이 대표적인 예인데,
챗봇(Chatbot)은 입력 시퀀스와 출력 시퀀스를 질문과 대답으로 구성한것이며
기계 번역(Machine Translation)은 입력 시퀀스와 출력 시퀀스를 입력 문장과 번역 문장으로 구성한 것입니다.

여러 Sequence Model은 아래와 같은 Sequence Data들을 다룹니다.
위 그림을 통해, 다양한 종류의 Sequence Model들이 존재하며, 각 모델들은 여러가지 유형의 Sequence Data들을 다루는 것을 알 수 있습니다.
어떤 경우에는 입력과 출력이 모두 Sequence Data일수도,
어떤 경우에는 입력과 출력 중 하나만 Sequence Data 일 수도 있습니다.
또한, 입력과 출력이 모두 Sequence Data인 경우에, 입력과 출력의 길이가 같을수도, 다를수도 있습니다.
- 입력과 출력의 길이는 항상 같지 않습니다.

Speech recognition (음석 인식)
- 입력 : 오디오 시퀀스
- 텍스트 : 단어 시퀀스
- 다대다 구조 (Many-to-Many)
- 보통 입력과 출력의 길이가 같습니다.
Music generation (음악 생성)
- 입력 : 빈 집합, 정수, 음악 장르, 원하는 음악의 첫 음, etc, ..
- 출력 : 음표 시퀀스
- 일대다 구조 (One-to-Many)
Sentiment classification (감정 분류)
- 입력 : 단어 시퀀스
- 출력 : 별점, etc, ..
- 다대일 구조 (Many-to-One)
DNA sequence analysis (DNA 순서 분석)
- 입력 : DNA 시퀀스
- 출력 : 염기서열
- 다대다 구조 (Many-to-Many)
- 보통 입력과 출력의 길이가 같습니다.
Machine translation (기계 번역)
- 입력 : 단어 시퀀스
- 출력 : 단어 시퀀스
- 다대다 구조 (Many-to-Many)
- 보통 입력과 출력의 길이가 다릅니다.
Video activity recognition (비디오 인식)
- 입력 : 장면 시퀀스
- 출력 : 행동
- 다대일 구조 (Many-to-One)
Name entity recognition (개체명 인식)
- 입력 : 단어 시퀀스
- 출력 : 개체명
- 다대다 구조 (Many-to-Many)
- 보통 입력과 출력의 길이가 같습니다.

[DL] One-Hot Vector, Word Embedding (1)	2021.02.17
[DL] RNN, LSTM, GRU 란? (5)	2021.02.16
[DL] Neural Style Transfer (1)	2021.02.10
[DL] One Shot Learning, Siamese Network, Triplet Loss, Binary Loss (1)	2021.02.10
[DL] Object Detection (Sliding Windows, YOLO) (1)	2021.02.10