우노
[DL] Sequence Model이란? 본문
Sequence Model
- Sequence Model이란, 연속적인 입력(Sequential Input)으로부터 연속적인 출력(Sequential Output)을 생성하는 모델입니다.
- 예를 들어, 챗봇(Chatbot)과 기계 번역(Machine Translation)이 대표적인 예인데,
- 챗봇(Chatbot)은 입력 시퀀스와 출력 시퀀스를 질문과 대답으로 구성한것이며
- 기계 번역(Machine Translation)은 입력 시퀀스와 출력 시퀀스를 입력 문장과 번역 문장으로 구성한 것입니다.
Sequence Data
여러 Sequence Model은 아래와 같은 Sequence Data들을 다룹니다.
위 그림을 통해, 다양한 종류의 Sequence Model들이 존재하며, 각 모델들은 여러가지 유형의 Sequence Data들을 다루는 것을 알 수 있습니다.
어떤 경우에는 입력과 출력이 모두 Sequence Data일수도,
어떤 경우에는 입력과 출력 중 하나만 Sequence Data 일 수도 있습니다.
또한, 입력과 출력이 모두 Sequence Data인 경우에, 입력과 출력의 길이가 같을수도, 다를수도 있습니다.
- 입력과 출력의 길이는 항상 같지 않습니다.
Summary
- Speech recognition (음석 인식)
- 입력 : 오디오 시퀀스
- 텍스트 : 단어 시퀀스
- 다대다 구조 (Many-to-Many)
- 보통 입력과 출력의 길이가 같습니다.
- Music generation (음악 생성)
- 입력 : 빈 집합, 정수, 음악 장르, 원하는 음악의 첫 음, etc, ..
- 출력 : 음표 시퀀스
- 일대다 구조 (One-to-Many)
- Sentiment classification (감정 분류)
- 입력 : 단어 시퀀스
- 출력 : 별점, etc, ..
- 다대일 구조 (Many-to-One)
- DNA sequence analysis (DNA 순서 분석)
- 입력 : DNA 시퀀스
- 출력 : 염기서열
- 다대다 구조 (Many-to-Many)
- 보통 입력과 출력의 길이가 같습니다.
- Machine translation (기계 번역)
- 입력 : 단어 시퀀스
- 출력 : 단어 시퀀스
- 다대다 구조 (Many-to-Many)
- 보통 입력과 출력의 길이가 다릅니다.
- Video activity recognition (비디오 인식)
- 입력 : 장면 시퀀스
- 출력 : 행동
- 다대일 구조 (Many-to-One)
- Name entity recognition (개체명 인식)
- 입력 : 단어 시퀀스
- 출력 : 개체명
- 다대다 구조 (Many-to-Many)
- 보통 입력과 출력의 길이가 같습니다.
'AI > Deep Learning' 카테고리의 다른 글
[DL] One-Hot Vector, Word Embedding (1) | 2021.02.17 |
---|---|
[DL] RNN, LSTM, GRU 란? (5) | 2021.02.16 |
[DL] Neural Style Transfer (1) | 2021.02.10 |
[DL] One Shot Learning, Siamese Network, Triplet Loss, Binary Loss (1) | 2021.02.10 |
[DL] Object Detection (Sliding Windows, YOLO) (1) | 2021.02.10 |
Comments