오늘의 인기 글
최근 글
최근 댓글
Today
Total
11-26 05:22
관리 메뉴

우노

[DL] Sequence Model이란? 본문

AI/Deep Learning

[DL] Sequence Model이란?

운호(Noah) 2021. 2. 15. 20:37

Sequence Model

  • Sequence Model이란, 연속적인 입력(Sequential Input)으로부터 연속적인 출력(Sequential Output)을 생성하는 모델입니다.
  • 예를 들어, 챗봇(Chatbot)과 기계 번역(Machine Translation)이 대표적인 예인데,
  • 챗봇(Chatbot)은 입력 시퀀스와 출력 시퀀스를 질문과 대답으로 구성한것이며
  • 기계 번역(Machine Translation)은 입력 시퀀스와 출력 시퀀스를 입력 문장과 번역 문장으로 구성한 것입니다.

Sequence Data

  • 여러 Sequence Model은 아래와 같은 Sequence Data들을 다룹니다.

  • 위 그림을 통해, 다양한 종류의 Sequence Model들이 존재하며, 각 모델들은 여러가지 유형의 Sequence Data들을 다루는 것을 알 수 있습니다.

  • 어떤 경우에는 입력과 출력이 모두 Sequence Data일수도,

  • 어떤 경우에는 입력과 출력 중 하나만 Sequence Data 일 수도 있습니다.

  • 또한, 입력과 출력이 모두 Sequence Data인 경우에, 입력과 출력의 길이가 같을수도, 다를수도 있습니다.

    • 입력과 출력의 길이는 항상 같지 않습니다.

Summary

  • Speech recognition (음석 인식)
    • 입력 : 오디오 시퀀스
    • 텍스트 : 단어 시퀀스
    • 다대다 구조 (Many-to-Many)
    • 보통 입력과 출력의 길이가 같습니다.
  • Music generation (음악 생성)
    • 입력 : 빈 집합, 정수, 음악 장르, 원하는 음악의 첫 음, etc, ..
    • 출력 : 음표 시퀀스
    • 일대다 구조 (One-to-Many)
  • Sentiment classification (감정 분류)
    • 입력 : 단어 시퀀스
    • 출력 : 별점, etc, ..
    • 다대일 구조 (Many-to-One)
  • DNA sequence analysis (DNA 순서 분석)
    • 입력 : DNA 시퀀스
    • 출력 : 염기서열
    • 다대다 구조 (Many-to-Many)
    • 보통 입력과 출력의 길이가 같습니다.
  • Machine translation (기계 번역)
    • 입력 : 단어 시퀀스
    • 출력 : 단어 시퀀스
    • 다대다 구조 (Many-to-Many)
    • 보통 입력과 출력의 길이가 다릅니다.
  • Video activity recognition (비디오 인식)
    • 입력 : 장면 시퀀스
    • 출력 : 행동
    • 다대일 구조 (Many-to-One)
  • Name entity recognition (개체명 인식)
    • 입력 : 단어 시퀀스
    • 출력 : 개체명
    • 다대다 구조 (Many-to-Many)
    • 보통 입력과 출력의 길이가 같습니다.
Comments