[DL] TFLite 양자화 적용 상태 확인 방법

오늘의 인기 글

최근 글

최근 댓글

Today

Total

05-23 17:56

관리 메뉴

우노

[DL] TFLite 양자화 적용 상태 확인 방법 본문

AI/Deep Learning

[DL] TFLite 양자화 적용 상태 확인 방법

운호(Noah) 2022. 6. 6. 14:05

들어가기 앞서,

TFLite는, interpreter의 input type과 output type을 통해 양자화 적용 상태를 확인할 수 있습니다.

예제 코드

import tensorflow as tf

interpreter = tf.lite.Interpreter(model_path="tflite모델경로")

input_type = interpreter.get_input_details()[0]['dtype']
print('input: ', input_type)
output_type = interpreter.get_output_details()[0]['dtype']
print('output: ', output_type)

# FP32 이므로, 양자화 없이 TFLite로 변환된 모델인 것을 확인할 수 있습니다.
input:  <class 'numpy.float32'>
output:  <class 'numpy.float32'>

추가

FP16 으로 양자화한 모델의 input type 과 output type 이 ‘numpy.float32’ 로 나온다면,
FP32 모델의 저장 파일 크기와 FP16 모델의 저장 파일 크기를 비교하시면 됩니다.

정상적으로 양자화됐을 경우, FP16 모델의 크기는 FP32 모델 크기의 절반이 됩니다.

  ls -lh

  # FP32 모델의 크기는 83k
  -rw-rw-r-- 1 kbuilder kbuilder 83K Aug 14 00:42 mnist_model.tflite
  # FP16 모델의 크기는 44k
  -rw-rw-r-- 1 kbuilder kbuilder 44K Aug 14 00:42 mnist_model_quant_f16.tflite

참고

https://www.tensorflow.org/lite/performance/post_training_integer_quant?hl=ko

'AI > Deep Learning' 카테고리의 다른 글

[DL] yolov5 모델 양자화 명령어 (0)	2022.07.07
[DL] GPU 메모리 사용량 지정 방법 (0)	2022.06.07
[DL] import tflite_runtime.interpreter as tflite 호출 에러 (0)	2022.05.25
[DL] HDF5 와 SavedModel 간 변환 (0)	2022.04.10
[DL] BERT 모델을 사용한 IMDb 데이터 추론 (0)	2022.03.24

'AI/Deep Learning' Related Articles

Comments

우노

[DL] TFLite 양자화 적용 상태 확인 방법 본문

[DL] TFLite 양자화 적용 상태 확인 방법

들어가기 앞서,

예제 코드

추가

참고

'AI > Deep Learning' 카테고리의 다른 글

티스토리툴바