[DL] Gradient Checking

오늘의 인기 글

최근 글

최근 댓글

07-02 04:47

관리 메뉴

우노

AI/Deep Learning

운호(Noah) 2021. 1. 18. 21:33

즉, 기울기에 대한 근사치를 구해서 비교하여 검증하는 방법이다.
e(엡실론) 이 매우 작다 가정하고, θ-e 와 θ+e 두 점 사이의 기울기를 구한다.
우리는 θ가 하나가 아니기 때문에, 각각의 θ(theta)에 대한 gradient 를 모두 구해야한다.
이후, gradient checking 을 이용해 구한 gradApprox 와 실제 역전파를 이용해 구한 Dvec가 비슷한지 검사한다.
2개의 벡터가 비슷한지는 어떻게 계산할까?
2개의 벡터간 거리를 산출한다.
- R_err ≤ 10^-7 : 매우 좋음
- R_err ≤ 10^-4 : 약간 문제 있음
- R_err > 10^-4 : 문제 있음
그러나, 한가지 알아야할 사실이 있다.
gradient checking 은 굉장히 비싸기 때문에 Dvec와 비슷한 값을 구했는지 검사한 후에는 gradient checking 를 꺼야한다.

'AI/Deep Learning' Related Articles

Comments