반응형
목록Data/Natural Language Processing (1)
우노
[자연어처리] Naive Bayes란?
스팸 필터 스팸 메일은 어떻게 분류 할 수 있을까? Naive Bayes 통계적 분류기 각 분류별 확률 값을 계산 분류 해주는 게 아니라 확률 값을 계산해준다. 베이즈 정리에 따라 확률 계산 확률 계산의 단서(메일에 포함된 단어)들이 서로 조건부독립임을 가정 확률 계산이 단순해진다. Naive Bayes 스팸 필터 새로운 메일이 왔다. 스팸인지 알아보려면? 해당 메일의 내용을 보지 않았을 때 예) 기존 스팸 메일과 일반 메일의 비율 만 보고 단순하게 일반 메일 80%, 스팸 메일 20%와 같이 예측 할 수 있다. 해당 메일의 내용을 봤을 때 메일에 포함된 단어들이 스팸 메일에 자주 나오는 단어인지, 일반 메일에 자주 나오는 단어인지를 살펴보고 스팸 여부를 판단 할 수 있다. 위와 같은 결과를 위해선 먼저..
Data/Natural Language Processing
2020. 11. 23. 16:20
반응형