반응형
목록Data/Data Mining (1)
우노
[Data Mining] Finding Similar Items : Locality Sensitive Hashing
Finding Similar Items 고차원의 데이터 공간(high-dimensional space)에서 가장 유사한 아이템(near-neighbors)을 찾는 작업은 중요한 작업들 중 하나이며, 많은 분야에서 사용되고 있습니다. 페이지에서 유사한 단어 찾기 유사한 상품을 구매한 사용자 유사한 Feature 를 가진 이미지 하지만, 아이템 간 유사도 계산 과정에서는 다양한 문제들이 발생할 수 있습니다. 각 아이템들의 Feature 표현 방식 각 아이템들의 Feature Vector Dimension 유사도 계산 시의 시간 복잡도 따라서, 해당 포스트에서는 여러개의 파일들(C1, C2, ..., Cn) 중 악성코드 파일을 찾는 작업이 주어졌을 때 해당 작업에서 발생할 수 있는 문제들과, 각각의 문제들을 ..
Data/Data Mining
2021. 10. 2. 18:21
반응형