데이터마이닝 (11) 썸네일형 리스트형 [데이터마이닝] 3. 유사항목 찾기(Finding Similar Items) - 1 주어진 많은 아이템 중에서 무엇이 input과 가장 비슷한가.? 모든 아이템을 비교해 보면 되지만. 그것은 사실상 불가능하다. 시간이 오래 걸리기 때문이다. 따라서 해싱을 이용한다 해싱이라는것은 굉장히 효율적인 방법이다. 삽입 삭제 찾기 .. 해싱을 이용하면 O(1)이다. LSH는 해싱을 하는데 주변에 있는지(simillar)한지를 알아챌 수 있는것. 모든 pair를 다 보지 않고 100*100 정도면 제곱에 비례하게 되는 이런 상황이 괜찮을수 있겠지만 더 커지면 힘들다. item을 hash bucket으로 여러 hash fuction을 써서 mapping한다. 비슷하다면 같은 bucket으로 mapping이 잘 될것이다. 한번이라도 같은 bucket에 들어간 것들과 input과의 유사도를 구하면 효율적.. 이전 1 2 다음