2015년 10월 17일 토요일

스팸 필터링 구현하기

항상 가까운 곳에서 함께하던 스팸(SPAM)을 필터링 하기 위한, 정통적인 방식과 기계학습을 응용한 최근 방식을 소개한다. 참고 논문 : Classifying Unsolicited Bulk Email (UBE) using Python Machine Learning Techniques 논문에서 다루는 전통적인 방식과 기계학습 응용 방식의 필터링에 자연어 처리 (NLP) 기법을 추가했다. 계념도는 다음과 같다. 1. 단어 필터  - 전통적인 방식의 필터링이다.  -...