1. WordCloud
- okt
- mecab
- komoran
- 분석기 별 특징
- 형태소분석기별 accuracy 비교
2. 다양한 인코딩 방법
- 기존 인코딩 : 정수 인코딩(Ont-hot-encoding)
1) Bag of Words(BoW)
- Bag of Words
- 모델별 정확도 (integer encoding >> BoW)
- insight
2) Word2Vec
3) TF-IDF
- Term Frequency-Inverse Document Frequency
- TF-IDF 정확도 개선
- insight