(Distributed Representation)
원핫 인코딩
I : [1 0 0 0]
am : [0 1 0 0]
a : [0 0 1 0]
student : [0 0 0 1]
단점: 단어 간의 유사도를 구할 수 없음
두 벡터 간의 내적이 항상 0이 되기 때문에 단어 간의 관계를 파악할 수 없음

임베딩
원핫 인코딩의 단점을 해결
단어를 차원이 일정한 벡터로 나타냄
[0.04227, -0.0033, 0.1607, -0.0236, ...]
→ 각 요소가 연속적인 값
예) Word2Vec 등