Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- f1-score
- nn.Module
- pytorch
- 선형대수
- skip-gram
- deep learning
- Gated Recurrent Unit
- dl
- 분포 가설
- mlops
- 동시발생 행렬
- 벡터 간 유사도
- 상호 정보량
- Linear algebra
- 파이썬
- CBOW
- 차원 감소
- Multi-Layer Perceptron
- object detaction
- 1x1 Convolution
- convolution
- excel
- Charlse Severance
- Long Short Term Memory
- py4e
- pythonForEverybody
- Python
- docker
- 시소러스
- GoogLeNet
Archives
- Today
- Total
목록word2vec (1)
Tech & TIL
[NLP] Word2Vec
"밑바닥부터 시작하는 딥러닝 2"을 기반으로 정리한 내용입니다. Word2Vec은 앞서 살펴보았던 통계 기반 기법의 단점을 보완하고자 나온 추론 기반 기법이다. 통계 기반 기법에서는 주변 단어의 빈도를 기초로 단어를 표현했었다. 구체적으로는 동시발생 행렬을 만들고 PPMI 행렬로 변환하고 SVD로 차원을 감소시킴으로써, 거대한 sparse vector를 작은 dense vector로 변환할 수 있었다. 통계 기반 기법은 말뭉치 전체의 통계(동시발생 행렬과 PPMI 등)를 이용해 단 1회의 처리(SVD 등) 만에 단어의 분산 표현을 얻는다. 한편, 추론 기반 기법에서는, 예컨대 신경망을 이용하는 경우는 미니 배치로 학습하는 것이 일반적이다. 그림 1을 보면 통계 기반 기법은 전체 학습 데이터를 모두 사용해..
NLP
2021. 9. 23. 17:57