Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 선형대수
- Charlse Severance
- Long Short Term Memory
- 상호 정보량
- object detaction
- convolution
- 차원 감소
- py4e
- f1-score
- skip-gram
- CBOW
- pythonForEverybody
- Linear algebra
- excel
- pytorch
- 분포 가설
- 벡터 간 유사도
- Multi-Layer Perceptron
- Gated Recurrent Unit
- 동시발생 행렬
- 1x1 Convolution
- dl
- nn.Module
- docker
- Python
- 시소러스
- mlops
- GoogLeNet
- deep learning
- 파이썬
Archives
- Today
- Total
목록CBOW (1)
Tech & TIL
[NLP] Word2Vec
"밑바닥부터 시작하는 딥러닝 2"을 기반으로 정리한 내용입니다. Word2Vec은 앞서 살펴보았던 통계 기반 기법의 단점을 보완하고자 나온 추론 기반 기법이다. 통계 기반 기법에서는 주변 단어의 빈도를 기초로 단어를 표현했었다. 구체적으로는 동시발생 행렬을 만들고 PPMI 행렬로 변환하고 SVD로 차원을 감소시킴으로써, 거대한 sparse vector를 작은 dense vector로 변환할 수 있었다. 통계 기반 기법은 말뭉치 전체의 통계(동시발생 행렬과 PPMI 등)를 이용해 단 1회의 처리(SVD 등) 만에 단어의 분산 표현을 얻는다. 한편, 추론 기반 기법에서는, 예컨대 신경망을 이용하는 경우는 미니 배치로 학습하는 것이 일반적이다. 그림 1을 보면 통계 기반 기법은 전체 학습 데이터를 모두 사용해..
NLP
2021. 9. 23. 17:57