05 - 1x1 Convolution의 중요성

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

Tech & TIL

05 - 1x1 Convolution의 중요성 본문

Boostcamp - AI tech/DL Basic

05 - 1x1 Convolution의 중요성

Jadon Yang 2021. 8. 12. 18:26

1x1 Convolution에 대해 알아보기 전에 1x1 Convolution이 왜 사용되기 시작했는지 이해하기 위해 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)라는 Challenge와 대회에서 수상을 했던 5개 Network 들의 주요 아이디어와 구조에 대해 알아보려고 한다.

Network List

AlexNet
- 최초로 Deep Learning을 이용하여 ILSVRC에서 수상
- ReLU를 활성화 함수로 사용함. ReLU는 0보다 큰 x값에 대해서는 gradient를 1로 보존되기 때문에 Vanishing Gradient Problem을 해소해주었다.
VGGNet
- 3x3 Convolution을 이용하여 Receptive field는 유지하면서 더 깊은 네트워크를 구성
- Why 3x3 Convolution?
  - 5x5 필터를 한 번 적용하는 것보다 2번의 3x3 필터를 적용하는 것이 파라미터 수가 더 적다.
GoogLeNet
- Inception Block
- WHY inception block?
  - 1x1 convolution을 통과시켜서 파라미터 수를 줄여준다.
  - HOW?
    - Channel-wise dimension reduction이라고 한다. 1x1 Convolution을 하면 채널의 수를 줄일 수 있다.
- 여기까지 3개의 네트워크의 레이어 수와 파라미터 수를 비교해보면
- AlexNet (8 layers, 60m)
- VGGNet (19 layers, 110m)
- GoogLeNet (22 layers, 4m) # 구글넷이 가장 레이어 수가 많은데 파라미터 수는 제일 적은 것을 알 수 있다. 이것이 1x1 Convolution의 효과이다.
ResNet
- Residual connection(Skip connection)이라는 구조를 제안
- 레이어가 깊어지면 오버피팅과 같은 현상이 종종 발생했는데 ResNet에서 어느 정도 해소함
- Performance 가 증가한 반면 Parameter size는 감소함
DenseNet
- ResNet과 비슷한 아이디어지만 Addition이 아닌 Concatenation을 적용한 CNN

부스트캠프

개발자의 지속 가능한 성장을 위한 학습 커뮤니티

boostcamp.connect.or.kr

'Boostcamp - AI tech > DL Basic' 카테고리의 다른 글

07 - Sequential Models : RNN (0)	2021.08.13
06 - Computer Vision Applications (0)	2021.08.13
04 - Convolution은 무엇일까? (0)	2021.08.11
03 - Optimization (0)	2021.08.10
02 - Neural-Network (MLP - Multi-Layer Perceptron) (0)	2021.08.10

'Boostcamp - AI tech/DL Basic' Related Articles

Comments

Tech & TIL

05 - 1x1 Convolution의 중요성 본문

05 - 1x1 Convolution의 중요성

Network List

'Boostcamp - AI tech > DL Basic' 카테고리의 다른 글

티스토리툴바