본문 바로가기
[AI]/인공지능 이론 및 실습

[인공지능] CNN 기초 : Convolutional Layer(Conv), Pooling layer(Pool), CNN 용어 정리

by seom-j 2024. 2. 14.

📌 Problem of Fully Connected Layer

[ 🚨 ]

2D 이미지가 입력값일 경우, 1D로 변환하는 과정에서 입력 데이터의 공간정보를 잃게 되는 문제점 존재

즉, 픽셀간 거리와 RGB채널간 상관관계와 같은 정보가 손실됨

[ 🚨 ]

이미지의 경우 해상도가 클 경우 네트워크 매개 변수가 상당히 많아지는 경향 존재

 


📌 CNN

이미지와 같은 grid 구조를 분석하는 데 일반적으로 사용되는 신경망

FC(Fully Connected)레이어 이전에 Conv(Convolutional) 및 Pool(Poolinging) 레이어들이 존재함

 

 

📌 Convolutional Layer (Conv)

이미지에서 의미있고 중요한 특징(feature map)을 추출하는 과정

컨볼루션 연산을 수행하는 다양한 필터를 기반으로 한 특징 추출

입력 * 필터 ⇒ 의미있고 중요한 특징

 

➡️ 이미지 입력에서 공간 정보를 지니고 FC의 입력값으로 활용될 수 있음

 

이때, 필터의 파라미터들을 고퀄리티 피쳐를 추출하도록 학습

각 필터 내부의 파라미터 + 필터별로 존재하는 편향

 

따라서 파라미터 수는 아래와 같이 표현할 수 있음

 

 

📌 Pooling Layer (Pool)

➡️ 특징 수(feature map 크기)를 줄이는 다운샘플링 과정

 

일반적으로 Max 혹은 Average 풀링을 통해 아래와 같이 downsampling 수행

 

 

📌 Local Connectivity

입력 이미지에서 필터링되는 영역에만 연결

FC 레이어의 노드 간 완전 연결과 달리, 파라미터를 공유함

 

 

📌 Receptive Field

특정 특성을 계산하는 데 사용되는 입력 공간의 영역

쉽게 말하자면 하나의 값이 포용할 수 있는 입력 데이터의 너비를 의미함

 

[ 🚨 ]

필터 사이즈가 클 경우, Receptive Field가 넓어지지만 매개변수의 수가 많아짐