[인공지능] LeNet, VGG, LesNet이란? CNN 아키텍처의 간단한 역사 📌 Flattening2D 특징 맵을 하나의 길고 연속적인 1D 벡터로 변환하는 과정(평면화 후 완전 연결 레이어의 입력으로 사용된다고 보면 됨) 📌 LeNetLeCun 팀이 도입한 최초의 CNN 아키텍처 중 하나로,2개의 컨볼루셔널 레이어(풀링 포함)와 3개의 완전 연결 레이어로 구성되어있음 📌 VGG옥스퍼드 대학교 VGG(Visual Geometry Group)에서 개발한 네트워크로,VGG16, VGG19와 같이 뒤에 붙는 수(레이어 수)에 따른 더 깊은 변형이 존재함[논문 - Very Deep Convolutional Networks for Large-Scale Image Recognition] ⬇️ VGG16 ⬇️ VGG19 [ 🚨 ]VGG16과 VGG19를 비교하였을 때,VGG19.. 2024. 3. 4. [인공지능] Convolutional layer 종류 : Dilated Convolution, Pointwise Convolution, Group Convolution, Depthwise Separable Convolution 📌 Dilated Convolution[ 🚨 ]수용 필드를 확대하기 위해 필터 크기를 늘리면 매개변수 수가 많아짐수용 필드를 확대하기 위해 풀링 레이어를 추가하면 공간 정보 손실 ➡️ 연속된 계수 사이에 구멍을 삽입하여 필터를 확장한 후 Convolution 📌 1 X 1 Convolution (Pointwise Convolution)1×1 필터를 사용하는 특별한 유형의 컨볼루션입력 채널 전체에 대한 선형 변환(채널별 풀링)으로 차원 감소낮은 복잡성을 유지하면서 1×1 컨볼루션을 사용하는 매우 깊은 신경망 ➡️ 채널별 풀링을 활용하여 채널을 줄이는 데에 사용 📌 Group Convolution입력 채널을 그룹화한 후 그룹별로 독립적 컨볼루션 수행매개변수 수는 적으며 그룹 수는 하이퍼파라미터 그.. 2024. 2. 14. [인공지능] CNN 기초 : Convolutional Layer(Conv), Pooling layer(Pool), CNN 용어 정리 📌 Problem of Fully Connected Layer[ 🚨 ]2D 이미지가 입력값일 경우, 1D로 변환하는 과정에서 입력 데이터의 공간정보를 잃게 되는 문제점 존재즉, 픽셀간 거리와 RGB채널간 상관관계와 같은 정보가 손실됨[ 🚨 ]이미지의 경우 해상도가 클 경우 네트워크 매개 변수가 상당히 많아지는 경향 존재 📌 CNN이미지와 같은 grid 구조를 분석하는 데 일반적으로 사용되는 신경망FC(Fully Connected)레이어 이전에 Conv(Convolutional) 및 Pool(Poolinging) 레이어들이 존재함 📌 Convolutional Layer (Conv)이미지에서 의미있고 중요한 특징(feature map)을 추출하는 과정컨볼루션 연산을 수행하는 다양한 필터를 기반으로.. 2024. 2. 14. [인공지능] Convolution 실습 : Sobel Filter를 활용한 Edge Detection 실습 (Python, Torch) 📌 torch.nn.Conv2DConv2D를 활용하여 간단하게 Convolution 연산을 수행할 수 있음이때 N, C, H, W로 차원을 맞춰야 함에 주의 📌 Sobel Filter를 활용한 Edge Detection 실습구글 코랩 환경을 사용하여, Python으로 간단한 Edge Detection 실습을 수행해보고자 함 1. 관련 라이브러리 importfrom PIL import Imageimport matplotlib.pyplot as pltimport numpy as npimport torch.nn as nn 2. 이미지 불러오기img = Image.open("이미지 경로/AI_Image.bmp").convert(mode="L")pix = np.array(img, dtype = np.uint.. 2024. 2. 8. 이전 1 2 3 4 5 6 7 다음