본문 바로가기

AI 기초이론14

3d computer vision에 대해 흔히 컴퓨터 비전이라 하면 2d 이미지를 학습하고 판별하는 등의 생각을 하지만 컴퓨터 비전은 3d 분야에도 적용될 수 있다. 다만 현재 3d 컴퓨터 비전은 그저 사진을 찍으면 되는 2d 이미지와 달리 dataset을 전부 인간이 직접만들어야 하는 등, 어려움이 있어 2d 학습만큼 발전되지는 않았다고 볼 수 있다. 오늘은 이러한 3d computer vision 분야에 대해 아주 간단히 "이런것도 있다"라는 식으로 얘기해보려 한다. 먼저 3d 학습을 위해서는 3d 데이터를 만들어야 한다. 인간은 한눈으로는 2d이미지를, 두 눈으로는 일종의 삼각측량으로 3d 이미지를보고 있다. 그러나 컴퓨터는 인간의 방식을 이해할 수 없기 때문에 컴퓨터가 이해할 수 있는 데이터를 만들어야 하고, 이런 3d 데이터를 만드는 .. 2023. 4. 8.
Pooling은 무엇인가? https://roki9914.tistory.com/12 CNN에 대해 알아보자 전통적인 CNN은 convolutional neural networks의 약자로 convolutional layer, pooling layer, fully connected layer로 이루어져 있다. convolution에 관한 내용은 이전 포스팅에서 다룬 적이 있으니 모른다면 보고오는 것을 roki9914.tistory.com 이전의 포스팅에서 pooling이 무엇인지 설명하지않았는데, 이번에 pooling에 대해 간단히 설명하려 한다. Pooling은 CNN모델을 구축할 때 모델의 크기를 줄여주고 메모리 부담을 덜어주는 역할을 한다. 가령, 1000x1000 크기의 input을 받는 모델이 있다고 하자. 만약 우리가 이.. 2023. 3. 31.
RNN에 대해 알아보자 RNN에 대한 간단한 설명은 이전의 포스팅을 참고하자 https://roki9914.tistory.com/5 CNN, RNN이 무엇인지 간단하게 알아보자 CNN CNN은 Convolutional nueral network의 약자로 인공신경망의 한 종류이다. 이를 위해하기 위해서는 먼저 Convolution과 활성함수에 대해 이해해야한다. Convolution Convolution은 kernel을 입력벡터상에서 움직여 roki9914.tistory.com RNN은 Sequential data를 처리하는 Neural Network인데, 이는 sequential data의 특성상 그 길이가 정해져있지 않아 Fully connected layer를 쓸 수 없기 때문이다. 전통적인 RNN은 크게 4가지로 분류할 .. 2023. 3. 24.
Semantic Segmentation과 Detection에 대해 알아보자 Semantic segmentation과 detection은 CNN을 적용할 수 있는 대표적 분야이며, 이번 포스팅에서는 이에대해 알아볼 것이다. Semantic Segmentation Semantic segmentation은 이미지가 주어졌을때, 이미지 전체를 분류하는 것이 아닌, 픽셀단위로 분류를 하는 것이 목표이다. 예를 들어 자전거를 타는 사람이 찍힌 이미지가 있다면, 어디가 자전거이고, 어디가 사람이고, 어디가 배경인지 분류하는 것이다. Semantic segmentation의 대표 분야는 자율주행으로, 실시간 도로 이미지를 보고 어디가 사람이고, 어디가 차도, 인도인지 지, 어디가 신호등인지를 구분하는 역할을 수행한다. 우리는 이를 위해 dense layer를 없애고 convolutional .. 2023. 3. 24.