비전딥러닝/cs231n

Lecture1. Introduction to Convolutional Neural Networks for Visual Recognition

아무 말하는 감자 2022. 9. 16. 16:49

이 강의는 컴퓨터 비전 및 딥러닝의 역사를 간단히 다루는 가벼운 강의였다.

5 4300만년 전 바다를 부유하며 그저 주변의 먹이만 먹는 단순한 생물들만 존재로 시작해,  1000만년동안 생물의 종이 폭발적으로 늘어나게 되었다. 진화생물학자에 의하면  이러한 현상을  Evolution’s Big Bang 이라고 부른다.

이 현상에 대한 생물학적 근거가 인상 깊었는데, 생물의 종이 폭발적으로 늘어난 시기와 동물에게 시각(vision)이 생긴 시기가 겹친 다는 것이었다.

 

그만큼 동물의 시각은 삶과 역사에 큰 영향을 미치고, 현재의 동물 시각은 가장 큰 감각 체계로 여겨진다.

1600년대 핀홀 카메라 이론 기반의 카메라인 Obscura가 발명되면서 인공적인 Vision은 시작된다.

HubelWiesel의 실험에서 고양이를 실험 대상으로 하여 고양이의 시각 체계를 분석함으로써 어떻게 볼 수 있는지, 어떻게 인식할 수 있는 지 등을 생물학적인 관점에서 구체적으로 발견되었다.

 

1970년대 David Marr에 의해 Hierachicl Model이 제시되는데 지금의 컴퓨터 비전, 아키텍쳐 딥러닝 구와 유사하다. David는 우리의 눈에 인식된 이미지를 3D로 표현하려면 edge image, depth image, 3-D modeling 3단계의 과정을 거쳐야 한다고 주장했다.

 

2000년대에 들어서서는 객체 분할 및 이미지 인식 처리의 중요성이 대두되면서, 연구 방향이 객체인식으로 바뀌게 된다.

세상 모든 이미지 분류 및 기계학습의 Overfitting 문제 극복을 위해 ImageNet, CIFAR_10 class 별로 나누어진 대량의 학습시킬 이미지 넷이 만들어졌다.

 

2012, CNN의 도입으로 오차율이 급격하게 감소되기 시작하면서, 더더욱 비전 및 딥러닝 분야의 관심이 높아졌다.