행복한 하루

[edx.org] Computer Vision and Image Processing Fundamentals (Week 1 정리) 본문

Artificial Intelligence/Vision

[edx.org] Computer Vision and Image Processing Fundamentals (Week 1 정리)

변화의 물결 2021. 11. 23. 00:04

 

 

안녕하세요.

 

  시대가 시대인 만큼 AI를 빼놓고 말할 수 없는 시대가 왔습니다. 사실 아직까지는 AI라고 하기에는 좀 그렇고 개인적인 생각으로는 계산 잘하는 컴퓨터가 아닐까 합니다. ^^

 AI에도 많은 분야가 있는데 그중에 비전(Vision) 쪽으로 한번 공부해보자 해서 edx.org에서 무료 강의를 들어보고 내용 간단하게 정리해보았습니다.

 

 전체 강의는 영어로 되어있었고 컴퓨터 전공했다면 아~ 하면서 들을 수 있을 것 같았습니다. 영어공부도 하고 컴퓨터 공부도 하는 겸... (한국어나 잘하지라는 소리가 들리네요. ^^;)

 

강의는 주(week) 단위로 되어 있는데 짤막 짤막해서 빠르게 볼 수 있습니다.

 

 edx에는 다른 많은 강의들도 있는데 국내에 보면 강의 후기들이 많이 없어서 직접 들어보고 선택해야 했습니다. 그래서 다른 분들에게 도움이 되고자 들어본 내용들 정리해 올려봅니다. 간단하게 보시고 관심 있다 싶으면 무료로 수강 신청해서 직접 들어보고 실습해보시면 됩니다.

 

세상에는 배울 것들도 많고 이렇게 무료로 제공해주고 있어서 감사할 따름입니다.

 


 

첫째 주(Week 1)는 전반적으로 어떤 내용을 배우는지 소개해줍니다.

 

1. Introduction to Computer Vision

  1) What you will learn:

    - what is computer vision,

    - be able to apply and use

    - computer vision algorithms with Python and OpenCV,

    - know how to create your own custom classifiers

    - build your own web app to classify images.

  2) What you will not learn, how computer vision works,

    - how neural networks or

    - deep learning work, math and statistics.

 

왜 컴퓨터 비전을 배우고, 어디에 사용되는지 알려주고 줍니다.

 

2. Applications of Computer Vision

- 실제적으로 사용되는 예제를 보여줍니다.

영상에서 키워드 추출해주는 사이트를 알려주는데, https://cocl.us/darkvision  접속이 되지 않았습니다.

3. Recent Research in Computer Vision

 - 현재 연구하고 있는 컴퓨터 비전에 대해서 설명해줍니다.

  자료는 https://arxiv.org/pdf/1703.06870v3.pdf

 

  Mask R-CNN 자료를 예시를 보여주면서 설명해줍니다.

 

 각 물체를 인식하는 것을 보여주었다면, 다음 예제로 UC 버클리 연구팀에서 원본 이미지를 다른 사람의 이미지로 변환시키는 것을 보여줍니다.

 The UC Berkeley Research Team is working on converting an image from one representation of a scene to another.

 

 원본 소스 춤추는 사람의 모습을 Detected Pose로 인식 후 다른 사람이 마치 춤 주는 것(Source to Target 1 Result)처럼 영상으로 만들어 보여줍니다.

 

  

4. Brainstorming Your Own Applications

- 우리가 사용할 수 있는 컴퓨터 비전이 어디에 활용할 수 있을까 아이디어를 생각하는 시간을 가집니다.

그러기 위해서는 분야마다 가지고 있는 문제를 찾아보는 일을 먼저 합니다.

  의학 – 교육과정에 있는 의사들은 암을 진단하기 위해서 교육받기 위해서 몇 년이 거리는 문제

  운전 – 장거리 운전하면 졸리고, 집중해야 하는 문제

  보완 – x-ray에서 위험한 물건을 찾아내야 하는 문제

  공장 – 직원들이 안전도구를 잘 착용하고 있는 확인해야 하는 문제

  보험 – 사고 사진으로 손해 금액을 계산해야 하는 문제

 

 위와 같은 문제들이 존재하고 이런 문제를 컴퓨터 비전으로 접근해볼 수 있는 부분이라고 말을 합니다.

그리고 현실적으로 우리에게 있는 문제에 대해서 이야기합니다.

영수증 보관이 어렵지 않은가, 식물이 얼마나 자라고 있는가, 주변에 야생동물 있지는 않는가? 등

컴퓨터 비전으로 해결할 접근할 수 있는 문제에 대해서 생각할 거리를 제공해줍니다.

 

5. Articles

 - 잠시 쉬는 시간으로 읽을거리를 전달해줍니다. IBM에서 얼굴 분석하는 내용과 오일회사에서 이미지를 분석하고 있다는 내용입니다.

 

1) IBM Research Releases ‘Diversity in Faces’ Dataset to Advance Study of Fairness in Facial Recognition Systems

https://www.ibm.com/blogs/research/2019/01/diversity-in-faces/

 

2) Abu Dhabi National Oil Company (ADNOC): Enhancing accuracy, consistency and speed of rock analysis to support better decisions

https://www.ibm.com/case-studies/abu-dhabi-national-oil-company-adnoc

 

6. Computer Vision in Action

 - 컴퓨터 비전을 간단하게 웹에서 테스트해볼 수 있는 사이트 링크를 알려줍니다. 마스크를 쓰고 있는 아닌지, 엄지를 올리고 있는지 아닌지 핫도그 인지 아닌지 등 CV Studio라는 프로그램에 대해서 알려주고 있습니다. 컴퓨터에 카메라가 있다면 바로 확인해볼 수 있습니다.

 

https://vision.skills.network/

7. Quiz

- 마지막으로 퀴즈와 복습란이 있는데 이것은 유료 강의 듣는 분에게 제공되는 부분입니다. 무료 수강하는 분은 넘어가시면 됩니다.

 

이것으로 1주 차 강의가 끝납니다.

생각보다 편하게 강의를 수강할 수 있고 이런 내용들이 있구나 들을 수 있는 시간이 될 것입니다.

 

감사합니다.

 

  

<참고 사이트>

1. edx.org - Computer Vision and Image Processing Fundamentals

https://www.edx.org/course/computer-vision-and-image-processing-fundamentals  

2. Mask R-CNN

1703.06870v3.pdf
7.37MB

 

 

Comments