[쉽게 배우는 Vision AI 모델 개발] Ep 2. 데이터 준비

[쉽게 배우는 Vision AI 모델 개발] Ep 2. 데이터 준비

이번 에피소드에서는 스마트팩토리 직원들이

좀 더 빠르고 간편하게

노트북 검사를 할 수 있도록

Vision AI 모델 개발 프로젝트를

단계별로 진행해 볼게요.

[1단계 : 데이터 수집]

AI 모델을 개발하기 위해서는

가장 먼저 학습할

노트북 이미지 데이터를

수집해야 해요.

데이터 수집에서 중요한 것은

정상 노트북과 불량 노트북 각각

정확하고 다양한 이미지가

필요하다는 것이죠.

일반적으로 불량품의 사진은

조금밖에 없지요.

이런 경우에는 사진을

새로 찍기도 하고

불량품과 유사한 이미지를 만들어

불량품 사진의 수를

늘립니다.

같은 정상 노트북이더라도

어떻게 놓여 있는지에 따라

검사할 때 노트북 모습이

달라질 수 있겠죠.

조명의 위치에 따라

노트북이 다르게

보이기도 하죠.

즉, Vision AI 모델의 정확성을

높이기 위해서

정상품과 불량품 이미지,

물체의 놓인 방향,

조명 위치 등을 고려한

다양하고 많은 이미지 데이터가

필요해요.

수집한 데이터는 AI 모델 학습을 위해

시스템에 업로드할 텐데

이때 모든 데이터를 학습에

사용하지는 않아요.

성능 평가에서 사용할 데이터를

남겨두어야 하는데요.

전체 데이터를 AI 모델

학습 데이터와 평가 데이터로

대략 8:2 정도로 나누어

사용합니다.

평가 데이터를 어떻게 사용할지는

이따가 자세히 알아볼게요.

이제 준비되었으니

데이터를 업로드해 볼까요?

앞서 활용하기로 한

MAVIN Cloud 시스템에

올려볼게요.

업로드 버튼을 눌러서

학습용 데이터와 평가용 데이터를

각각 업로드하면 됩니다.

이미지 데이터가 이렇게 잘

업로드되어 있네요.

[2단계 : 데이터 가공]

데이터 수집이 끝났으니

학습하기 전에

학습을 잘할 수 있도록

준비하는 과정이 필요합니다.

바로 데이터 가공 단계입니다!

학습할 이미지 데이터가

무엇인지 알려주는 이름인

라벨을 붙여주는 단계에요.

바로 이미지의 정답을 알려주는 것이죠!

그리고 가장자리에 찍힌 사진은

배경을 잘라서 이미지를

다듬어 주기도 한답니다.

라벨을 붙여주는 방법에는

여러 가지가 있는데

저는 이미지를 분류하고자 하는

항목에 맞춰 붙이는 방법을

사용할 거예요.

예를 들어

강아지와 고양이를 구분하는

Vision AI 모델을 만들면

강아지와 고양이 각각의

이미지 데이터마다

이것은 강아지야,

이것은 고양이야

알려주는 라벨을 붙입니다.

이런 식으로 이미지 데이터가

무엇인지 분류할 때

사용하는 방법이

이미지 분류 방법입니다.

이미지 데이터를 보고

그것이 속하는 이미지 데이터

묶음을 구하는 방법이죠.

그럼 강아지와 고양이를

구분하는 Vision AI 모델에서는

강아지와 고양이 2개의

Class가 있는 거죠.

노트북 검사에서는

정상품과 불량품을

구분해야 하기 때문에

두 가지 Class를 분류하는

이미지 분류 방법을

사용한답니다.

그럼 MAVIN Cloud에서

이미지 데이터 라벨링 작업을

직접 해볼게요.

Classification을 선택하여

작업을 시작해 봐요.

Class에 정상품 OK와 불량품 NG를

추가하여 아까 업로드했던

이미지 데이터에서

각각 Class를 선택해 주는 겁니다.

이렇게 라벨링 작업을 모두 하면

데이터 가공 작업이 완료됩니다!

이번 에피소드에서는

Vision AI 모델 개발을 위해

데이터를 어떻게 준비해야

하는지 알아보았는데요.

다음 에피소드에서는

학습과 평가로

AI 모델을 완성해 볼 거예요

다음 에피소드도

많이 기대해 주세요~!

영상으로 쉽게 배우는 Vision AI 모델 개발

마지막 세 번째 에피소드도 많이 기대해 주세요!

[쉽게 배우는 Vision AI 모델 개발] Ep 1. Vision AI란?

[쉽게 배우는 Vision AI 모델 개발] Ep 3. 학습과 평가