데이터라벨러 하는 일, 진로와 전망 알아보기 class="layout-aside-right paging-number">
본문 바로가기
신직업 유망직업 찾아보기

데이터라벨러 하는 일, 진로와 전망 알아보기

by 영동신사 2024. 9. 2.
반응형

데이터라벨러란 말을 많이 들어 보셨지요. 사진이나 동영상 등에 등장하는 동물, 사물 등에 관한 데이터를 AI가 스스로 학습할 수 있는 형태로 가공하는 일을 데이터라벨링이라고 합니다. 데이터라벨러는 일반 데이터를 인공지능의 성능을 높이는 양질의 데이터로 가공하는 일을 하는 사람을 뜻 합니다. 아래에서 데이터라벨러가 하는 일, 진로와 전망 등을 살펴 보겠습니다.

 

 

 

데이터라벨러라는 직업이 등장하게 된 배경 

데이터 라벨링(Data Labeling)은 인공지능 학습을 위하여 숫자로 구성된 데이터가 아니라 자료의 성질이나 특성을 묘사하는 정성적인 데이터를 인공지능이 알아보고 분간할 수 있도록 재가공하는 작업을 뜻합니다. 다시 말하면 사진, 음성, 동영상 등의 파일에 들어있는 동물, 사물 등에 적합한 표식을 달아서 데이터화 하는 일을 의미합니다. 예컨대 어떤 기업이 인공지능 스피커를 만들고자 할 때, 남성, 여성, 어린이, 노인 등의 목소리부터 각 지방 사투리 등을 녹음한 음성 데이터가 필요하겠지요. 이 과정에서 데이터라벨러는 각각의 음성 데이터에 정보 표식 즉 라벨을 입력해 주는 역할을 담당합니다.

데이터라벨링은 AI 자동화, 수요예측 등에서 중요한 요소입니다. 예컨대 공산품 수출, 도매가격 예측 등의 분야에서 과거의 데이터를 학습한 AI 모델은 미래 예측 도구로서 역할을 합니다. 이 과정에 필요한 것이 바로 라벨링된 데이터입니다. 

데이터라벨링은 아직까지 자동화하기 어려운 수준이이서 사람이 일일히 수행해야 합니다. 더구나 앞으로 인공지능 기술이 발전 하면 할수록 데이터라벨링 또한 점점 복잡해 질 것으로 예상됩니다. 2020년 7월 정부는 디지털 뉴딜정책 발표와 함께 그 중 한 분야로서 데이터라벨링을 활발히 추진하고 있습니다. 이 과정에서 인공지능 학습용 데이터 구축사업 진행을 위한 데이터라벨러의 역할이 중요하게 부각되었습니다.

 

데이터라벨러가 하는 일

데이터라벨러가 하는 일은 데이터의 수집 및 가공, 라벨링, 검수 작업, 프로젝트 관리 등 다양합니다. 좀 더 구체적으로 살펴보면 다음과 같습니다. 

첫째, 데이터라벨러는 기본적으로 이미지, 음성, 동영상 등의 파일에 등장하는 동식물, 사물, 특정 단어 등에 라벨(표식 정보)을 입력하는 작업을 수행합니다.

둘째, 기존의 데이터가 없는 경우에는 사진 촬영, 음성 녹음 등 해당 사물의 성질, 특성 등을 묘사하는 새로운 정성 데이터를 만들고 라벨링하여 온라인 플랫폼에 업로드 하는 작업을 추진합니다. 

셋째, 데이터라벨링 할 때, 작업유형을 구분하면 크게 텍스트, 영상, 음성, 이미지 등 4 가지로 분류합니다. 예컨대 이미지 데이터 라벨링은 정해진 대상을 휴대폰으로 촬영 업로드, 라벨링 대상의 특정 부분에 점을 찍고 표시하는 스켈레톤 추출, 이미지의 감정을 추론해 태깅하는 작업, 이미지상에서 특정 대상을 드래그하여 박스를 그리는 프로젝트 등의 업무로 이루어집니다. 

넷째, 의료 관련 영상을 대상으로 라벨링할 때와 같이 전문성이 필요한 분야의 데이터라벨링은 의사 등 의료인이 라벨링 작업을 해야 합니다. 이처럼 데이터라벨링은 분야별로 작업조건과 전문성 요구 수준 등에 차이가 있습니다. 

데이터 라벨링에는 정확도가 엄격하게 요구되며, 기술개발 전체 과정의 70%를 차지할 만큼 많은 시간과 인력이 필요한 공정으로 평가되고 있습니다. 데이터 라벨링 분야에는 직접 정보 표식(라벨)을 하는 라벨러와 라벨링 결과물에 오류가 있는지 여부 검토 즉 품질을 관리하는 데이터라벨링검수원이 있습니다.

 

데이터라벨러 준비 방법

데이터라벨러 자격증 응시 조건에는 특별한 제한사항이 없습니다. 나이, 성별, 학력, 지역, 경력과 무관하게 누구나 도전할 수 있는 분야이며 진입 장벽이 낮아서 인기가 있습니다. 그러나 데이터라벨링 자격증 취득은 AI 시대에 경쟁력을 높이고 신뢰받는 전문가로 자리매김 할 수 방법 중의 하나입니다. 고용주에게 지원자의 기술 수준을 객관적으로 증명할 수 있는 지표이며 자격증 취득자에게는 라벨링 기술과 관련된 트렌드와 방법론을 학습할 수 있는 기회이기도 합니다.

현재 데이터라벨러 국가자격 제도는 도입되지 않은 상황이며, 민간기관에서 온라인으로 데이터라벨링 교육과정을 운영하고 있습니다. 크라우드 웍스가 운영하는 크라우드 아카데미, 한국교육진흥협회, 한국검정평가원, 중앙사이버평생교육원, 그 밖에도 많은 기관에서 운영하는 데이터라벨러 자격증 취득을 위한 교육과정이 있으니 참고하시기 바랍니다.  

         

데이터라벨러 진로와 전망 

한국데이터산업진흥원이 조사하여 발표한 자료에 따르면, 우리나라 데이터라벨링 시장은 연평균 21.9% 성장하고 있으며  2025년이 되면 약 4조 3,100억원 규모로 시장규모가 확대될 것으로 예측되고 있습니다. 다른 어떤 분야와 비교해도 데이터라벨링은 상당히 큰 규모를 가진 분야 중의 하나임을 확인할 수 있습니다. 

데이터라벨러는 취업, 부업, 스타트업 사업, 프리랜서, 단기 알바 등 다양한 방법으로 수입을 창출할 수 있는 분야입니다. 데이터라벨러 자격을 취득할 경우, 인공지능 기업, 데이터 가공업체, 정부기과관, 대학 및 연구기관, 교육기관, 크라우드 소싱 플랫폼 등 다양한 기관에 진출할 수도 있습니다.

2024년 현재 우리나라에서 데이터라벨러로 활동하고 있는 사람은 약 50만명으로 추산되고 있습니다. 특히 전체 활동인원의 1/2 이상은 본업을 가지고 있으면서 데이터라벨러 일을 부수적인 경제활동으로 겸하고 있으며, 그 밖에 학생, 구직 중인 사람, 전업 주부 등이 부업으로 일하는 경우가 있습니다.  

데이터라벨러는 플랫폼 기업이 추진하는 프로젝트에 참여하여 데이터 라벨링을 수행하고 있는 경우가 많습니다. 작업이 완료되면 라벨러는 사전에 정해진 데이터별 단가를 합산하여 소득을 얻는 식으로 수입을 올리고 있습니다. 물론 데이터별 단가는 라벨링의 종류, 난이도 등에 따라 편차가 있습니다. 최근 데이터라벨링 작업을 크라우드소싱 하여 더 많은 인력을 활용하는 방법이 점점 보편화되고 있습니다. 데이터 라벨링에 대한 폭넓은 지식과 기술, 경험이 쌓여서 높은 숙련도를 갖출 경우, 고소득을 얻을 수 있는 분야 중의 하나가 바로 데이터라벨러라고 할 수 있습니다.                      

반응형