구글이 자사의 화상 인식 기술을 API로 제공하는 Google Cloud Vision API의 Limited Preview버전을 발표 했습니다.
구글은 기계 학습을 토대로 한 고도의 화상 인식 기술을 보유하고 있는데 이 화상 인식 기술은 사진 스토리지 앱인 구글 포토 등에서 사용되며 고 정밀 자동 태그 추가나 인물의 식별 기능 등을 실현시키고 있습니다. 개발자는 Cloud Vision API을 사용함으로써 구글의 최첨단 화상 인식 기술을 자신의 앱과 서비스에 포함시키는 것이 가능해 화상 내의 물체를 이해하면서 실현하는 차세대 서비스 개발을 촉진할 수 있게 됩니다.
API의 주요 기능으로 화상 내에서 가장 지배적인 객체를 선정해 레이블을 부착할 수 있고 눈, 코, 입의 위치 수치화에 따른 얼굴의 식별, 기쁨, 분노, 놀람과 슬픔 등의 감정 식별이 가능 합니다. 인공물과 자연 등 경계 표지 외 제품·기업 로고도 식별할 수 있으며 OCR 기능을 탑재하고 화상 내의 언어를 여러 언어로 인식도 가능 합니다.
구글은 이러한 Cloud Vision API을 사용한 아래 데모 동영상을 공개하고 있습니다.