구글은 유저가 클라우드 기반을 사용하여 빅 데이터를 분석하기 위한 서비스인 구글 빅쿼리의 개발을 진행하고 있다.
구글의 Ju-Kay Kwek는 3월 21일, 미국 뉴욕에서 개최중인 Structure:Data 2012(GigaOM 주최) 컨퍼런스에서 강연하며 빅쿼리는 기업이 인프라를 구축하지 않아도 대량의 자사 데이터를 분석할 수 있도록 지원하는 서비스라고 밝혔다.
"빅쿼리는 애플리케이션을 구축하여 데이터를 공유하는데 사용할 수 있다" 구글은 현재 빅쿼리의 프리뷰판을 일부 고객에게 한정적으로 제공하고 있다. 빅쿼리의 일반 제공 시기가 언제인지는 밝혀지지 않았다.
구글의 간부는 빅 데이터 분석 서비스의 제공은 구글에게 당연한 지원이라고 밝혔다. 필요한 툴의 일부가 구글 사내용으로 이미 개발되고 있었기 때문이다. "우리가 하고 있는 Web 인덱스 작성은 빅 데이터를 활용하는 시도와 다를바 없다"(Kwek) 또, 구글은 Gmail 등 동사 서비스를 유저가 어떻게 사용하는지의 분석을 대량적으로 처리하고 있다. 업무 데이터에서 빅 데이터 분석 서비스에 대해 어떠한 기능이 유효한가, 혹은 유효하지 않을까의 판단을 할수 있다고 밝혔다.
분석을 성공하기 위한 열쇠는 자사에서 생성되는 데이터를 모두 수집해 두는 것이다. "세세한 데이터가 중요하다"(Kwek) 데이터가 많은 경우 구글의 엔지니어는 데이터 쿼리를 실행할 때 어떤 쿼리를 먼저 진행해야할 것인가를 사전에는 판단하기 힘들다. 여기서, 보다 많은 의문을 갖는 것이 중요하게 된다. "빠르게 많은 의문를 시행할 수 있으면, 의문는 보다 정확한 것이 되어 간다"
빅쿼리를 사용하려면 우선 데이터 세트를 업 로드하여 갱신 데이터가 사용 가능하게 되면, 수시로 데이터를 송신하여 데이터 세트를 갱신한다. 데이터 세트의 해석은 구글의 알고리즘과 쿼리 언어를 이용해 시행할 수 있다.
빅쿼리의 프리뷰판 테스트 유저는 다양한 목적으로 테스트를 시행하고 있다. 예를 들면 온라인 광고 프로바이더는 유저의 행동에 관한 폭넓은 데이터라는 광고 효과의 지표 데이터를 수집하기 위해서 빅쿼리를 사용하고 있다. 또, 어느 호텔은 빅쿼리로부터 얻은 데이터를 사용해 매상 데이터를 관리, 각종 재무 시스템과 정보를 조합하고 재무 예측에 유용하게 쓰고 있다.
빅 데이터 분석에 클라우드를 이용하는 모델은 다양한 메리트를 제공한다. 가장 중요한점은 사용 기업이 프로 비져닝이나 셋업을 하지 않고도 가능하다는 점이다.
"우리가 모든 밥상을 차리겠다" (Kwek)
또, 보안이나 데이터 백업도 서비스에 포함되기 때문에 서비스를 이용하면 데이터로부터 결과를 얻을 때까지의 시간을 단축할 수 있다.
프랑스의 We Are Cloud는 BI(비즈니스 인텔리전스)를 클라우드 서비스로서 제공하고 있다. Bime 이라고 하는 이 서비스는 BI 시스템을 보유하고 있지 않는 중소 규모의 기업을 대상으로 하고 있다. 사내의 릴레이셔널 데이타베이스등 다수의 데이터 소스에 근거하여 정보를 대시 보드에 표시하는 것이 가능하다.
We Are Cloud는 고객 서비스로 빅쿼리를 제공하기 위해 빅쿼리의 베타 테스터가 되었다. 자사의 고객인 중동의 통신 사업자는 Bime을 사용하고 분석을 할 수 있도록 15TB의 고객 데이터를 업 로드했다. 당초 15TB 데이터 용량에 대한 구글의 사용 요금이 어느 정도일까 예상할수 없었지만, 실제로는 매우 리즈너블했다고 밝혔다.
"빅쿼리는 다이나믹한 환경에서 가치가 있다. 매우 거대한 데이터 세트라도 리얼타임 리스폰스를 얻을 수 있다"