검색 품질 향상을 위한 구글의 노력

by RAPTER posted May 01, 2017
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 댓글로 가기 인쇄

1.png


검색 기능의 발전 가능성은 무궁무진합니다. 제가 처음으로 검색 기술 개발에 참여한 1999년은 물론이고 현재도 마찬가지입니다. 당시 인터넷 사용자가 엄청난 속도로 증가하는 상황에서 구글은 사용자들이 원하는 정보를 구글 검색 페이지에서 바로 찾을 수 있도록, 폭발적으로 증가하는 정보들을 제대로 분류하고 정리하여 제공해야 했습니다. 그래서 웹페이지의 중요도를 측정해 검색결과에 순위대로 표시하는 구글의 핵심 알고리즘, PageRank를 개발하게 되었습니다. 구글은 이와 같이 정보를 체계화해야 하는 과제 외에, 검색 순위를 높이기 위해 품질이 떨어지는 “콘텐츠 농장”이나, 숨겨진 텍스트와 같은 “속임수”를 사용하는 개인이나 시스템에 대응할 수 있도록 알고리즘을 지속적으로 개선해야 하는 과제도 안고 있었습니다. 구글은 수년간 알고리즘을 정기적으로 업데이트하고 시스템을 교란하는 행위를 방지하는 기능들을 도입하면서 이러한 문제들을 해결해왔습니다.

온라인에서 매분마다 수만 페이지에 달하는 정보들이 쏟아져 나오는 오늘날에는 시스템을 교란하기 위한 다양한 신종 수법이 등장하고 있습니다. 이 중 가장 눈에 띄는 것은 “페이크 뉴스”라고 하는 웹 콘텐츠입니다. 페이크 뉴스는 허위 정보, 낮은 품질의 정보, 불쾌감을 주는 정보 등을 노골적으로 퍼뜨리는 데 일조하고 있습니다. 수법은 과거와 달라졌지만 구글의 목표는 바뀌지 않았습니다. 사용자들이 가장 신뢰할 수 있는 출처에서 제공하는 관련 정보에 액세스할 수 있는 환경을 조성하는 것입니다. 시행착오를 겪을 수는 있지만 구글은 문제를 해결하기 위해 꾸준히 노력하고 있습니다. 장기적으로 영향력 있는 변화를 가져오기 위해서는 검색 기능의 구조적 변화가 필요합니다.

문제 해결을 위한 장기 계획을 진행하는 동시에 단기적으로는 웹상에서 높은 품질의 콘텐츠가 지속적으로 노출되도록 노력하고 있습니다. 이러한 노력의 일환으로, 검색 순위 기능을 개선하고 사용자의 피드백 전달 방법을 간소화하며 검색 서비스 운영의 투명성을 높였습니다.

검색 순위
구글의 알고리즘은 인덱스에 있는 수천억개의 페이지 중 신뢰할 수 있는 출처의 정보를 식별할 수 있도록 도움을 줍니다.  하지만 1일 트래픽 중 일부 검색어(약 0.25%)의 경우, 사용자가 원하는 정보가 아니라 불쾌감을 주거나 명백히 잘못된 정보가 검색되기도 합니다. 적은 양이긴 하지만 이러한 콘텐츠가 확산되는 것을 방지하기 위해 구글은 평가 방법을 개선하고 알고리즘을 업데이트하여 믿을 수 있는 콘텐츠의 노출수를 높이고 있습니다.

  • 새로운 검색 품질 평가사 가이드라인: 구글은 검색 기능의 변화를 모색하는 과정에서 다양한 실험을 시도하고, 구글 검색결과 품질을 평가하는 평가사들로 하여금 새로운 시도에 대한 피드백을 제공하도록 하고 있습니다. 이러한 평가로 인해 개별 페이지의 순위가 결정되는 것은 아니지만, 검색결과 품질과 연관된 데이터를 수집하고 개선해야 할 부분을 파악할 수 있습니다. 지난달 업데이트된 검색 품질 평가사 가이드라인에는 평가사가 신고해야 하는 낮은 품질의 웹페이지 사례가 상세히 설명되어 있습니다. 예를 들면, 허위 정보, 뜻하지 않게 불쾌감을 주는 검색결과, 날조된 내용, 근거 없는 음모론 등입니다. 새로운 가이드라인은 알고리즘을 사용해 품질이 낮은 콘텐츠의 검색 순위를 낮추고 앞으로 검색 기능을 더욱 향상하는 데 도움이 될 것입니다.
  • 순위 변경: 구글은 콘텐츠의 참신성부터 페이지에 검색어가 표시된 횟수에 이르기까지 수백 가지 신호를 조합하여 검색어에 적합한 검색결과를 결정합니다. 이러한 신호들을 조정해 믿을 수 있는 페이지의 노출수를 높이고 품질이 낮은 콘텐츠의 검색 순위는 낮추고 있기 때문에, 지난 12월 홀로코스트 부정론(Holocaust denial)이 상위 검색결과를 차지했던 것과 같은 불미스러운 사건은 다시 발생하지 않을 것입니다.


직접적인 피드백 제출 도구
구글은 사용자가 구글 사이트를 이용할 때 빠르게 검색할 수 있도록 검색어 자동 완성 및 추천 스니펫 기능을 제공합니다. 검색어 자동 완성은 사용자가 입력할 검색어를 예측하여 원하는 정보를 신속하게 검색할 수 있도록 도와주는 기능이며, 추천 스니펫은 검색어와 관련있는 정보를 검색결과 상단에 눈에 띄기 쉽게 표시하는 기능입니다. 두 기능을 사용할 때 표시되는 콘텐츠는 알고리즘을 통해 생성되며, 다른 사용자들의 검색어와 웹에서 액세스할 수 있는 정보가 반영된 것입니다. 때로는 원하지 않거나 부정확하거나 불쾌감을 주는 검색결과들이 표시되기도 합니다. 그래서 구글은 검색어 자동 완성 및 추천 스니펫을 사용할 때 표시되는 콘텐츠를 신고하는 방법을 대폭 간소화했습니다. 사용자가 민감하거나 쓸모없는 콘텐츠를 발견했을 때 구글에 직접 신고할 수 있도록 새로운 피드백 도구의 카테고리를 명확하게 분류해 두었습니다. 제출된 피드백은 구글 알고리즘을 개선하는 데 활용할 예정입니다.




Autocomplete_update.gif
                                       검색어 자동 완성 기능의 새로운 피드백 링크





FeaturedSnippet_update.gif
                                        추천 스니펫의 업데이트된 피드백 링크



구글 서비스의 투명성 제고
지난 몇 달간 자동 완성 검색어에 충격적이고 불쾌감을 주는 단어들이 표시되는 이유를 문의하는 곤란한 사례들이 있었습니다. 구글은 문제를 해결하기 위해 콘텐츠 정책을 어떻게 개정해야 할지 파악한 후 해당 정책을 업데이트했습니다. 이렇게 업데이트한 정책은 고객 센터에 게시하여 누구나 검색어 자동 완성 기능과 특정 검색어를 삭제하는 방법에 대해 알아볼 수 있도록 했습니다.

 
더 자세히 알아보고 싶은 사용자들을 위해 최근에는 검색 서비스 운영 방식 사이트를 업데이트해 사용자와 웹사이트 소유자에게 검색 기반 기술에 대한 상세한 정보를 제공하고 있습니다. 사이트에서는 구글 검색 순위 시스템이 수천억개의 페이지 정보를 분류한 후 사용자에게 검색결과를 제공하는 방식에 대해 설명하고 사용자 테스트 프로세스도 간략하고 소개하고 있습니다. 

구글을 이용한 검색 건수는 매년 수조 건에 달하지만, 하루 검색 건수 중 15%만이 신규 검색에 해당합니다. 다시 말해, 다양한 합법적인 출처에서 사용자에게 가장 적합한 검색결과를 제공하기 위해 우리가 해야 할 일이 아직 많다는 의미입니다. 검색결과가 100% 만족스러울 수는 없지만 구글은 사용자의 신뢰에 보답하고 누구에게나 유용한 서비스를 제공하기 위해 항상 최선을 다하고 있습니다.

작성자: Ben Gomes VP, ENGINEERING https://s29.postimg.org/f5b681gp3/image.png  






Articles

1 2 3 4 5 6 7 8 9 10