Гугловский сервис Knowledge Graph ("Сеть знаний") теперь доступен и на русском языке. Этот инструмент больше похож на автоматическую энциклопедию — в поисковой выдаче выдаются блоки с краткими данными об объектах, которые так или иначе связаны с запросом.
"Мы собрали большую базу знаний о том, что нас окружает в мире. Это какие-то понятия, люди, места, архитектурные сооружения, планеты, породы собак. В общем, все, что можно описать. У всех этих понятий есть какое-то количество характеристик. Кроме этого, мы знаем какие-то связи, которые есть между этими объектами, например, что какой-то актер снимался в определенных фильмах, и что эта порода собак связана с собаками. И таких объектов очень много сейчас, их больше чем 500 миллионов, и между ними миллиарды связей", — пытается объяснить концепцию сервиса представитель московской команды качества поиска Google Ринат Сафин.
Например, по запросу "Петр Первый" эта "сеть знаний" показывает годы жизни царя, имена его родителей, главные события в его жизни, и – что очень важно – связи этого исторического персонажа с другими событиям и явлениями. Под краткой выжимкой на русском языке стоит светлосеренькая, почти незаметная ссылка на источник — в данном случае "Википедию". Что интересно, в русскоязычном блоке ссылка ведет на англоязычную статью.
"Данные приходят из различных источников, часть из них — это открытые источники, лицензия которых позволяет использовать их данные, это в том числе "Википедия", которая является очень важным, полезным и крупным источником. Это FreeBase, который мы купили несколько лет назад и который, собственно, содержит структурированную информацию об объектах из реального мира. Это источники, которые содержат данные о статистике, например, есть такой источник СIA FAQ Book — это какая-то база ЦРУ, открытая совершенно, про численность населения в разных регионах. Это данные Всемирного банка о численности населения и экономике в разных регионах. Информация собирается из разных источников, если источники открыты. Если же это какая-то закрытая информация, но мы знаем, что пользователям она нужна, мы стараемся ее купить и добавить в Knowledge Graph", — объясняет Ринат Сафин.
Похоже, что из "Википедии" в блоке процентов 70 информации, и, кажется, в Google были соблюдены все требования лицензии "Википедии" о цитировании. Кстати, можно было бы предположить, что из-за "сети знаний" у "Википедии" упадет посещаемость. Однако, сервис был запущен в Америке в мае этого года и никаких спадов в аудитории до сих пор не наблюдается.
Надо отметить, что, по задумке Google, этот инструмент должен стать переходом к семантическому поиску Google. Однако, язык – субстанция многогранная, и, вводя в поисковую строку запрос “Венера”, пользователь может иметь в виду отнюдь не вторую планету от солнца, а древнеримскую богиню плодородия или знаменитую древнегреческую скульптуру. Пользователь также может искать салоны красоты или рестораны, имеющие аналогичные названия. Суть Knowledge Graph сводится к тому, чтобы поиск научился понимать сущности реального мира в их взаимосвязи, а не примитивно “считывать строчки поисковых запросов”.
Здесь важно отметить, что в Google сейчас работают и над достоверностью выдаваемых фактов — то есть, создают определенную базу достоверных источников, а также внутренний механизм сравнения или совпадения информации. Кроме того, развитие сервиса затрудняется и специфическими особенностями для определённых языков: связи между словами и объектами в английском могут ничего не значить в русском.