Яндекс Крипта или поисковая статистика

Яндекс Крипта

На днях столкнулся я с интересным проектом под названием Яндекс Крипта, который умело анализирует различную информацию о пользователи в интернете, вот например мой сегодняшний результат: яндекс крипта

Вчера я только узнал про данный проект и по стечению обстоятельств сегодня на Хабре так же появился топик, но он не такой интересный и информативный, из-за чего я решил написать данный блог. Первым делом я познакомился с самим проектом. В справочнике от самого Яндекса, где к сожалению не так много информации, сказано, что Яндекс Крипто работает на платформе Матрикснет. Сам Яндекс Крипто по сути представляет из себя некоторую надстройку для Матрикснет, где используется метод машинного поиска доя выявления пола и возраста пользователей интернета.

Взяв за основу данные почти миллиона пользователей интернета, Крипта смогла обучиться и классифицировать около 300 (!!!) различных параметров и состояний. После обработки данных разработчики выявили, что Яндекс Крипта гораздо эффективнее, чем, по сути грубый метод угадывания по теории вероятности. Хотя такое сравнение немного веселит, но как показывают их цифры, результат довольно неплохой для машинного поиска. Результат основывается на истории посещений сайтов в браузере и соответственно зависит от того, что и как часто просматривал пользователь.

Именно поэтому, если, например, зайти через вкладку «инкогнито» в Google Chrome, то мы увидим веселую картинку с Бендером из мультсериала «Футурама» (наверное в Яндекс работает много фанатов :)), которая информирует нас о невозможности вычисления данных, т.к. отсутствует необходимая информация в браузере.

Яндекс Крипта - Бендер
Яндекс Крипта работает для более точного таргетинга рекламы: постоянно обновляет информацию о пользователях и расширяет свои познания по новым классификаторам пользователей.

Ну и напоследок приведу пример результата, который был за день до наплыва хабра-сообщества:

Яндекс Крипта до Хабра

Как видно, Яндекс Крипта быстро опомнилась и решила подправить данные, причем вроде бы в лучшую сторону. Но как не печально, для отличных результатов Яндекс Крипта должна еще расти и развиваться…

Матрикснет

А вот про Матрикснет гораздо больше есть информации, причем очень даже интересной.

Помимо справки в Яндекс есть очень интересная статья про совместную работу с ЦЕРН, но на сколько я понял по комментариям самого сотрудника, пока это тестовый запуск и эксперимент. Потихоньку они проходят этап внедрения и сверяют данные. Более точную информацию возможно получить только после опубликования материалов научной работы. В свою очередь я хочу пожелать удачи Яндекс и ЦЕРН в их не легком деле развития новых технологий!

Ну и в завершении хочу предложить очень интересный цикл из трех статей про ранжирование в Яндекс. Я, к сожалению, прочитал только первую часть, на остальные пока времени нет, но очень надеюсь, что в ближайшее время ознакомлюсь до конца.