Отличия поиска Google и Яндекс

Алгоритмы ранжирования: они такие разные

Работа поисковых систем Google и Яндекс имеет схожие основные принципы, но существует ряд отличий в алгоритмах их работы.

Алгоритмы ранжирования — это набор факторов, на основе которых поисковая система определяет, какой сайт будет показан в поисковой выдаче и в каком порядке. У Google и Яндекса есть схожие цели — предоставить пользователю наиболее релевантные результаты, но они используют разные подходы.

Google и история его алгоритмов

Алгоритм PageRank

Изначально Google основывался на алгоритме PageRank, который оценивает значимость страниц через количество и качество ссылок. Этот алгоритм учитывает, сколько ссылок ведет на страницу и насколько авторитетны сайты, которые дают ссылки. Последние 5 лет этот показатель становился все менее значимым, но все равно имеет значение именно для поиска Google. История логотипа Гугл

Алгоритм Hummingbird

В сентября 2013 года Google выпустил поисковый алгоритм Hummingbird (Колибри) и начал учитывать семантический контекст запроса. Н асайте стало важно не только то, сколько раз встречаются ключевые слова, но и их значимость в контексте, а также глубокое и всестороннее раскрытие темы.

RankBrain

Запущен в 2015 году. Использует машинное обучение и искусственный интеллект для интерпретации поисковых запросов. Помогает Google лучше понимать незнакомые запросы и ассоциировать их с релевантными результатами. Именно после этого алгоритма появилась возможность указывать в поисковой строке конкретный вопрос и получать на него адекватные ответы. Примерно в этот период времени в выдаче появились быстрые ответы, которые можно быстро открыть на первой странице выдачи без перехода на сайт.

BERT - крупнейшее обновление Гугл

Запущен на русском языке в декабре 2019 года. Этот алгоритм анализирует не только ключевые слова, но и их расположение в запросе, чтобы лучше понимать контекст всей фразы. Для этого используется нейронная сеть, которая способна наделить поисковую систему именно пониманием сути и это главное новшество. Предыдущие модели анализировали текст последовательно: либо слева направо, либо справа налево. BERT анализирует всё предложение целиком, учитывая контекст от всех слов одновременно. Это позволяет гораздо лучше понимать смысл.

BERT позволил Google гораздо лучше понимать:

  • Нюансы и контекст запросов, особенно длинных и разговорных (voice search).
  • Значение предлогов. Например, разница между «рестораны для детей» и «рестораны без детей».
  • Многозначность слов. Например, что «яблоко» в запросе «рецепт пирога с яблоком» — это фрукт, а в «как починить яблоко» — бренд.
  • Интенты (намерения) пользователя. Что на самом деле ищет человек, даже если он сформулировал запрос неточно.

MUM (2021)

Это модель на основе AI (искусственного интеллекта), основанная на архитектуре T5 (Text-To-Text Transfer Transformer). Она в 1000 раз более мощная, чем BERT. Эта модель - не единовременное "обновление", которое включили и всё изменилось. Это новая технологическая платформа, которую Google постепенно и точечно внедряет в Поиск с 2021 года. MUM бросает вызов традиционному SEO. Просто использовать ключевые слова теперь недостаточно.

Что важно для хорошей выдачи сайта на Google?

  • Акцент на экспертность и глубину информации (E-A-T): MUM лучше оценивает, является ли контент действительно авторитетным и всеобъемлющим.
  • Структурированность данных: Помогает алгоритму понять и проиндексировать ваш контент.
  • Мультимедийность: Контент, который имеет не только текст, но и дополнен изображениями, видео и аудио в комплексе, будет иметь преимущество, так как MUM сможет его проанализировать целиком.
  • Фокус на удовлетворение потребности пользователя: Нужно создавать контент, который полностью решает проблему пользователя, а не просто отвечает на один узкий вопрос.

Core Updates (основные обновления) Google происходят регулярно, чтобы улучшить качество поиска. Эти обновления могут касаться различных аспектов, включая качество контента, авторитетность сайтов, работу с искусственным интеллектом и так далее.

Важно понимать, что если ваш сайт потерял позиции после очередного Core Update — это не наказание типо за спам. Это значит, что обновленный алгоритм теперь по-другому оценивает качество вашего контента по сравнению с контентом ваших конкурентов. Получается, что другие сайты стали более релевантными в глазах Google. Google выпускает несколько Core Updates в год. Раньше они были реже, но теперь происходят довольно регулярно. О каждом таком обновлении Google официально сообщает в Twitter (X) и в своем блоге для веб-мастеров.

Как развивался поиск от Яндекс

Алгоритм МатриксНет (MatrixNet)

Основной алгоритм Яндекса, который внедрен в 2009 году. Он оценивает качество и релевантность контента на страницах. Поиск велся одновременно на тысячах серверов. Каждый сервер искал по своей части индекса и формирует список самых лучших результатов, у который гарантированно попадают все самые релевантные запросу страницы. МатриксНет анализирует как текстовую информацию, так и множество других факторов, например, поведенческие факторы: клики, время нахождения на сайте, скроллы

История развития поиска Яндекс

2010: Агент Амиго (позже переродился в Кобальт)

Один из первых алгоритмов, который начал оценивать качество сайтов в целом, а не отдельных страниц. Искал ссылочный спам, дорвеи, сайты-сателлиты. Заложил основу для будущей борьбы с webspam.

2015: Кобальт

Мощный алгоритм-преемник Амиго. Его главная задача — оценивать качество и тематическую авторитетность сайтов. Он вычисляет сайты с низкокачественным, SEO-оптимизированным под поиск, но бесполезным для людей контентом, и понижает их. По итогу сильно очистил выдачу от мусора. Сайты, попавшие под Кобальт, теряли видимость по всему их семантическому ядру.

2017: Королев (Korolyov)

Нейросетевая модель повторного ранжирования (re-ranking), которая работает в реальном времени. Сначала основные алгоритмы (Матрикснет) отбирают несколько десятков кандидатов в ответ на запрос. Затем Королев «вглядывается» в них и за доли секунды переставляет местами, чтобы самые релевантные и полезные оказались наверху. После внедрения значительно улучшила точность top-5 выдачи, особенно для сложных и нечетких запросов.

2018: Палех (Palekh)

Нейросетевая модель для быстрого поиска — это первый этап обработки запроса. Она за мгновение отбирает из миллиардов документов несколько тысяч самых вероятных кандидатов, которые затем передаются на более глубокий анализ. Резко ускорила поиск и сделала его более эффективным, позволив использовать более сложные модели на последующих этапах.

2021: YaLM (Yet another Language Model)

Семейство больших языковых моделей-трансформеров, прямых аналогов GPT от OpenAI. Самая известная — YaLM-100B — одна из крупнейших в мире моделей с открытыми весами на момент релиза (100 млрд параметров). По сути это не «алгоритм поиска» в чистом виде, а технологическая платформа. Технологии YaLM интегрируются в поиск для глубокого понимания смысла запросов и документов, генерации ответов, как в «Ответах» Яндекса, summarization (создания кратких выжимок) и многого другого.

2022: Обновленный Кобальт

Кобальт был кардинально обновлен с применением нейросетей. Теперь он еще точнее определяет качество сайтов, лучше понимает тематику и борется с рекламно-информационными сайтами (КНС), которые маскируются под полезные ресурсы.

2023-2024: Интеграция ИИ в поиск

Активное внедрение генеративного ИИ на базе YaLM непосредственно в поисковую выдачу. Появляются «Ответы» — сгенерированные AI-ассистентом блоки, которые напрямую отвечают на вопрос пользователя, summarization-блоки «основная идея статьи». Поисковая выдача перестает быть просто списком ссылок. Она становится интерактивным ассистентом, способным обобщать информацию.

Какая доля пользователей Google и Яндекс?

Россия Во всем мире
Google 40% 92%
Яндекс 60% <1,5%

Что общего у Яндекса и Гугла

  1. Предоставление результатов поиска с учетом географического положения и локализация выдачи по населенному пункту. Если по запросу имеются магазины или организации, обозначенные на карте, то оба поисковика предлагают их расположение на карте
  2. Быстрые ответы на вопросы без посещения сайтов
  3. Предвставление релевантных фото и видео
  4. Реклама — основной источник дохода. Google и Яндекс зарабатывают львиную долю денег на контекстной рекламе в Google Ads и Яндекс.Директ Именно поэтому поиск для пользователей остается бесплатным
  5. Ответы ИИ

Заключение

Google — глобальная компания, ориентированная на весь мир. Её алгоритмы должны работать универсально для сотен языков и культур. Яндекс изначально был сфокусирован на Рунете и русском языке. Это позволило ему глубоко адаптировать технологии под специфику русского языка, менталитета и рынка. Многие считают, что в Рунете Яндекс понимает запросы и контекст иногда даже лучше Google.