Алгоритмы ранжирования: они такие разные
Работа поисковых систем Google и Яндекс имеет схожие основные принципы, но существует ряд отличий в алгоритмах их работы.
Алгоритмы ранжирования — это набор факторов, на основе которых поисковая система определяет, какой сайт будет показан в поисковой выдаче и в каком порядке. У Google и Яндекса есть схожие цели — предоставить пользователю наиболее релевантные результаты, но они используют разные подходы.
Google и история его алгоритмов
Алгоритм PageRank
Изначально Google основывался на алгоритме PageRank, который оценивает значимость страниц через количество и качество ссылок. Этот алгоритм учитывает, сколько ссылок ведет на страницу и насколько авторитетны сайты, которые дают ссылки. Последние 5 лет этот показатель становился все менее значимым, но все равно имеет значение именно для поиска Google. 
Алгоритм Hummingbird
В сентября 2013 года Google выпустил поисковый алгоритм Hummingbird (Колибри) и начал учитывать семантический контекст запроса. Н асайте стало важно не только то, сколько раз встречаются ключевые слова, но и их значимость в контексте, а также глубокое и всестороннее раскрытие темы.
RankBrain
Запущен в 2015 году. Использует машинное обучение и искусственный интеллект для интерпретации поисковых запросов. Помогает Google лучше понимать незнакомые запросы и ассоциировать их с релевантными результатами. Именно после этого алгоритма появилась возможность указывать в поисковой строке конкретный вопрос и получать на него адекватные ответы. Примерно в этот период времени в выдаче появились быстрые ответы, которые можно быстро открыть на первой странице выдачи без перехода на сайт.
BERT - крупнейшее обновление Гугл
Запущен на русском языке в декабре 2019 года. Этот алгоритм анализирует не только ключевые слова, но и их расположение в запросе, чтобы лучше понимать контекст всей фразы. Для этого используется нейронная сеть, которая способна наделить поисковую систему именно пониманием сути и это главное новшество. Предыдущие модели анализировали текст последовательно: либо слева направо, либо справа налево. BERT анализирует всё предложение целиком, учитывая контекст от всех слов одновременно. Это позволяет гораздо лучше понимать смысл.
BERT позволил Google гораздо лучше понимать:
- Нюансы и контекст запросов, особенно длинных и разговорных (voice search).
- Значение предлогов. Например, разница между «рестораны для детей» и «рестораны без детей».
- Многозначность слов. Например, что «яблоко» в запросе «рецепт пирога с яблоком» — это фрукт, а в «как починить яблоко» — бренд.
- Интенты (намерения) пользователя. Что на самом деле ищет человек, даже если он сформулировал запрос неточно.
MUM (2021)
Это модель на основе AI (искусственного интеллекта), основанная на архитектуре T5 (Text-To-Text Transfer Transformer). Она в 1000 раз более мощная, чем BERT. Эта модель - не единовременное "обновление", которое включили и всё изменилось. Это новая технологическая платформа, которую Google постепенно и точечно внедряет в Поиск с 2021 года. MUM бросает вызов традиционному SEO. Просто использовать ключевые слова теперь недостаточно.
Что важно для хорошей выдачи сайта на Google?
- Акцент на экспертность и глубину информации (E-A-T): MUM лучше оценивает, является ли контент действительно авторитетным и всеобъемлющим.
- Структурированность данных: Помогает алгоритму понять и проиндексировать ваш контент.
- Мультимедийность: Контент, который имеет не только текст, но и дополнен изображениями, видео и аудио в комплексе, будет иметь преимущество, так как MUM сможет его проанализировать целиком.
- Фокус на удовлетворение потребности пользователя: Нужно создавать контент, который полностью решает проблему пользователя, а не просто отвечает на один узкий вопрос.
Core Updates (основные обновления) Google происходят регулярно, чтобы улучшить качество поиска. Эти обновления могут касаться различных аспектов, включая качество контента, авторитетность сайтов, работу с искусственным интеллектом и так далее.
Важно понимать, что если ваш сайт потерял позиции после очередного Core Update — это не наказание типо за спам. Это значит, что обновленный алгоритм теперь по-другому оценивает качество вашего контента по сравнению с контентом ваших конкурентов. Получается, что другие сайты стали более релевантными в глазах Google. Google выпускает несколько Core Updates в год. Раньше они были реже, но теперь происходят довольно регулярно. О каждом таком обновлении Google официально сообщает в Twitter (X) и в своем блоге для веб-мастеров.
Как развивался поиск от Яндекс
Алгоритм МатриксНет (MatrixNet)
Основной алгоритм Яндекса, который внедрен в 2009 году. Он оценивает качество и релевантность контента на страницах. Поиск велся одновременно на тысячах серверов. Каждый сервер искал по своей части индекса и формирует список самых лучших результатов, у который гарантированно попадают все самые релевантные запросу страницы. МатриксНет анализирует как текстовую информацию, так и множество других факторов, например, поведенческие факторы: клики, время нахождения на сайте, скроллы

2010: Агент Амиго (позже переродился в Кобальт)
Один из первых алгоритмов, который начал оценивать качество сайтов в целом, а не отдельных страниц. Искал ссылочный спам, дорвеи, сайты-сателлиты. Заложил основу для будущей борьбы с webspam.
2015: Кобальт
Мощный алгоритм-преемник Амиго. Его главная задача — оценивать качество и тематическую авторитетность сайтов. Он вычисляет сайты с низкокачественным, SEO-оптимизированным под поиск, но бесполезным для людей контентом, и понижает их. По итогу сильно очистил выдачу от мусора. Сайты, попавшие под Кобальт, теряли видимость по всему их семантическому ядру.
2017: Королев (Korolyov)
Нейросетевая модель повторного ранжирования (re-ranking), которая работает в реальном времени. Сначала основные алгоритмы (Матрикснет) отбирают несколько десятков кандидатов в ответ на запрос. Затем Королев «вглядывается» в них и за доли секунды переставляет местами, чтобы самые релевантные и полезные оказались наверху. После внедрения значительно улучшила точность top-5 выдачи, особенно для сложных и нечетких запросов.
2018: Палех (Palekh)
Нейросетевая модель для быстрого поиска — это первый этап обработки запроса. Она за мгновение отбирает из миллиардов документов несколько тысяч самых вероятных кандидатов, которые затем передаются на более глубокий анализ. Резко ускорила поиск и сделала его более эффективным, позволив использовать более сложные модели на последующих этапах.
2021: YaLM (Yet another Language Model)
Семейство больших языковых моделей-трансформеров, прямых аналогов GPT от OpenAI. Самая известная — YaLM-100B — одна из крупнейших в мире моделей с открытыми весами на момент релиза (100 млрд параметров). По сути это не «алгоритм поиска» в чистом виде, а технологическая платформа. Технологии YaLM интегрируются в поиск для глубокого понимания смысла запросов и документов, генерации ответов, как в «Ответах» Яндекса, summarization (создания кратких выжимок) и многого другого.
2022: Обновленный Кобальт
Кобальт был кардинально обновлен с применением нейросетей. Теперь он еще точнее определяет качество сайтов, лучше понимает тематику и борется с рекламно-информационными сайтами (КНС), которые маскируются под полезные ресурсы.
2023-2024: Интеграция ИИ в поиск
Активное внедрение генеративного ИИ на базе YaLM непосредственно в поисковую выдачу. Появляются «Ответы» — сгенерированные AI-ассистентом блоки, которые напрямую отвечают на вопрос пользователя, summarization-блоки «основная идея статьи». Поисковая выдача перестает быть просто списком ссылок. Она становится интерактивным ассистентом, способным обобщать информацию.
Какая доля пользователей Google и Яндекс?
| Россия | Во всем мире | |
| 40% | 92% | |
| Яндекс | 60% | <1,5% |
Что общего у Яндекса и Гугла
- Предоставление результатов поиска с учетом географического положения и локализация выдачи по населенному пункту. Если по запросу имеются магазины или организации, обозначенные на карте, то оба поисковика предлагают их расположение на карте
- Быстрые ответы на вопросы без посещения сайтов
- Предвставление релевантных фото и видео
- Реклама — основной источник дохода. Google и Яндекс зарабатывают львиную долю денег на контекстной рекламе в Google Ads и Яндекс.Директ Именно поэтому поиск для пользователей остается бесплатным
- Ответы ИИ