Как работает поисковик

Что бы понять как работает поисковик, нужно сперва узнать, как он устроен. А вот насчёт алгоритмов поиска, тут чёрт ногу сломит. Они всё время меняются. Гугл в этом отношении более стабилен. А вот яндекс всё время что то меняет.

А почему меняет? Тут ответ простой. Сайтов миллионы и все хотят попасть на первые странички выдачи поисковиков. Постепенно люди, методом проб и ошибок узнают об этих алгоритмах и начинают подстраивать под них свои сайты. Что бы пролезть в десятку первых в выдаче. Особенно это актуально при создании дорвеев, сателлитов. Они обычно затачиваются под конкретный поисковый запрос. Но это отдельная история. Но иногда поисковые системы слегка меняют эти свои алгоритмы. И тут некоторые владельцы сайтов влипают по серьёзному. У кого то тицы с пырами падают, кто то вылетает с первых страничек выдачи. У кого как. Тем, у кого сайт сделан для людей, им в основном плевать на все эти алгоритмы. Это я по себе сужу :)

Над алгоритмами поиска бились и бьются лучшие умы человечества :) Но так и не придумали ни чего лучше простой мысли - надо делать сайт для людей. Вот основа поисковой оптимизации. А вот как работает поисковик в чисто техническом плане, сейчас разберёмся.


Помните я писал, что работу поисковиков обеспечивает специализированное программное обеспеченье? Так вот это программное обеспеченье делится в основном на пять частей. Тут у кого как, все поисковики разные. Например по последним данным гугл перестал учитывать ключевые слова. Но тут ни чего нельзя сказать с уверенностью, так как официальных заявлений не было. Так что это просто был пример. А вот основные запчасти :)

Spider (паук) - частенько принято считать, что это и есть сама поисковая машина. Но это всего лишь её небольшая часть. Паук просто скачивает странички сайтов. Но не сами странички, а их код. Работает примерно как и ваш браузер. Щёлкните правой кнопкой мыши по сайту и выберите в меню - исходный код страницы. Вот этот код паук и скачивает.

Crawler - кто то ещё называет его пауком путешественником :) Хотя с другой стороны это так и есть. Он переходит по ссылкам на вашем сайте. Точнее он тоже, как и паук Spider скачивает странички. Но уже для того, что бы найти там ссылки и сообщить Spideru, куда идти дальше :) Наверное многие не об этом подумали :)

Indexer - а вот это уже мозг. Он разбирает странички на части, всё анализирует - заголовки, ключевые слова, ссылки и т.д.

Database - база данных. А что тут скажешь, база данных, она и в России база данных. Тут хранятся все данные, что проанализирует индексатор.

Search Engine Results Engine - а вот это самое сердце зверя. Это не моя фраза, просто запомнилась. Именно здесь и решается что выдать пользователю по запросу. А проще говоря - система выдачи результатов поиска.


Вот и разложили поисковую машину по кусочкам. Тут конечно далеко не всё. У каждого поисковика свои прибамбахи. Но структура примерно одинакова.

Немного рекламы :)

Copyright, design, ideas © Mihail. При копировании материалов, ссылка на сайт "Seozar.ru" обязательна. Контакты - admin@halych.ru
Тариф «Первый»: 2 сайта, 1 Гб, 2 MySQL, 2 FTP