Как работают поисковые системы

03Май

Поисковая система - это набор программ, которые обрабатывают полученные данные и на базе своих алгоритмов формируют выдачу (ссылки которые получает пользователь в ответ на запрос).

Поисковые системы в основном состоят из пяти отдельных, но вместе связанных программных компонентов. Давайте детальнее рассмотрим эти программные компоненты для того что бы лучше понимать что такое поисковая система и как она функционирует.

Работа поисковых систем. Как работают поисковые системы

1.    Паук – это подобно браузеру программа, которая скачивает web страницы. Она работает так же как обычный браузер, через который вы смотрите сайты, а именно соединяетесь и смотрите веб страницы. Подобное действие вы можете увидеть, когда просматриваете любую страницу и когда выбираете «просмотр HTML-кода» в своем браузере.

2.    Путешествующий паук – это программа распознает страницу и находит на ней все ссылки.  Главная задача этой программы – определять куда дальше идти пауку. Он основывается на ссылках,  которые распознает.

3.    Индексатор – эта программа разбирает страницы на части и проводит анализ этих страниц. Индексатор анализирует такие элементы как заголовки страниц, ссылки, текст, структурные элементы, а так же другие элементы , которые мы подробно будем разбирать в статье про оптимизацию сайта.

4.    База данных – это место где хранятся все данные, которые поисковые системы скачивают и анализируют. Поскольку на сегодняшний день поисковые системы хранят в себе миллиарды страниц веб сайтов, для этого необходимо много места и мощные сервера для того что бы все информацию обрабатывать. Поисковая система Google тратит на  Дата центры расположенные по всему миру более 2-х миллиардов долларов в год для того что бы содержать мощнейшие сервера.

5.    Система выдачи результатов – это сердце поисковой системы. Именно тут решается, какие запросы удовлетворяют запросу пользователя.  Приведем пример: когда пользователь вводит в поисковую систему интересующий его запрос (ключевое слово) и осуществляет поиск, поисковая система отбирает результаты на основании постоянно меняющихся алгоритмов (критериев). Данный алгоритмом называется метод, по которому поисковая система принимает решение.

Не смотря на то, что поисковые системы постоянно развиваются и за последние 10 лет сильно изменились, большинство из них до сих пор определяют выдачу (результаты поиска) по таким критериям:

- Заголовок - присутствуют ли ключевые слова в заголовке?
- Доменное имя -  присутствует ли ключевые слова в доменном имени?
- Плотность -  насколько часто ключевое слово употребляется на странице?
- Мета данные - поисковые системы читают мета теги keywords, description, присутствуют ли ключевые слова в этих мета тегах?
- Внешние ссылки - кто в интернете ссылается на этот сайт? Содержит ли ссылка ключевое слово?
- Наружные ссылки – на кого есть ссылки на странице? Содержат ли они ключевое слово?
- Ссылки внутри страницы – на какие страницы сайта содержит ссылки эта страница?

Для того что бы быстро дать вам ответ на запрос поисковая система делает достаточно уточняющих запросов, что бы выдать самые целевые ссылки на веб сайты и  для этого как я ранее упомянул, необходимы мощнейшие сервера для обработки запросов.

Немного фактов:

Поисковая система Google обрабатывает в день более 100 млн. запросов

Понравился пост? Подпишитесь на обновления через RSS или по почте

Похожие посты

Add a Comment