Общие принципы работы поисковых систем

Из пяти отдельных программных компонент состоят поисковые системы, а именно:

  • Паук (spider ): его задача - скачивать WEB страницы; программа, которая подобна WEB браузеру.
  • Crawler : паук, которого называют «путешествующим»; он автоматически переходит по всем ссылкам, которые были найдены на странице.
  • Индексатор (indexer ): программа, которую называют «слепой»; ее задача анализировать WEB страницы, которые были скачены пауками.
  • База данных (database ): она является хранилищем страниц, которые были сначала скачены, а потом подвергнуты обработке.
  • Система выдачи результатов (search engine results engine ): данная система помогает извлекать результаты поиска из базы данных.

Подробнее о каждом из компоненте поисковых систем

Паук : Spider - его задача проста - скачивать WEB страницы. Принцип его работы ничуть не отличается от вашего браузера, в том случае, если вы просто соединяетесь с сайтом и начинаете загружать страницу. Визуализация у Паука отсутствует. Похожую ситуацию (скачивание) можно увидеть, когда вы начинаете просматривать какую-то страницу и выбираете в вашем WEB браузере «просмотреть HTML код».

Crawler : Подобно Пауку он тоже скачивает страницы, также в его функциях есть «раздевание» страницы и нахождение всех ссылок. Это и является его задачей - определить, куда же Паук должен двигаться дальше, он основывается только на ссылках или при помощи заранее заданного списка адресов.

Индексатор : Indexer помогает разобрать страницу на разные ее части и проанализировать их. Вычленяются и анализируются заголовки, элементы любых заголовков страниц, текст, ссылки, элементы BOLD, ITALIC, структурные элементы, а также другие стилевые части страницы.

База данных : Database является хранилищем любых данных, которые поисковая система собирается скачать и проанализировать. В большинстве случаев для этого требуются огромные ресурсы.

Система выдачи результатов : Search Engine Results Engine является сердцем поисковой системы. Именно данная система будет решать, какие же страницы будут удовлетворять каждому запросу обычного пользователя. При помощи данной части поисковой системы и осуществляется поиск.

В случае если пользователь ввел ключевое слово и начал поиск, поисковая система начинает отбирать результаты, опираясь на постоянно меняющиеся критерии. Метод, по которому поисковая система принимает любые свои решения, называется алгоритмом. «Algos» - данный термин иногда используют профессиональные - это и есть то, о чем мы разговариваем.

Критерии поиска при формировании выдачи поисковыми системами

Даже из-за того, что поисковые системы очень изменились, большинство из них в наше время отбирает результаты поиска, опираясь на данные критерии:

  • Заголовок (Title): Есть ли в заголовке ключевое слово?
  • Домен/адрес (Domain/URL): Есть ли в адресе страницы или в имени домена ключевое слово?
  • Стиль (Style): Заголовки HEAD, Курсивный (I или EM), Жирный (B или STRONG): есть ли на странице место, где ключевое слово используют в курсивных, жирных, или Hx (H1, H2, …) текстовых заголовках?
  • Плотность (Density): Насколько часто ключевое слово употребляется на странице? Плотность ключевого слова - количество ключевых слов относительно текста страницы.
  • Мета данные (MetaInformation): Хоть и многие отрицают, но некоторые поисковые системы в наши дни все еще читают мета описания (meta description) и мета ключевые слова (meta keywords).
  • Ссылки наружу (Outbound Links): Куда ведут ссылки на странице, и имеется ли в тексте ссылки ключевое слово?
  • Внешние ссылки (Inbound Links): У кого еще в Интернете имеется ссылка на этот сайт? Что в тексте ссылки? Автор страницы не в каждом случае может контролировать этот критерий, поэтому он называется «внестраничным».
  • Ссылки внутри страницы (Insite Links): Содержит ли страница ссылки на еще какие-нибудь страницы этого сайта?

В результате видим, что, поисковая система должна уметь и делать многие уточняющие запросы, используя при этом скаченную страницу целиком.

Данная статья является лишь сокращенным описанием функционирования поисковых систем.

В повседневной речи под термином «поисковая система» понимается программное обеспечение, состоящее из базы данных документов, снабженной пользовательским интерфейсом, позволяющим пользователю получить упорядоченное подмножество этих документов как ответ на его поисковый запрос. Основная задача поисковой системы заключается в выборе наилучшего возможного подмножества в ответ на конкретный запрос, то есть множества документов, которые оптимально соответствуют тому, что ищет пользователь (обычно в порядке убывания релевантности).

Самыми распространенными примерами поисковых систем, используемых повсюду, являются поисковые системы для Веба (такие как Google и Yahoo), которые применяются для обнаружения текстовой информации (например, документы в формате HTML и PDF), хранящейся на веб-серверах, расположенных по всему миру. Схожие технологии применяются и при поиске информации в корпоративных внутренних сетях.

Формальные компоненты поисковой системы

Большинство поисковых систем состоит из двух основных независимых компонентов: компонента индексирования и компонента поиска. Пользователю доступен только поисковый компонент. Компонент индексирования используется для создания внутреннего эффективного представления данных, в которых будет производиться поиск необходимой информации, а поисковый компонент отвечает за получение результатов из внутренней базы данных в ответ на поисковый запрос пользователя.

Компонент индексации выполняет функцию преобразования документов среды, в которой ведется поиск, в адекватное внутреннее представление поисковой системы. Множество документов, среди которых будет вестись поиск, называется универсумом. Для поисковой системы Интернета это страницы, которые мы загружаем из сети, для графической поисковой системы им будет являться набор изображений, а для академической поисковой системы универсум будет представлен, например, собранием работ, статей и книг. Множество документов, являющееся внутренним представлением универсума, называется репозиторием. Репозиторий, как правило, содержит документы с привязанными к ним соответствующими уникальными идентификаторами (их принято обозначать DOCID). Каждое представление документа из универсума в репозитории зависит в первую очередь от поисковой системы.

Рассмотрим компонент поиска, который обращается к документам, расположенным в репозитории для того, чтобы осуществить выборку, соответствующую поисковому запросу. Формально поисковый компонент может быть представлен как программа, реализующая преобразование поискового запроса, то есть конечной строки, введенной пользователем, во множество документов, релевантных этому запросу. Поисковый запрос принято считать состоящим из терминов, являющихся атомарными словами, поиск которых ведется, и операторов, описывающих способы интерпретации терминов. Например, в поисковом запросе «цепи Маркова» запрос состоит из терминов «Маркова» и «цепи». Оператором в данном случае будет являться логическое «И», что описывает ситуацию, когда нам необходимы документы, содержащие оба этих термина. Количество возвращаемых документов называется эффективностью поиска для данного поискового запроса.

Результат работы компонента поиска - это информация, предоставляемая пользователю. Элементы возвращаемого множества - это все документы, которые поисковая система сочла подходящими для включения в результирующий набор. Более того, элементы в результирующем множестве расположены в таком порядке, что первый считается более значимым для пользователя, чем второй, и т.д. Точность определяется долей возвращенных документов, которые фактически релевантны.

Здесь понятие релевантности является абсолютно произвольным и полностью зависит от поисковой системы (или, возможно, от ее пользователей).

Рассмотрим проблему получения результирующего множества документов на основании поискового запроса и репозитория. Поисковая система обычно осуществляет выборку в два этапа:

Выбор множества претендентов из репозитория - такого, что все элементы в нем в той или иной степени релевантны поисковому запросу. Определение релевантности на данном этапе очень приближенное. Например, может быть использован логический метод, рассматриваемый далее.

Для каждого документа множества претендентов определяется его релевантность, а затем множество сортируется в порядке уменьшения релевантности. В процессе сортировки некоторые элементы, имеющие релевантность ниже порогового значения, могут быть исключены из выборки.

Логический метод определения множества претендентов

Рассмотрим процесс определения множества претендентов, который обычно происходит с использованием логического метода. Основная идея данного метода заключается в том, что результирующее множество поискового запроса (такого, например, как «цепи Маркова») должно содержать только страницы, относящиеся ко всем уникальным терминам запроса (в данном случае ими будут являться «Маркова» и «цепи»). Затем ответ на поисковый запрос может быть дан после просмотра всех документов, содержащих термины «Маркова» и «цепи», используя документы, содержащие пересечение этих терминов как результирующее множество претендентов.

Так происходит по той причине, что основной задачей компонента индексации является построение инвертированного индекса, являющегося структурой данных, в которой терминам в соответствие ставятся документы (или DOCID), содержащие эти слова (как расширение, например, в поисковой системе изображений, термин «лицо» может быть привязан ко всем документам, которые классифицируются как содержащие лица).

Всем привет. Прежде чем начинать продвигать сайт в поисковых системах необходимо понять принципы работы этих самых систем. Вернемся к основам и узнаем каким же образом работает поисковая система.

Принцип работы поисковых систем

Любая поисковая система состоит из следующих компонентов:

Spider (паук)-программа которая скачивает все веб-страницы сайта. В чем-то она похожа на обыкновенный браузер, только работает она напрямую с html-кодом страницы. Ее основная задача найти как можно больше информации на сайте, которая в дальнейшем будет обрабатываться другими алгоритмами поисковой системы.

Crawler (краулер)-программа, которая проходит по всем ссылкам, которые она находит на странице. Она определяет, куда дальше должен идти паук, и находит новые документы, которые еще не известны поисковой системе. В том случае, если есть , то он проходит по всем ссылкам найденным в ней, определяя какие именно страницы нужно проиндексировать.

Indexer (индексатор)-разбивает страницу скачанную пауком на составляющие, анализирует их и заносит в базу данных. Все это называется одним словом «индексация». Существует несколько способов для того, чтобы ускорить .

Database (база данных)-место где хранятся скачанные и обработанные страницы.

Web server (веб-сервер)-сервер, осуществляющий взаимодействие между пользователем и всеми остальными компонентами поисковой системы. Ее Вы видите каждый раз, когда заходите на страницу поиска.

Search engine results engine (система выдачи)-это самая главная часть любой поисковой системы, её ядро, определяющее принцип ее работы. Каждый вопрос, который пользователь задает поисковой системе, она анализирует, и, после этого, находит в индексе документ, который полностью на этот вопрос отвечает.

Основные принципы построения выдачи поисковых систем

Для того, чтобы решить какой документ больше всего подходит для ответа на запрос пользователя система выдачи анализирует:

  • Заголовок страницы. Заголовок страницы это текст, расположенный в теге . Заголовок должен как можно ближе отображать содержание страницы. В том случае, если в заголовке страницы встречаются ключевые слова из запроса, поисковая система считает, что документ соответствует запросу, и у появляются хорошие шансы попасть в выдачу поисковой системы.</li> </ul><ul><li>Плотность ключевых слов на странице. Поисковая система также следит за количеством употреблений слов из ключевого запроса на странице. Для того, чтобы страница отвечала на запрос и попала в выдачу, необходимо, чтобы слова из поискового запроса встречались на странице в определенной концентрации.</li> </ul><ul><li>Употребление ключевых слов в подзаголовках. Слова из поискового запроса должны встречаться в подзаголовках документа.</li> </ul><ul><li>Внешние и внутренние ссылки на документ. Это так называемые ссылочные факторы ранжирования. Если на документ ссылаются с других страниц сайта, а также с других сайтов, это сигнал для поисковой системы о том, что эта страница отвечает запросу. При этом слова из запросов должны встречаться в якорях ссылок. Это очень важно!</li> </ul><ul><li>Поведенческие факторы. Были введены в поисковые алгоритмы недавно. В настоящий момент активно развиваются. Основной смысл в том, что поисковая система оценивает поведение пользователей, пришедших на страницу, и по нему судит о качестве информации, представленной на сайте. К примеру, если очень много людей перейдя на страницу сразу же уходит с нее, и продолжает искать информацию на других сайтах поисковая система считает, что данная страница не имеет большой ценности и понижает ее в выдаче по данному ключевому слову.</li> </ul><p>Разумеется я рассказал не всех факторах ранжирования поисковых систем. В реальности их намного больше. Я перечислил только самые основные. Подробнее о том, как продвигать сайты в поисковых системах ты можешь узнать на страницах моего сайта. Так что не забывай подписываться на</p> <p>Знание механизмов работы поисковых систем крайне важно для SEO-оптимизации. Эти знания - основа, так как они позволяют строить собственную стратегию продвижения сайта в Интернете.<br>Поисковая система состоит из нескольких основных компонентов: Spider, Crawler, Indexer, Database, SERE, Web server. Давайте рассмотрим каждый из компонентов подробнее.<br>Spider (анг. «паук») - браузеро-подобная программа, которая скачивает веб-страницы таким же способом, как вы скачиваете их с помощью браузера для просмотра. Существенное отличие состоит в том, что браузер отображает информацию, содержащуюся на странице (текстовую, графическую и т. д.), а паук не имеет никаких визуальных компонентов и работает напрямую с html-текстом страницы. Вы можете сами увидеть тот массив информации, с которой работает паук, если нажмете «Просмотр html-кода» в вашем браузере, чтобы увидеть «сырой» html-текст.<br>Crawler (краулер, «путешествующий» паук) называется программа, автоматически проходящая по всем ссылкам, найденным на странице. Задача краулера - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Переходя по найденным ссылка, краулер осуществляет поиск новых документов, еще неизвестных поисковой системе.<br>Indexer (индексатор)разбирает страницы, скаченные пауками, на составные част и анализирует их. Выделяются и анализируются различные элементы страницы: текст, заголовки, структурные и стилевые особенности, специальные служебные html-теги и т. д.<br>Database (база данных) - хранилище скачанных и обработанных страниц, то есть все данных, которые поисковая система скачивает и анализирует. Иногда базу данных называют еще индексом поисковой системы. По сути это напоминает жесткие диски на наших персональных компьютерах.<br>Search Engine Results Engine (система выдачи результатов) - программа для извлечения результатов поиска из базы данных. Она занимается ранжированием страниц, то есть решает, какие страницы удовлетворяют запросу пользователя, и в каком порядке они должны быть отсортированы. В основе этой работы лежат определенные алгоритмы ранжирования поисковой системы (например, индекс цитирования). Эта информация является наиболее ценной для оптимизаторов, так как именно с этим компонентом поисковой системы они взаимодействует с целью улучшения позиции сайта в выдаче.<br>Web server - веб-сервер, который делает возможным взаимодействие между пользователем и остальными компонентами поисковой системы. Обычно на сервере присутствует html-страница с полем ввода, в котором пользователь может задать интересующий его поисковый термин. Также сервер отвечает за выдачу результатов пользователю в виде html-страницы.<br>Детальная реализация поисковых механизмов в отдельно взятой поисковой системе может быть различной (например, связка Spider+Crawler+Indexer может быть выполнена в виде единой программы), однако всем поисковым системам присущи описанные общие черты. </p> <p>Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: <u>«Google» </u>, <u>«Yahoo» </u>, <u>«MSN» </u>. В русском Интернете это – <u>«Яндекс» </u>, <u>«Рамблер» </u>, <u>«Апорт» </u>.</p><p>Опишем основные характеристики поисковых систем:</p><ul><p><i>Полнота </i></p> </ul><p>Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.</p><ul><p><i>Точность </i></p> </ul><p>Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.</p><ul><p><i>Актуальность </i></p> </ul><p>Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.</p><ul><p><i>Скорость поиска </i></p> </ul><p>Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.</p><ul><p><i>Наглядность </i></p> </ul><p>Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.одробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке <u>http://help.yandex.ru/search/?id=481937 </u>.</p><p><b>4. Краткая история развития поисковых систем </b></p><p>В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.</p><p>Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.</p><p>Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.</p><p>Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.</p><p>В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.</p><p>В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!</p><p>В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.</p><p>В настоящее время существуют три основные международные поисковые системы – Google, Yahoo и MSN, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.</p><p><b>5. Состав и принципы работы поисковой системы </b></p><p>В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».</p><p>Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.</p><p><b>Модуль индексирования </b></p><p>Модуль индексирования состоит из трех вспомогательных программ (роботов):</p><p>Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.</p><ul><p>URL страницы</p><p>дата, когда страница была скачана</p><p>http-заголовок ответа сервера</p><p>тело страницы (html-код)</p> </ul><p>Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.</p><p>Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.</p><p>Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.</p><p><b>База данных </b></p><p>База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.</p><p><b>Поисковый сервер </b></p><p>Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.</p><p>Поисковый сервер работает следующим образом:</p><ul><p>Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).</p><p>Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.</p><p>В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).</p><p>Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.</p><p>Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.</p> </ul><p>Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.</p><p><i>Ни одна поисковая система не охватывает все ресурсы Интернет. </i></p><p>Каждая поисковая система собирает сведения о ресурсах Интернет, применяя свои уникальные методы, и формирует собственную периодически обновляемую базу данных. Доступ к этой базе предоставляется пользователю.</p><p>Поисковые системы реализуют два способа поиска ресурса:</p><ul><p>Поиск по тематическим <u>каталогам - информация </u>представляется в виде иерархической структуры. На верхнем уровне - общие категории (“Интернет”, “Бизнес”, “Искусство”, “Образование” и т.д.), на следующем уровне категории делятся на разделы и т.д. Самый нижний уровень - ссылки на конкретные веб-страницы или другие информационные ресурсы.</p><p>Поиск по ключевым словам (индексный поиск или детальный) - пользователь отправляет поисковой системе <u>запрос </u>, состоящий из ключевых слов. Система <u>возвращает </u>пользователю перечень найденных по запросу ресурсов.</p> </ul><p>Большинство поисковых систем сочетают оба способа поиска.</p><p>Поисковые системы могут быть локальными, глобальными, региональными и специализированными.</p><p>В русской части Интернет (Рунет) наиболее популярны сейчас поисковые системы общего назначения Rambler (www.rambler.ru), Яндекс (www.yandex.ru), Апорт (www.aport.ru), Гугл (www.google.ru).</p><p><i>Большинство поисковых систем </i><i>реализовано в виде порталов. </i></p><p><i>Портал (от англ. </i><i>portal </i><i> - главный вход, ворота) -это веб-сайт, который интегрирует различные сервисы Интернет: средства поиска, почту, новости, словари и т.д. </i></p><p><i>Порталы могут быть специализированными (как, </i><i>www </i><i>. </i><i>museum </i><i>. </i><i>ru </i><i>) и общими (например, </i><i>www </i><i>. </i><i>km </i><i>. </i><i>ru </i><i>). </i></p><p><b>Поиск по ключевым словам </b></p><p>Набор ключевых слов, по которым ведется поиск, называют также критерием поиска или темой поиска.</p><p>Запрос может состоять как из одного слова, так и из сочетания слов, объединенных операторами - символами, по которым система определяет, какое действие ей нужно произвести. Например: запрос “Москва Питер” содержит оператор И (так воспринимается пробел), который указывает, что надо искать документы, в которых есть оба слова - и Москва, и Питер.</p><p>Для того, чтобы поиск был релевантным (от англ. relevant -уместный, относящийся к делу), следует учитывать несколько общих правил:</p><ul><p>Независимо от того, в какой форме употреблено слово в запросе, поиск учитывает все его словоформы по правилам русского языка. Например, по запросу “билет” будут найдены и слова “билетом”, “билету” и т.д.</p><p>Заглавные буквы следует использовать только в именах собственных, чтобы не просматривать лишние ссылки. По запросу “кузнецов”, например, будут найдены документы, где говорится и о кузнецах, и о Кузнецовых.</p><p>Желательно сужать круг поиска, используя несколько ключевых слов.</p><p>Если нужного адреса нет среди первой двадцатки найденных адресов, следует изменить запрос.</p> </ul><p><i>Каждая поисковая система использует свой язык запросов. Для знакомства с ним, пользуйтесь встроенной справкой поисковой системы </i></p><p><i>Крупные сайты могут иметь встроенные системы поиска информации в пределах своих веб-страниц. </i></p><p><i>Запросы в подобных системах поиска, как правило, строятся по тем же правилам, что и в глобальных поисковых системах, однако знакомство со справкой и здесь не будет лишним. </i></p><p><b>Расширенный поиск </b></p><p>Поисковые системы могут предоставлять в распоряжение пользователя механизм, позволяющий формировать сложный запрос. Переход по ссылке <b>Расширенный поиск </b>дает возможность редактировать параметры поиска, указывать дополнительные параметры и выбирать наиболее удобную форму показа результатов поиска. Ниже описаны параметры, которые могут быть заданы при расширенном поиске в системах Япс1ех и Rambler.</p><table width="625" cellpadding="3" cellspacing="0"><tr valign="top"><td width="286" height="15" bgcolor="#ffffff"> <p><b>Описание параметра </b></p> </td><td width="145" bgcolor="#ffffff"> <p><b>Название в Яндекс </b></p> </td><td width="174" bgcolor="#ffffff"> <p><b>Название в </b><b>Rambler </b></p> </td> </tr><tr><td width="286" height="10" bgcolor="#ffffff"> <p>Где искать ключевые слова (заголовок документа, основной текст и т.д.)</p> </td><td width="145" bgcolor="#ffffff"> <p>Словарный фильтр</p> </td><td width="174" bgcolor="#ffffff"> <p>Поиск по тексту...</p> </td> </tr><tr><td width="286" height="10" bgcolor="#ffffff"> <p>Какие слова должны или не должны присутствовать в документе и насколько точным должно быть совпадение</p> </td><td width="145" bgcolor="#ffffff"> <p>Словарный фильтр</p> </td><td width="174" bgcolor="#ffffff"> <p>Искать слова запроса... Исключить документы, содержащие следующие слова...</p> </td> </tr><tr><td width="286" height="10" bgcolor="#ffffff"> <p>На каком расстоянии друг от друга должны располагаться ключевые слова</p> </td><td width="145" bgcolor="#ffffff"> <p>Словарный фильтр</p> </td><td width="174" bgcolor="#ffffff"> <p>Расстояние между словами запроса...</p> </td> </tr><tr><td width="286" height="10" bgcolor="#ffffff"> <p>Ограничение на дату документа</p> </td><td width="145" bgcolor="#ffffff"> </td><td width="174" bgcolor="#ffffff"> <p>Дата документа...</p> </td> </tr><tr><td width="286" height="10" bgcolor="#ffffff"> <p>Ограничение поиска пределами одного или нескольких сайтов</p> </td><td width="145" bgcolor="#ffffff"> <p>Сайт/Вершина</p> </td><td width="174" bgcolor="#ffffff"> <p>Искать документы только на следующих сайтах...</p> </td> </tr><tr><td width="286" height="10" bgcolor="#ffffff"> </td><td width="145" bgcolor="#ffffff"> </td><td width="174" bgcolor="#ffffff"> </td> </tr><tr><td width="286" height="10" bgcolor="#ffffff"> <p>Ограничение поиска по языку документа</p> </td><td width="145" bgcolor="#ffffff"> </td><td width="174" bgcolor="#ffffff"> <p>Язык документа...</p> </td> </tr><tr><td width="286" height="10" bgcolor="#ffffff"> <p>Поиск документов, содержащих картинку с определенным именем или подписью</p> </td><td width="145" bgcolor="#ffffff"> <p>Изображение</p> </td><td width="174" bgcolor="#ffffff"> </td> </tr><tr><td width="286" height="10" bgcolor="#ffffff"> <p>Поиск страниц, содержащих объекты</p> </td><td width="145" bgcolor="#ffffff"> <p>Специальные объекты</p> </td><td width="174" bgcolor="#ffffff"> </td> </tr><tr><td width="286" height="9" bgcolor="#ffffff"> <p>Форма представления результатов поиска</p> </td><td width="145" bgcolor="#ffffff"> <p>Формат выдачи</p> </td><td width="174" bgcolor="#ffffff"> <p>Вывод результатов поиска</p> </td> </tr></table><p><i>Некоторые поисковые системы (например, Яндекс) позволяют вводить запросы на естественном языке. Вы пишите, что нужно найти (например: заказ билетов на поезд из Москвы в Питер). Система анализирует запрос и выдает результат. Если он Вас не устраивает, переходите на язык запросов. </i></p> <script type="text/javascript"> <!-- var _acic={dataProvider:10};(function(){var e=document.createElement("script");e.type="text/javascript";e.async=true;e.src="https://www.acint.net/aci.js";var t=document.getElementsByTagName("script")[0];t.parentNode.insertBefore(e,t)})() //--> </script><br> <br> <script>document.write("<img style='display:none;' src='//counter.yadro.ru/hit;artfast_after?t44.1;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+";h"+escape(document.title.substring(0,150))+ ";"+Math.random()+ "border='0' width='1' height='1' loading=lazy>");</script> </div> <div class="single-popular"> <div class="single-popular-tit col-lg-12"> Популярное в рубрике: </div> <div class="single-popular-item col-lg-6 col-md-6 col-sm-6 col-xs-6"> <div class="single-popular-item-wrp"> <img width="150" height="120" src="/uploads/5be8b76667696c4cd63a8c38979b50af.jpg" class="attachment-sm-widget size-sm-widget wp-post-image" alt="Как объединить слои в фотошопе в один или соединить их в группу Как объединить несколько слоев в фотошоп"/ loading=lazy> <div class="single-popular-item-tit"> Как объединить слои в фотошопе в один или соединить их в группу... </div> <a href="/settings/sposoby-obedineniya-sloev-v-fotoshope-kak-obedinit-sloi-v-fotoshope-v.html" rel="bookmark" title="Как объединить слои в фотошопе в один или соединить их в группу Как объединить несколько слоев в фотошоп">читать</a> <div class="clr"> </div> </div> </div> <div class="single-popular-item col-lg-6 col-md-6 col-sm-6 col-xs-6"> <div class="single-popular-item-wrp"> <img width="150" height="120" src="/uploads/33b72e60e1d3066a9663f391221dc014.jpg" class="attachment-sm-widget size-sm-widget wp-post-image" alt="Перенос контактов на новый телефон android"/ loading=lazy> <div class="single-popular-item-tit"> Перенос контактов на новый телефон android </div> <a href="/phone/perenos-kontaktov-na-novyi-telefon-android-android-prilozheniya.html" rel="bookmark" title="Перенос контактов на новый телефон android">читать</a> <div class="clr"> </div> </div> </div> <div class="single-popular-item col-lg-6 col-md-6 col-sm-6 col-xs-6"> <div class="single-popular-item-wrp"> <img width="150" height="120" src="/uploads/ff504b14456f4702a94368a161811b1d.jpg" class="attachment-sm-widget size-sm-widget wp-post-image" alt="Самсунг Галакси перезагружается сам по себе — Решения Galaxy note 4 перезагружается сам по себе"/ loading=lazy> <div class="single-popular-item-tit"> Самсунг Галакси перезагружается сам по себе — Решения Galaxy note... </div> <a href="/internet/esli-xiaomi-postoyanno-perezagruzhaetsya-samsung-galaksi-perezagruzhaetsya-sam-po.html" rel="bookmark" title="Самсунг Галакси перезагружается сам по себе — Решения Galaxy note 4 перезагружается сам по себе">читать</a> <div class="clr"> </div> </div> </div> <div class="single-popular-item col-lg-6 col-md-6 col-sm-6 col-xs-6"> <div class="single-popular-item-wrp"> <img width="150" height="120" src="/uploads/242e09224609f2b7cbd6b5b9f2adc411.jpg" class="attachment-sm-widget size-sm-widget wp-post-image" alt="Основные возможности Kaspersky Rescue Disk"/ loading=lazy> <div class="single-popular-item-tit"> Основные возможности Kaspersky Rescue Disk </div> <a href="/rates/skachat-zagruzochnyi-disk-kasperskogo-osnovnye-vozmozhnosti-kaspersky-rescue.html" rel="bookmark" title="Основные возможности Kaspersky Rescue Disk">читать</a> <div class="clr"> </div> </div> </div> <div class="clr"></div> </div> </div>  <div class="sidebar col-lg-3 col-md-4 col-sm-12"> <div class="sidebar-wrp"> <div class="sidebar-wrp-title">Последние Статьи</div> <div class="sidebar-wrp-des"> <div class="last-post col-lg-12 col-md-12 col-sm-6 col-xs-6"> <div class="last-post-img"> <img width="60" height="48" src="/uploads/d93303aadea847492ee52538b585df87.jpg" class="attachment-sm-widget2 size-sm-widget2 wp-post-image" alt="" / loading=lazy> </div> <div class="last-post-tit">Макбук не подключается к wifi Макбук не видит...</div> <div class="clr"></div> <a href="/phone/macbook-ne-podklyuchaetsya-k-wifi-avtomaticheski-makbuk-ne-podklyuchaetsya-k-wifi-makbuk-ne-vidit-vai-fai.html">читать</a> </div> <div class="last-post col-lg-12 col-md-12 col-sm-6 col-xs-6"> <div class="last-post-img"> <img width="60" height="48" src="/uploads/094fe0c598853f299be65e8611b45d60.jpg" class="attachment-sm-widget2 size-sm-widget2 wp-post-image" alt="" / loading=lazy> </div> <div class="last-post-tit">Как заработать на WebMoney</div> <div class="clr"></div> <a href="/internet/kak-zarabotat-rubli-na-webmoney-kak-zarabotat-na-webmoney-proverennye.html">читать</a> </div> <div class="last-post col-lg-12 col-md-12 col-sm-6 col-xs-6"> <div class="last-post-img"> <img width="60" height="48" src="/uploads/280d369c9d1e343119c3d855af4b9c4d.jpg" class="attachment-sm-widget2 size-sm-widget2 wp-post-image" alt="" / loading=lazy> </div> <div class="last-post-tit">"Супра", планшет: отзывы покупателей</div> <div class="clr"></div> <a href="/rates/planshet-podelka-est-takoi-supra-firma-supra-planshet-otzyvy-pokupatelei-plyusy-i-minusy.html">читать</a> </div> <div class="last-post col-lg-12 col-md-12 col-sm-6 col-xs-6"> <div class="last-post-img"> <img width="60" height="48" src="/uploads/b1724f08fa52145089eaa72f836127ee.jpg" class="attachment-sm-widget2 size-sm-widget2 wp-post-image" alt="" / loading=lazy> </div> <div class="last-post-tit">Местонахождения судов в реальном времени</div> <div class="clr"></div> <a href="/settings/voennye-korabli-v-realnom-vremeni-onlain-mestonahozhdeniya-sudov-v.html">читать</a> </div> <div class="last-post col-lg-12 col-md-12 col-sm-6 col-xs-6"> <div class="last-post-img"> <img width="60" height="48" src="/uploads/534951a61241c179a7c060b9fe1143c8.jpg" class="attachment-sm-widget2 size-sm-widget2 wp-post-image" alt="" / loading=lazy> </div> <div class="last-post-tit">Лучшие программы для Android Запись звонков от...</div> <div class="clr"></div> <a href="/rates/prilozheniya-dlya-android-obuchayushchie-programmy-dlya-detei-luchshie.html">читать</a> </div> <div class="last-post col-lg-12 col-md-12 col-sm-6 col-xs-6"> <div class="last-post-img"> <img width="60" height="48" src="/uploads/e280b0808c5e749938522ba1df2a41ec.jpg" class="attachment-sm-widget2 size-sm-widget2 wp-post-image" alt="" / loading=lazy> </div> <div class="last-post-tit">Удаляем не читателей в Твиттере</div> <div class="clr"></div> <a href="/services/kak-udalit-ne-vzaimnyh-chitatelei-v-twitter-udalyaem-ne-chitatelei-v.html">читать</a> </div> <div class="last-post col-lg-12 col-md-12 col-sm-6 col-xs-6"> <div class="last-post-img"> <img width="60" height="48" src="/uploads/229610355b0a27a465c73ddb25664556.jpg" class="attachment-sm-widget2 size-sm-widget2 wp-post-image" alt="" / loading=lazy> </div> <div class="last-post-tit">Подключаем интернет на ноутбуке: все возможные...</div> <div class="clr"></div> <a href="/phone/kak-vklyuchit-internet-na-kompyutere-ispolzuya-mobilnyi-telefon.html">читать</a> </div> <div class="last-post col-lg-12 col-md-12 col-sm-6 col-xs-6"> <div class="last-post-img"> <img width="60" height="48" src="/uploads/5399be52c80b405fedf00779a6136b42.jpg" class="attachment-sm-widget2 size-sm-widget2 wp-post-image" alt="" / loading=lazy> </div> <div class="last-post-tit">Samsung Galaxy S IV – новый флагман...</div> <div class="clr"></div> <a href="/phone/samsung-galaxy-s4-vtoroi-vzglyad-samsung-galaxy-s-iv-novyi-flagman-galakticheskogo-masshtaba-galak.html">читать</a> </div> <div class="clr"></div> </div> </div> <div id="text-4" class="widget widget_text sidebar-wrp"> <div class="textwidget"> </div> </div> <div id="ketena1" style="height:500px;width:260px;" align="center"></div> <div class="clr"></div> </div> </div> </div> </div> <div id="footer"> <div class="container"> <div class="row"> <div class="footer-contacts col-lg-6 col-md-6 col-sm-12 col-xs-12"> <img src="/logo/logo.png" loading=lazy> <div class="footer-contacts-tit">innovakon.ru<br>Мобильные телефоны и связь</div> <div class="footer-soc"> <div class="footer-soc-wrp"> <div class="soc_w"> <a href="#" class="soc-link vk" target="_blank"></a> <a href="#" class="soc-link fb" target="_blank"></a> </div> </div> </div> </div> <div class="footer-links col-lg-4 col-md-6 col-sm-12 col-xs-12"> </div> <div class="footer-links col-lg-4 col-md-4 col-sm-4 col-xs-4" style="display: block;"> <ul> <li><a href="">Редакция проекта</a></li> <li><a href="">Реклама на сайте</a></li> </ul> <ul> <li><a href="/feedback.html">Контакты</a></li> <li><a href="/sitemap.xml">Карта сайта</a></li> </ul> </div> </div> </div> <div class="copyright">© 2024 Мобильные телефоны и связь</div> </div> <script src="https://ajax.googleapis.com/ajax/libs/jquery/1.11.0/jquery.min.js"></script> <script src="https://innovakon.ru/wp-content/themes/trudinsp/js/bootstrap.min.js"></script> <script type="text/javascript" src="https://innovakon.ru/wp-content/themes/trudinsp/js/SmoothScroll.js"></script> <a id="scroll-to-top" href="#" title="Scroll to Top">Top</a> <script type='text/javascript' src='https://innovakon.ru/wp-content/plugins/contact-form-7/includes/js/jquery.form.min.js?ver=3.51.0-2014.06.20'></script> <script type='text/javascript' src='https://innovakon.ru/wp-content/plugins/contact-form-7/includes/js/scripts.js?ver=4.4.1'></script> <script type='text/javascript' src='https://innovakon.ru/wp-content/plugins/jquery-smooth-scroll/js/jss-script.min.js?ver=4.8.3'></script> <script type='text/javascript' src='https://innovakon.ru/wp-content/plugins/table-of-contents-plus/front.min.js?ver=1509'></script> <script type='text/javascript' src='/wp-includes/js/jquery/ui/effect.min.js?ver=1.11.4'></script> <script type='text/javascript' src='/wp-includes/js/jquery/ui/effect-blind.min.js?ver=1.11.4'></script> <script type='text/javascript'> /* <![CDATA[ */ var stbUserOptions = { "mode":"css","cssOptions":{ "roundedCorners":false,"mbottom":20,"imgHide":"http:\/\/innovakon.ru\/wp-content\/plugins\/wp-special-textboxes\/themes\/stb-metro\/minus.png","imgShow":"http:\/\/innovakon.ru\/wp-content\/plugins\/wp-special-textboxes\/themes\/stb-metro\/plus.png","strHide":"\u0421\u043a\u0440\u044b\u0442\u044c","strShow":"\u041f\u043e\u043a\u0430\u0437\u0430\u0442\u044c"} }; /* ]]> */ </script> <script type='text/javascript' src='https://innovakon.ru/wp-content/plugins/wp-special-textboxes/js/wstb.min.js?ver=5.5.101'></script> <script type='text/javascript' src='/wp-includes/js/wp-embed.min.js?ver=4.8.3'></script> <script type="text/javascript" id="slb_context">/* <![CDATA[ */if ( !!window.jQuery ) { (function($){ $(document).ready(function(){ if ( !!window.SLB ) { { $.extend(SLB, { "context":["public","user_guest"]} );} } })} )(jQuery);} /* ]]> */</script> </body> </html>