Дополнительные материалы по развитию речи - Учебно-методическое пособие (И.И. Теплова)

Поисковые системы

Поисковые системы (их называют также поисковыми машинами) – это полностью автоматизированные интерактивные службы поиска информации в Интернете по введенному пользователем текстовому запросу.

Создав и разместив в Интернете веб-сайт, разработчик регистрирует его адрес в поисковой системе, то есть вносит URL стартовой странички в соответствующее поле на поисковом сервере. Затем специальная программа поисковой системы, называемая роботом, или спайдером (от англ. spider – паук), просматривает данный документ, проходит по всем обнаруженным на нем гиперссылкам и вносит информацию об обнаруженных страницах в базу данных поисковой системы, которая носит название индекса. Этот процесс называется индексацией веб-страниц. Как правило, индекс поискового сервера содержит только адреса веб-страниц и краткую аннотацию (70 – 150 символов), поясняющую их содержимое и почерпнутую из текста самих индексируемых документов. Спустя некоторое время робот автоматически проводит переиндексацию, в ходе которой удаляет из базы данных устаревшие и более недействительные ссылки.

Пользователь, обращаясь к поисковой машине, просто вводит в поле текстового запроса ключевые слова, характеризующие предмет его интересов. После того как он нажмет кнопку «Искать», поисковый сервер передает управление другой программе, которая называется поисковым механизмом. Эта программа сравнивает введенные ключевые слова с содержимым индекса, выявляя возможные соответствия. Например, получив запрос «идти», поисковый механизм может расширить диапазон поиска, включив в список ключевых слов глаголы «пойти», «шел», «шла», «пойдет» и т.д. Ссылки, в описании которых обнаруживаются подобные совпадения, автоматически включаются поисковым механизмом в файл отчета, предоставляемый пользователю в виде списка гиперссылок на найденные ресурсы с краткими текстовыми аннотациями для каждой из них. Степень соответствия обнаруженных таким образом ссылок исходному запросу называется релевантностью поиска.

Интерфейс большинства поисковых машин интуитивно понятен даже неподготовленному пользователю. Однако качество работы большинства поисковых систем не идеально, и релевантность предоставляемых ими отчетов часто оставляет желать лучшего. Поисковый механизм – не живой человек и какие бы совершенные эвристические методы анализа информации он не использовал, понимание многозначности некоторых слов и свойственное нам интуитивное восприятие разговорной речи ему недоступно. Поэтому в ответ на запрос «закон» вы можете получить и полный текст Гражданского кодекса РФ, и формулировку закона всемирного тяготения, и русскую народную пословицу о законе и дышле.