Классической задачей ИС, с которой началось развитие этой области, является поиск документов, удовлетворяющих запросу, в статичной коллекции документов. Однако список задач ИС постоянно расширяется и теперь включает и другие области:
Учебник. Базовый курс
Интернет — это огромная сокровищница разнообразной информации по широкому кругу вопросов.
Для удобства поиска этого хранилища в Интернете существуют специальные сервисы — поисковые системы. Если вы научитесь правильно их использовать, то сможете легко найти ответы практически на любой вопрос. Среди поисковых систем выделяются www.google.ru и русская www.yandex.ru.
Поисковая система собирает информацию со всех сайтов в Интернете, сохраняет адреса сайтов в своем хранилище и предоставляет вам ссылки на наиболее релевантные страницы в ответ на ваш запрос.
Хотя базовая структура всех поисковых систем в основном одинакова, правила могут несколько отличаться. Поэтому если вы не нашли ответ в одной поисковой системе, попробуйте другую.
Начните поиск:
- Зайти на поисковый сайт.
- В строке поиска вписать запрос.
- Нажать кнопку «Найти».
Строка поиска обычно находится в середине экрана. Над или под ним находятся дополнительные разделы, позволяющие сузить поиск, выбрав соответствующие темы: карты, новости, словари. Кроме того, страница поиска может содержать отдельные ссылки на новости, информацию о дорожном движении, погоде и телепрограммы.
Введите искомое слово в поле поиска. Например: «Погода в Сочи» 5.1. Компьютер также отображает всплывающую подсказку при вводе запроса. Это вопросы, которые часто задают другие пользователи. Если одно из этих предложений соответствует тому, что вы ищете, вы можете сразу же выбрать его.
5.1
Большинство адресов сайтов пишутся латиницей, а поисковый запрос — кириллицей. Если вы ввели текст в строке поиска латинскими буквами или допустили ошибку, не волнуйтесь, поисковая система Яндекс понимает ваш запрос, предлагает слово, исправляет ошибки и переводит его с латиницы на кириллицу.
Как правильно сделать поисковый запрос
Поисковая система — это программа. Он автоматически отвечает на ваш запрос, поэтому вам нужно знать о нем немного.
Чем проще, тем лучше. Если вы хотите узнать, как ухаживать за щенком таксы, наберите в поисковой строке «уход за щенком таксы».
Будьте более конкретными. Например, введите «рецепт киша» вместо «я хочу приготовить киш». В первом случае вы получите рецепты в результатах поиска. Во втором случае другие пользователи расскажут вам, как они хотят приготовить киш, что им не всегда удается сделать.
Описание результатов поиска
В ответ на ваш запрос поисковая система выводит список сайтов, на которых может содержаться искомая информация. Список может быть длинным и включать десятки, а иногда и сотни страниц — все зависит от запроса.
Каждая страница будет иметь заголовок, краткую выдержку из текста страницы и ссылку на саму страницу.
5.2
Если какой-либо из перечисленных результатов покажется вам интересным, нажмите на его название, чтобы открыть всю страницу в отдельном окне.
Для некоторых запросов
Когда вы задаете конкретный вопрос в системе, вы получаете ссылки на различные типы материалов. Например, если вы наберете в поисковой строке Яндекса «Анна Каренина», вы найдете ссылки на статью Открытой энциклопедии и полный текст проекта, а также картинки по теме и даже ссылку на видео, которое можно сразу же посмотреть. 5.5.
5.5
Полнотекстовый поиск — поиск по всему содержимому документа. Примером полнотекстового поиска является любая поисковая система Интернета, например, www.yandex.ru, www.google.com. При полнотекстовом поиске обычно используются готовые индексы для ускорения поиска. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы.
Виды поиска
Поиск по метаданным — это поиск на основе атрибута документа, который поддерживается системой — название документа, дата создания, размер, автор и т.д. Примером поиска на основе атрибутов является диалог поиска в файловой системе (например, MS Windows).
Поиск изображений — поиск содержимого изображений. Система поиска идентифицирует содержимое изображений (которые пользователь загрузил или добавил URL-адрес изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы: Polarrose, Picollator и др.
Процесс поиска документов на основе чисто формальных признаков, определенных в запросе. Для его выполнения необходимы следующие условия:
Методы поиска
Адресный поиск
1. 1. точный адрес документа.
Адреса документов могут быть адресами веб-серверов и веб-страниц, библиографическими данными, а также адресами хранилищ документов в репозитории.
Процесс поиска документов на основе их содержания.
Семантический поиск
Фундаментальное различие между адресным и семантическим поиском заключается в том, что адресный поиск рассматривает документ как объект с точки зрения формы, в то время как семантический поиск рассматривает документ с точки зрения содержания.
Семантический поиск идентифицирует множество документов без адресов.
В этом заключается фундаментальное различие между каталогами и карточными каталогами.
Библиотека — это собрание библиографических записей без адресов.
Процесс поиска в репозитории информационно-поисковой системы первичных документов или базы данных вторичных документов, соответствующих запросу пользователя.
Документальный поиск
Два типа поиска документов:
1. библиотечный, направленный на поиск первичных документов. 2. библиографический, для поиска информации о документах, которые находятся в форме библиографических записей.
Процесс поиска фактов, соответствующих запросу, называется «поиск».
Фактографический поиск
ИС занимается поиском информации в документах, извлечением документов, извлечением метаданных из документов, извлечением текста, изображений, видео и аудио в локальных реляционных базах данных, гипертекстовых базах данных, таких как Интернет и локальные интранет-системы.
Термины «поиск данных», «поиск документов», «поиск информации» и «поиск текста» не совсем понятны. Однако каждая из этих областей исследований имеет свою собственную методологию, практику и литературу.
В настоящее время вычислительная техника является растущей научной областью, популярность которой обусловлена экспоненциальным ростом количества информации, особенно в Интернете. Существует обширная литература и множество конференций по ИС. Одним из наиболее известных является TREC, организованный в 1992 году Министерством обороны США в сотрудничестве с Национальным институтом стандартов и технологий (NIST) с целью объединения исследовательского сообщества и разработки методов оценки качества ИС.
Наука информационного поиска