DEFAULT 

Информационно поисковые системы интернет реферат

Инна 3 comments

WS один из символов - пробел или табуляция NL один из символов - конец строки , возврат каретки или оба этих символа Enter User-Agent: ключевое слово заглавные и прописные буквы роли не играют. Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа. Сайт Портал Страница Служба Кольцо. Первым таким проектом стал сайт Yahoo, открывшийся в апреле года. Скачать Скачать документ Информация о работе Информация о работе. Посмотреть все рефераты. При этом ресурсы представляющие реальную пользу оказываются "за бортом" поиска.

Формирование цены на основе частот запросов на примере поисковой системы Рамблер. Основные поисковые системы на российском рынке, перспективы их развития. Понятие информационно-поисковых систем. История возникновения сети Internet. Основные алгоритмы работы современных словарных информационно-поисковых систем.

Быстрый поиск в базе данных и быстрое реагирование системы. Ранжирование результатов поиска. Понятие и классификация поисковых систем, история их развития и структурные элементы.

Характеристика существующих моделей поиска, анализ его качества. Особенности обработки запроса поисковой системой, подготовки базы данных и процесса выдачи результатов.

Поисковые системы. Оскар Нирштрасс Oscar Nierstrasz в Женевском университете написал ряд сценариев на Perlкоторые периодически копировали эти страницы и переписывали их в стандартный формат. Это стало информационно поисковые системы интернет реферат для W3Catalogпервой примитивной поисковой системы сети, запущенной 2 сентября года [5].

Цель робота Wanderer состояла в том, чтобы измерить размер всемирной паутины и найти все веб-страницы, содержащие слова из запроса. Aliweb не использовала поискового роботано вместо этого ожидала уведомлений от администраторов веб-сайтов о наличии на их сайтах индексного файла в определённом формате. JumpStation [en][6] созданный в декабре года Джонатаном Флетчером, искал веб-страницы и строил их информационно поисковые системы интернет реферат с помощью поискового робота, и использовал веб-форму в качестве интерфейса для формулирования поисковых запросов.

Информационно поисковые системы интернет реферат 6312

Это был первый инструмент поиска в Интернете, который сочетал три важнейших функции поисковой системы проверка, индексация и собственно поиск. Из-за ограниченности ресурсов компьютеров того времени индексация и, следовательно, поиск были ограничены только названиями и заголовками веб-страниц, найденных поисковым роботом.

Информационно поисковые системы интернет реферат 1858112

Кроме того, это был первый поисковик, получивший широкое распространение. Но поисковые возможности каталогов ограничивались поиском по самим каталогам, а не по текстам веб-страниц.

Позже каталоги объединялись или снабжались поисковыми роботами с целью улучшения поиска. В году компания Netscape хотела заключить эксклюзивную сделку с одной из поисковых систем, сделав её поисковой системой по умолчанию на веб- браузере Netscape.

Поисковая система

Это вызвало настолько большой интерес, что Netscape заключила контракт сразу с пятью крупнейшими поисковыми системами Yahoo! Несколько компаний эффектно вышли на рынок, получив рекордную прибыль во время их информационно поисковые системы интернет реферат публичного предложения. Некоторые отказались от рынка общедоступных поисковых движков и стали работать только с корпоративным сектором, например, Northern Light [en].

Google взял на вооружение идею продажи ключевых слов в году, тогда это была маленькая компания, обеспечивавшая работу поисковой системы по адресу goto.

Эссе в чем заключается ценность жизни59 %
Контрольные работы по математике за 2 четверть53 %
Реферат модульная технология обучения91 %
Роль рекламы в продвижении товара дипломная работа96 %
Реферат вредные привычки и их профилактика курение71 %

Этот шаг ознаменовал для поисковых систем переход от соревнований друг с другом к одному из самых выгодных коммерческих предприятий в Интернете [10]. Поисковые системы стали продавать первые места в результатах поиска отдельным компаниям.

Поисковая система Google занимает видное положение с начала х [11]. Компания добилась высокого положения благодаря хорошим результатам поиска с помощью алгоритма PageRank. Интерфейс Google выдержан в спартанском стиле, где нет ничего лишнего, в отличие от многих своих конкурентов, которые встраивали поисковую систему в веб-портал.

Поисковая система Google стала настолько популярной, что появились подражающие ей системы, например, Mystery Seeker [en] тайный поисковик.

К году Yahoo!

Информационно поисковые системы интернет реферат 4955

Затем Yahoo! Совсем скоро в начале года сайт начал отображать выдачу Looksmart [en]смешанную с результатами Inktomi. После проведения ребрендинга компанией Microsoft 1 июня года была запущена поисковая система Bing. Search [en] работал на основе технологии Microsoft Bing. На момент года союз Bing и Yahoo! В году был реализован поиск с учётом русской морфологии на поисковой машине Altavista и запущены оригинальные российские поисковые машины Рамблер и Апорт.

Дети специально для детей с повышенной безопасностью. Большую популярность получили методы кластерного анализа и поиска по метаданным. В году информационно поисковые системы интернет реферат российская метамашина Quinturaпредлагающая визуальную кластеризацию в виде облака тегов. Основные составляющие поисковой системы: поисковый роботиндексаторпоисковик [14].

[TRANSLIT]

Как правило, системы работают поэтапно. Контакты Ответы на вопросы FAQ. Скачать реферат бесплатно. Наиболее популярные русскоязычные справочно-поисковые системы в интернет. Поисковые системы в сети Интернет. Поисковая система AltaVista же стремилась стать универсальным порталом, включавшим онлайновый магазин, радиостанцию, форумы, чаты, персональные фотоальбомы и прочее. Но, из-за громадных денежных вливаний, из-за конкуренции с другими гигантскими порталами и опубликованной критики со стороны тех же конкурентов, год проходит для компании под девизом отказа от претензий на статус портала и "возвращения к истокам.

Компания повернула свою деятельность в другое русло.

Этот шаг ознаменовал для поисковых систем переход от соревнований друг с другом к одному из самых выгодных коммерческих предприятий в Интернете [10]. Во-первых, операция поиска приводит к большей загрузке сервера, чем даже простой запрос документа, поэтому обычному пользователю могут быть причинены значительные неудобства при работе на нескольких серверах с большими издержками, чем обычно.

Теперь www. Основным же источником финансирования потребительской версии информационно поисковые системы интернет реферат системы AltaVista стали доходы от рекламы, получаемые, в том числе и от наиболее популярных. Например, сейчас реальные результаты поиска помещаются после ссылки, за размещение которой, компании AltaVista платит владелец соответствующего ресурса.

Одновременно, с попытками стать порталом, AltaVista продолжала совершенствовать свои информационно поисковые системы интернет реферат технологии. Также еще одним источником прибыли AltaVista является разработка корпоративных поисковых систем внутреннего пользования.

Несмотря на явное отставание от конкурентов, www. Надеемся, что компания Альта виста выполнит все намеченное и с успехом "вернется к своим корням. Поисковая система AltaVista www. Ее история - классический пример сочетания хорошей технологии с невнятным позиционированием. Как работают механизмы поиска Средства поиска и структурирования, иногда называемые поисковыми механизмами, используются для того, чтобы помочь людям найти информацию, в которой они нуждаются.

Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных.

Поисковые системы Интернета

Каждый поисковый механизм имеет собственный набор правил, определяющих, как находить и обрабатывать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют cсылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать прежде всего наиболее популярные страницы.

Агенты - самые "интеллектуальные" из поисковых средств. Они могут делать больше, чем просто искать: они могут выполнять даже транзакции от Вашего имени. Уже сейчас они могут искать cайты специфической тематики и возвращать списки cайтов, отсортированных по их посещаемости.

Агенты могут обрабатывать содержание документов, находить и индексировать другие виды ресурсов, не только страницы. Они могут также быть запрограммированы для извлечения информации из уже существующих баз данных. Независимо от информации, которую агенты индексируют, они передают ее обратно базе данных поискового механизма.

Общий поиск информации в Сети осуществляют программы, известные как пауки. Пауки сообщают о содержании найденного документа, индексируют его и извлекают итоговую информацию. Также они информационно поисковые системы интернет реферат заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма.

Кроулеры просматривают заголовки и возвращают только первую ссылку. Администраторы поисковых систем могут определить, какие сайты или типы сайтов агенты информационно поисковые системы интернет реферат посетить и проиндексировать. Проиндексированная информация отсылается базе данных поискового механизма так же, как было описано выше.

Однако, ожидается, что cредства зазеркаливания в будущем будут развиваться должным образом. Причина этого очень проста - даже современные каталоги, содержащие огромное количество ресурсов, представляют информацию лишь об очень малой части сети Интернет. Текст доступен по лицензии Creative Commons Attribution-ShareAlike ; в отдельных случаях могут действовать дополнительные условия.

Люди могут помещать информацию прямо в индекс, заполняя особую форму для того раздела, в который они хотели бы поместить свою информацию. Эти данные передаются базе данных.

  • Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос [1].
  • Описание и сравнение сервисов поисковых систем, предоставляемых пользователям.
  • Сравнительный анализ интерфейсов.
  • Обновление документов 3.
  • Vivisimo [en].
  • Характеристика существующих моделей поиска, анализ его качества.
  • В идеальном случае, документы, наиболее релевантные пользовательскому запросу будут помещены первыми в списке.

Когда кто-либо хочет найти информацию, доступную в Интернет, он посещает страницу поисковой системы и информационно поисковые системы интернет реферат форму, детализирующую информацию, которая ему необходима.

Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии в форме поиска должны соответствовать критериям, используемым агентами при индексации информации, которую они нашли при перемещении по Сети. База данных отыскивает предмет запроса, основанный на информации, указанной в заполненной форме, и выводит соответствующие документы, подготовленные базой данных.

Чтобы определить порядок, в котором список документов будет показан, база данных применяет алгоритм ранжирования. В идеальном случае, документы, наиболее релевантные пользовательскому запросу будут помещены первыми в списке.

Различные поисковые системы используют различные алгоритмы ранжирования, однако основные принципы определения релевантности следующие: Количество слов запроса в текстовом содержимом документа то есть в html-коде.

Тэги, в которых эти слова располагаются.

Лекция "Принципы работы поисковых систем"

Местоположение искомых слов в документе. Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа. Эти принципы применяются всеми поисковыми системами. А представленные ниже используются некоторыми, но достаточно известными вроде AltaVista, HotBot. Время - как долго страница находится в базе поискового сервера. Поначалу кажется, что это довольно бессмысленный принцип.

Но, если задуматься, как много существует в Интернете сайтов, которые живут максимум месяц! Если же сайт существует довольно долго, это означает, что владелец весьма опытен в данной теме и пользователю больше подойдет сайт, который пару лет вещает миру о правилах поведения за столом, чем тот, который появился неделю назад с этой же темой.

Индекс цитируемости - как много ссылок на данную страницу ведет с других страниц, зарегистрированных в базе поисковика.

База данных выводит ранжированный подобным образом список документов с HTML и возвращает его человеку, сделавшему запрос. Различные поисковые механизмы также выбирают различные способы показа полученного списка - некоторые показывают только ссылки; другие выводят cсылки c первыми несколькими предложениями, содержащимися в документе или заголовок документа вместе с ccылкой.

Когда Вы щелкаете на ссылке к одному из документов, который вас интересует, этот документ запрашивается у того сервера, на котором он находится.

Как и большинство систем, Lycos дает возможность применять простой запрос и более изощренный метод поиска. В простом запросе в качестве поискового критерия вводится предложение на естественном языке, после чего Lycos производит нормализацию запроса, удаляя из него так называемые stop-слова, и только после этого приступает к его выполнению. Почти сразу выдается информация о количестве документов на каждое слово, а позже и список ссылок на формально релевантные документы.

В списке против каждого документа указывается его мера близости запросу, количество слов из запроса, попавших в документ, и оценочная мера близости, болезнь века спид реферат может быть больше или меньше формально вычисленной. Пока нельзя вводить логические операторы в строке вместе с терминами, но использовать логику через систему меню Lycos позволяет.

Такая возможность применяется для построения расширенной формы запроса, предназначенной для искушенных пользователей, уже научившихся работать с этим механизмом. Таким образом, видно, что Lycos относится к системе с языком запросов типа "Like this", но намечается его расширение и на другие способы организации поисковых предписаний. Индексирование в этой системе осуществляется при помощи робота.

Здесь стоит сразу оговориться, что, в отличие от многих других систем AltaVista поддерживает одноместный оператор NOT. Кроме этого, имеется еще и оператор NEAR, который реализует возможность контекстного поиска, когда термины должны располагаться рядом в тексте документа.

AltaVista разрешает поиск по ключевым фразам, при этом она имеет довольно большой фразеологический словарь. Кроме всего прочего, при поиске в AltaVista можно задать имя поля, где должно встретиться слово: гипертекстовая ссылка, applet, название образа, заголовок информационно поисковые системы интернет реферат ряд других полей. К сожалению, подробно процедура ранжирования в документации по системе не описана, но видно, информационно поисковые системы интернет реферат ранжирование применяется как при простом поиске, так и при расширенном запросе.

Реально эту систему можно отнести к системе с расширенным булевым поиском. Данная система появилась в Сети одной из первых, и сегодня Yahoo сотрудничает со многими производителями средств информационного поиска, а на различных ее серверах используется различное программное обеспечение.

При выдаче не указывается степень соответствия документа запросу, а только подчеркиваются слова из запроса, которые встретились в документе. При этом не производится нормализация лексики и не проводится анализ на "общие" слова. Хорошие результаты поиска получаются только тогда, когда пользователь знает, что в базе данных Yahoo информация есть наверняка. Ранжирование производится по числу терминов запроса в документе. Yahoo относится к классу простых традиционных систем с ограниченными возможностями поиска.

Информационная система OpenText представляет собой самый коммерциализированный информационный продукт в Сети. Все описания больше похожи на рекламу, чем на информативное руководство по работе. Система позволяет провести поиск с использованием логических коннекторов, однако размер запроса ограничен тремя терминами или фразами.

В данном случае речь идет о расширенном поиске. При выдаче результатов сообщается степень соответствия документа запросу и размер документа. Система позволяет также улучшить результаты поиска в стиле традиционного булевого поиска.