Какие существуют поисковые системы

2015-03-24 12:57:09 2125

Современные поисковые системы — это сложные обучаемые роботы, содержащие огромную базу знаний, которые способны за доли секунды найти точные ответы на самые разные запросы пользователей. Google, например, ежедневно обрабатывает свыше 3 миллиардов запросов, или не менее 1 триллиона запросов в год. Но таким поиск был не всегда. Первые поисковые системы хотя и решали аналогичную задачу — поиск в интернете — но были мало чем похожи на современные. Так кто же был первопроходцем, и как развивался поиск?

Немного истории

Принято считать, что создание поисковых систем началось в 1990-х годах. С этим можно поспорить. Еще в 1945 году инженер из США Vannevar Bush (Вэнúвар Буш) опубликовал исследование на тему «Как мы можем мыслить». В нем формулировалась идея гипертекста. Он же семью годами ранее запатентовал устройство, способное быстро находить сведения на микрофильмах. Это был прототип современных поисковиков.

В Корнельском университете в 1960-х годах под руководством Джерарда Сэлтона была создана SMART (Salton’s Magic Automatic Retriever of Text) — система, способная работать с информацией. В дословном переводе название звучит очень претенциозно — «Волшебный автоматический обработчик текста Сэлтона». А, может быть, и не очень, потому что современные поисковые алгоритмы основываются на принципах SMART.

Первый в современном понимании поисковик Archie был разработан в 1990 году студентом Университета имени Мак Гилла (Монреаль, Канада) Аланом Эмтэйджем. Программа не индексировала файлы из публичных FTP-серверов, но собирала их в общую базу данных. Сейчас Archie безнадежно устарел и уже не используется.

После Archie были:

  • Gopher (1991) — сетевой протокол поиска документов. Выполнял индексацию текстов. Вытеснен HTTP.
  • Veronica — искала файлы по ключевому слову в названии. Была не самостоятельной программой, так как работала с архивом Gopher.
  • Jughead — аналог предыдущей системы, но с добавлением логических элементов поиска.
  • World Wide Web Wanderer (1993) — первый робот, индексирующий веб-страницы. Его база сайтов называлась Wandex.
  • ALIWEB (Archie Like Indexing for the WEB) (1993) — первая система, созданная специально для поиска файлов. Нередко таковой считают появившуюся на несколько месяцев позже WebCrawler (1994).

В 1993-1994 годах крупные бизнесмены поняли, что интернет сулит хорошие перспективы в плане получения прибыли. С тех пор в создание поисковых систем стали вкладываться большие деньги.

Языковый вопрос или нюансы популярности

Популярность поисковой системы зависит от лингвистических особенностей региона. Так, например, если брать мир в целом, то, по данным NetMarketShare за май 2014 года, квартет лидеров выглядел следующим образом:

На русскоязычных просторах несколько иная картина поискового рынка (LiveInternet, май 2014 г.):

В Азии популярны другие сервисы. В Китае Baidu.com настолько оторвался от конкурентов (по разным сведениям, его доля рынка составляет от 65% до 80%), что на эту систему ориентируются все SEO-фирмы страны. So.com интересен тем, что, стартовав в 2012 году, всего за пару с лишним лет успел захватить 17%. Фирму обвиняют в не слишком честной игре, но кто на это обращает внимание. Sogou.com (10%) быстро вышел на третье место благодаря продуктам Sohu, среди которых «умная» программа ввода иероглифов. Правда, его покупает фирма Qihoo, которая владеет So.com. На четвертом месте Soso.com (3,5%), работавший до 2009 года по технологии Google.

Подобное можно сказать и о других странах региона. Две трети южнокорейцев предпочитают Naver собственного производства. В Японии чаще всего грузят Yahoo! Japan и так далее.

Первая шеренга

Статья о поисковых системах будет неполной, если не сказать хотя бы пару слов о лидерах.

  1. Google. Домен зарегистрирован 15.09.1997 года. Индексирует свыше 25 млрд страниц. Начиная с 2005 года, сталкивается с проблемами в области защиты прав человека из-за претензий по картографии, получения персональных данных, сканирования Wi-Fi и применения «очков Google».
  2. Яндекс. Анонсирована 23.09.1997 года. С 2000 года выделилась из CompTek International в отдельную компанию. Во время первичного размещения акций было заработано больше средств, чем любой другой интернет-фирмой. Поиск отличается высокой степенью релевантности.
  3. Baidu. Год основания — 2000. Имеет собственную онлайн-энциклопедию. А еще — жесткую проправительственную цензуру. Сайты, расположенные на иностранных серверах, индексирует на порядок хуже, чем на китайских.
  4. Bing. Работает под разными названиями с 1998 года. Разработана специалистами Microsoft. Результаты поиска выдаются на одной странице, для каждого найденного сайта можно скорректировать объем отображаемой информации.
  5. Yahoo! Создана в 1995 году. Ее электронная почта Yahoo! Mail одна из самых распространенных в мире. Надежды на будущее связаны с усовершенствованием Yahoo!Next. С помощью этого поисковика правительство Китая определяет место жительства диссидентов.
  6. AOL. Поисковая система медийной корпорации из США AOL inc. Владеет самым большим каталогом ссылок на веб-ресурсы Open Directory Project, а также работающей в сфере IT-индустрии корпорацией Netscape.

Оптимизация и продвижение сайта имеет свои особенности в зависимости от поисковой системы, так как у каждого поисковика есть свои уникальные технологии и алгоритмы поиска.

Дальнейшее развитие поисковых систем предполагает их совершенствование и развитие в сфере мобильного поиска, еще большей персонализации выдачи и повышения качества, правдивости и уникальности контента.