|
Около месяца назад работает бета-версия новой поисковой системы - Teoma. Разработка проекта началась три года назад в Ратгерском университета под руководством профессоров Апостолоса Герасулиса (теперь он исполняет обязанности технического директора компании) и Тао Яня (он является главным учёным и вице-президентом Teoma). Компания уверена, что созданная ими технология совершеннее той, что использует Google. Teoma представляет собой поисковую систему основанную на использовании так называемых "пауков" - специальных программных роботов, сканирующих Интернет в поисках информации, которая затем заносится в базу данных. К настоящему моменту в базу попало уже порядка 100 миллионов страниц. Это, конечно, меньше, чем у "ветеранов" (Google знает о существовании 1,35 миллиардов страниц), однако со временем Teoma рассчитывает наверстать упущенное. Размер базы не поможет, если не уметь отличать хорошие ссылки от плохих. Google делает это при помощи технологии "Page Rank", согласно которой наиболее ценными страницами считаются те, на которые в Интернете есть много ссылок. Teoma применяет сходный, но немного другой подход, который, по её мнению, даёт гораздо лучшие результаты. Во время обработки запроса, Teoma просматривает всю базу данных в поиске страниц, которые могут заинтересовать пользователя (при этом учитывается не только текст запроса, но и некоторые другие фразы). Множество найденных ссылок образует так называемое "сообщество" (community). На следующем этапе Teoma начинает анализировать связи между различными страницами "сообщества" и таким образом определяет самые популярные из них. Кроме этого, новый поисковик предлагает ещё несколько инструментов, призванных упростить поиск. Во-первых, помимо собственно результатов поиска, Teoma выводит столбец "Экспертных ссылок", которые ведут к интернет-каталогам, в которых, по мнению поисковика, может найтись что-нибудь подходящее. Кроме того, поисковая система пытается как-то классифицировать найденное, разделив их по темам. Выбрав только одну тему, можно отсечь заведомо неинтересные ссылки (например, при запросе Bush, после выбора темы Vannevar Bush, останутся ссылки только на сайты, имеющие отношение к этому учёному). В настоящее время Teoma ведёт переговоры с некоторыми крупными порталами, рассчитывая найти покупателя на свои услуги. Однако, даже если успеха в этом ей достичь не удастся, она намерена продолжать работу, превратив teoma.com из демонстрационной витрины для новой технологии в самостоятельную поисковую систему. Источник: Журнал "Компьютерра" |
