Научные семинары Яндекс по информационному поиску
Семантический анализ текстов с использованием Википедии
Максим Гринев - доцент, старший преподаватель кафедры системного программирования, заведующий отделом ИСП РАН.
Тезисы:
Система Текстерра, разрабатываемая в Институте системного программирования РАН, автоматизирует анализ текстовых документов на естественном языке и позволяет решать следующие основные задачи: выделение ключевых слов и построение онтологий, классификация документов, а также семантический поиск и навигация в текстовых документах. Доклад посвящен обзору методов, лежащих в основе технологии Текстерра. Во время доклада будет продемонстрирован поисковик по блогам, построенный с использованием этой технологии.
Я.ру: Семинар из цикла «Информационный поиск и анализ данных»
Скачать презентацию (pdf), видеоверсию (avi) семинара. Смотреть в Клубе
Онтологический парсинг словарной информации
Виктор Бочаров - СПбГУ, факультет филологии и искусств, ассистент кафедры информационных систем в искусстве и гуманитарных науках.
Тезисы:
Доклад посвящён автоматическому пополнению онтологии на основе машиночитаемой версии «Российского энциклопедического словаря» и раздела «Википедии» на русском языке.
В основе данной работы лежит гипотеза: в большинстве случаев, родовой по отношению к определяемому термин представлен опорным словом - первым по порядку существительным (именной группой) в именительном падеже. Предварительные исследования показали, что в целом структура словарных статей отвечает заявленной гипотезе, однако использование ее напрямую во многих случаях приводит к не вполне корректным результатам.
Для улучшения результатов были сделаны дополнения по сравнению с базовой гипотезой:
-
выделение именных групп из текста словарных определений («химический элемент», «единица измерения»);
-
логико-семантические правила для обработки таких слов, как «часть», «совокупность», «название», «род», «вид» и проч.
Скачать презентацию (pdf), видеоверсию (avi) семинара.
Т.Исаева, Л.Гершензон — Как работают Яндекс.Новости
А.Волнухин, Р.Иванов — Как устроен Поиск по блогам
Компании из статьи
Яндекс Украина
|
У Яндекса в Украине три офиса — головной в Одессе, где сосредоточен управленческий аппарат и отдел продаж, и два офиса разработки — киевский, занимающийся разработкой и управлением украинскими проекта... |