Русский WordNet. Онтология и представление знаний

Источник: nlpub

WordNet - это электронный тезаурус/семантическая сеть для английского языка, разработанный в Принстонском университете и выпущенный вместе с сопутствующим программным обеспечением.

Словарь состоит из 4 сетей для основных знаменательных частей речи: существительных, глаголов, прилагательных и наречий. Базовой словарной единицей в WordNet является не отдельное слово, а так называемый синонимический ряд ("синсеты"), объединяющий слова со схожим значением и по сути своей являющимися узлами сети. Для удобства использования словаря человеком каждый синсет дополнен дефиницией и примерами употребления слов в контексте. Слово или словосочетание может появляться более чем в одном синсете и иметь более одной категории части речи. Каждый синсет содержит список синонимов или синонимичных словосочетаний и указатели, описывающие отношения между ним и другими синсетами. Слова, имеющие несколько значений, включаются в несколько синсетов и могут быть причислены к различным синтаксическим и лексическим классам.

Синсеты в WordNet связаны между собой различными семантическими отношениями:

  • гипероним (breakfast → meal) (завтрак → прием пищи);
  • гипоним (meal → lunch) (прием пищи → обед);
  • has-member (faculty → professor) (факультет → профессор);
  • member-of (pilot → crew) (пилот → экипаж);
  • мероним: has-part (table → leg) (стол → ножка);
  • антоним (leader → follower) (лидер → последователь).

Также, существуют различные другие связи: лексические, антонимические, контекстные (слово 'x' имеет отношение к слову 'y') и другими. Среди них особую роль играет гипонимия: она позволяет организовывать синсеты в виде семантических сетей. Для разных частей речи родовидовые отношения могут иметь дополнительные характеристики и различаться областью охвата.

 

WordNet

Англоязычный WordNet:

WordNet с размеченными тональностями:

Голландский, итальянский, испанский, немецкий, французский, чешский, эстонский:

Польский WordNet:

Было предпринято несколько попыток создания WordNet для русского языка:

 
 
Онтология и представление знаний

В информатике термин "онтология" означает формальное представление знаний. Онтологии определяют понятия (концепции), относящиеся к какой-то области, а также задают отношения между этими терминами. Онтологии используются в таких областях информатики, как представление знаний, медицинская и биоинформатика, а также семантическая паутина (semantic web). Современные онтологии могут содержать десятки и сотни тысяч определений, поэтому они часто имеют формат, удобный для чтения компьютером, и имеют строгую логическую базу.

В данном курсе будут рассмотрены логические языки, используемые для построения и манипулирования онтологиями, введены методологии дизайна и поддержки онтологий, рассмотрены алгоритмы автоматического логического анализа (reasoning problems), включая задачи классификации, извлечения экземпляров и поиска ответов на запросы к базе знаний. Также будут рассмотрены приложения.

 
 
 
Явное представление знаний. Онтологии в информатике. Примеры онтологий. Языки представления онтологий. RDF/S и его критика.

Курс: Онтология и представление знаний Лектор: Борис Конев

 
 
 
Полиномиальный алгоритм для задачи классификации в дескрипционной логике. Курс: Онтология и представление знаний
Лектор: Борис Конев
 
 
Дескрипционная логика . Алгоритм проверки реализуемости концептов. Курс: Онтология и представление знаний
Лектор: Борис Конев
 
 

Страница сайта http://www.interface.ru
Оригинал находится по адресу http://www.interface.ru/home.asp?artId=36053