Ontos SOA

Система Ontos SOA реализует полный цикл семантико-синтаксической обработки, организации и анализа неструктурированной информации, представленной в интернете и в корпоративных банках данных.

Подход к анализу и работе с неструктурированной информацией можно представить как последовательное выполнение следующих шагов процесса обработки:

  1. Мониторинг новых сообщений СМИ.
  2. Лингвистический анализ текстов сообщений.
  3. Аналитическая обработка, определение идентичных объектов (люди, организации, политические партии и т.д.) и сохранение данных в специальном хранилище.
  4. Предоставление сервисов работы с метаинформацией документов.

Лингвистический анализ текста

Благодаря обработке естественного языка на основе лингвистических правил, система распознает объекты и отношения в тексте. Объекты и отношения, представляющие интерес, определены в онтологии предметной области.

Распознанная и извлеченная информация может быть представлена в понятном компьютеру формате, например, в виде таблиц и сохранена в базу данных. После этого с ней можно работать также как и с любой базой данных.

При сохранения полученной из документов информации в хранилище данных происходит идентификация продублированных и синонимичных объектов и выполняется операция их объединения.

Например, если в документе был распознан факт «министр обороны Сергей Иванов», а в хранилище этот факт уже присутствует, то в хранилище сохраняется только ссылка уже существующих объектов на новый документ.


Распределенные вычисления

Ввиду ресурсоемкости большинства операций распределенные вычисления могут осуществляться параллельно на нескольких компьютерах.

Разработанная система основывается на ведущих j2ee технологиях и может устанавливаться на больших серверах или на обычных настольных ПК.

News