Описание

Обзор
Программное решение 3i NLP Platform поддерживает распределенную обработку больших объемов данных (Big Data), отказоустойчивое хранение и высокоскоростную обработку данных с помощью средств Hadoop (HDFS, Hbase, SequenceFiles и т.п.). При проведении текстового анализа таких данных выявляется большое количество различной статистической лингвистической информации. Ее учет дает возможность существенно повысить точность и релевантность результатов, например, при поиске и классификации текстов. 3i NLP Platform предоставляет следующие возможности:


формирование и обработка статистической морфологической информации (кол-во частей речи, их распределение в массиве текстов и др.);
расчет статистики по выявленным сущностям (персоны, геолокации, организации) и результатам расчетов по определению тональности документов и сущностей;
выполнение математических операций над статистическими данными (пересечение выявленных групп данных, нахождение экземпляров данных в заданном множестве и др.)
анализ частотных характеристик морфологической и семантической информации, графическая интерпретация статистических данных

Реализация
3i NLP Platform функционирует на ОС Linux.