10/01/2013 19:27
Что это?
Индикаторы тональности (позитив/негатив) и манипулятивности вычисляются отдельно для каждого сообщения и отображают его внесмысловой контекст. Т.е. они не зависят от темы сообщения и свидетельствуют о том, несет ли оно эмоциональную нагрузку, имеет ли скрытый подтекст.
Как вычисляются?
Научные исследования в области психологии и языкознания показывают, что выражению в тексте позитива (радости, удовольствия), негатива (страха, грусти, разочарования, депрессии) либо скрытых намерений сопутствует употребление определенной лексики, использование особенного порядка слов в предложении и т.д. Наш алгоритм выявляет такие лингвистические конструкции в тексте сообщения и проверяет, насколько характерно их употребление в эмоционально окрашенных и манипулятивных сообщениях путем сопоставления частот встречаемости.
Как интерпретируются?
В силу субъективности подобного рода показателей, мы используем вероятностную шкалу представления результатов оценивания. Ни один эксперт в мире не станет категорично утверждать, что то или иное сообщение является позитивным, негативным или манипулятивным. Более справедливо говорить о наличии или отсутствии признаков позитива, негатива или манипулятивности. Поэтому результатом работы нашего алгоритма является вероятность того, что сообщение содержит такие признаки. Чем выше уровень определенного показателя, тем более выражены в тексте соответствующие ему признаки.
Точность алгоритма
Следует признать, что наш алгоритм не умеет адекватно распознавать экстралингвистические конструкции в тексте, например, иронию или цитаты. Несмотря на это, точность алгоритма составляет 85%, т.е. в 85 случаях из 100 алгоритм оценивает сообщение точно так же, как оценил бы его эксперт.
Зачем используются?
Показатели тональности и манипулятивности дополняют смысловое содержание сообщения. Например, если сообщение о новом продукте конкурента имеет высокий показатель (99% и выше) позитива и манипулятивности, скорее всего преимущества этого продукта несколько преувеличены.
Появление неожиданно большого количества сообщений о компании или бренде с высокими показателями манипулятивности и негатива свидетельствует о черном пиаре или информационной атаке. Таким образом, показатели тональности и манипулятивности наиболее информативны при анализе потока новостей (множества новостей, упорядоченных во времени).
Если в течении месяца наблюдаются потоки новостных сообщений, характеризующие события отрасли с высоким показателем негатива, это может быть признаком неблагоприятной обстановки на рынке.