EmoLib es una librería que extrae el contenido emocional de un texto de entrada etiquetándolo de acuerdo con el afecto con el que está escrito o que se está transmitiendo.
La estructura de procesado de EmoLib está construida a partir de varias clases que definen un entorno modular, llamado "pipeline" debido a la secuencialidad del proceso de etiquetaje. Éste es el AffectiveTagger.
Las clases que definen la arquitectura de EmoLib son descritas a continuación:
- Tokenizer - Divide un texto en unidades individuales, llamadas tokens. Éstos tokens están expresados en patrones regulares tal y como establece la gramática del lenguaje. Es la ENTRADA del pipeline.
- Sentence Splitter - Segmenta el texto de entrada en párrafos y frases.
- Part-Of-Speech Tagger - Desambigua la función de nombres, verbos y adjetivos en la frase de acuerdo con el contexto.
- Word Sense Disambiguator - Determina la acepción correcta de las palabras de acuerdo con el contexto y completa las palabras en cuestión con el conjunto de sinónimos adecuado.
- Stemmer - Elimina la flexión de las palabras para agrupar aquellas que comparten un mismo significado, mejorando así la recuperación de la información (IR).
- Emotional Keyword Spotter - Determina las dimensiones emocionales de las palabras que tienen un contenido afectivo.
- Statistic - Calcula la media de las dimensiones emocionales del texto.
- Classifier - Etiqueta el texto con el afecto más apropiado de acuerdo con los atributos afectivos.
- Affective Formatter - Presenta los resultados obtenidos. Es la SALIDA del pipeline.
Por favor, tenga cuidado haciendo "copiar-pegar" de algunos textos directamente desde Internet ya que algunos caracteres pueden causar un mal funcionamiento en el sistema.
EmoLib está actualmente siendo desarrollado por Alexandre Trilla como parte de su tesis doctoral, bajo la supervisión de Francesc Alías en Enginyeria i Arquitectura La Salle, Universitat Ramon Llull, Barcelona, Spain. No dude en contactar con ellos para cualquier comentario o sugerencia.