Repositorio Digital - Sistema de Bibliotecas Universidad del Bio-Bio (SIBUBB) >
PUBLICACIONES DIGITALES >
TESIS: Proyectos de Título de Postgrado >
Magister >
Facultad de Ciencias Empresariales >
Magíster en Ciencias de la Computación >
Por favor, use este identificador para citar o enlazar este ítem:
http://repobib.ubiobio.cl/jspui/handle/123456789/1771
|
Título : | Modelo de detección automática de ironía en textos en español |
Autor : | Segura Navarrete, Alejandra A. Vidal Castro, Christian L. Pinto Cruces, Marcelo -- mpintocruces@gmail.com Universidad del Bío-Bío. Departamento de Sistemas de Información (Chile) |
Palabras clave : | PROCESAMIENTO DE LENGUAJE NATURAL ALGORITMOS DE BUSQUEDA-INVESTIGACIONES IRONIA EN LITERATURA-INVESTIGACIONES DETECCION AUTOMATICA DE IRONIA MINERIA DE OPINION OPINION MINING NATURAL LANGUAGE PROCESSING IRONY DETECTION |
Fecha de publicación : | 2017 |
Resumen : | Actualmente, la detección automática de ironía en textos es un tema abierto de trabajo,
el cual está siendo abordado por distintos grupos de investigación. La ironía es definida de
distintas formas y la mayoría de los trabajos converge en definirla como el uso de palabras para
expresar algo distinto y opuesto al sentido literal. Además, dado que las personas a menudo
usan la ironía para expresar sus opiniones, la detección de esta es de interés para investigadores
del área de análisis de sentimientos, debido a que permite evitar interpretaciones erróneas de
opiniones y decidir cuándo una de ellas es o no irónica o literal. Este trabajo propone un nuevo
modelo de detección de ironía en textos en español a partir de los enfoques estudiados en una
revisión sistemática de literatura, en la cual se revisaron artículos relacionados con la detección
de ironía, sarcasmo y minería de opinión. Para evaluar el modelo se construyó un corpus de
evaluación compuesto de tweets en español recopilados de acuerdo a distintos dominios temáticos,
los cuales fueron etiquetados como irónicos y no irónicos por evaluadores humanos. Junto con lo
anterior, se desarrolló una aplicación que permite realizar tareas de pre-procesado y procesado
de cada característica que compone nuestro modelo para finalmente generar el dataset para
evaluación. Este nuevo modelo tomó como base las características de ironía más utilizadas en
los modelos revisados y además introduce 2 nuevas características. Finalmente, el modelo quedó
conformado por los atributos: Uso de emoticonos, Uso de Mayúsculas, Uso de Signos
de Puntuación, Uso de Palabras típicas de ironía, Uso de Adverbios temporales
y no temporales, Análisis de Contradicción Texto-Emoticón, Análisis de ngramas
y Análisis de skipgramas. Se obtuvieron rendimientos generales de hasta un 78 %, valor
considerado aceptable en comparación a los modelos existentes y prometedor considerando la
prácticamente nula existencia de trabajos de detección automática de ironía en textos en español. |
Descripción : | Tesis (Magíster en Ciencias de la Computación) -- Universidad del Bío-Bío. Concepción, 2017. |
URI : | http://repobib.ubiobio.cl/jspui/handle/123456789/1771 |
Aparece en las colecciones: | Magíster en Ciencias de la Computación
|
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.
|