(Institución) Sobre el software DSpace
 

Repositorio Digital - Sistema de Bibliotecas Universidad del Bio-Bio (SIBUBB) >
PUBLICACIONES DIGITALES >
MEMORIAS: Proyectos de Título de Pregrado >
Facultad de Ciencias Empresariales >
Ingeniería Civil en Informática >

Por favor, use este identificador para citar o enlazar este ítem: http://repobib.ubiobio.cl/jspui/handle/123456789/3155

Título : Algoritmo de clustering en línea, para la recuperación de la información
Autor : Gutiérrez Soto, Claudio Orlando
Lara Sánchez, Frederick Edecio -- frelara94@gmail.com
Moncada García, Delia Fernanda -- deliamondacagarcia@gmail.com
Universidad del Bío-Bío. Departamento de Sistemas de Información (Chile)
Palabras clave : ALGORITMOS EN LINEA-USOS
SISTEMAS DE ALMACENAMIENTO Y RECUPERACION DE INFORMACION
ANALISIS DE CONGLOMERADOS
ALGORISMO DE CLUSTERING EN LINEA
RECUPERACION DE LA INFORMACION
Fecha de publicación : 2017
Resumen : La recuperación de la información tiene como propósito satisfacer una necesidad de información de un usuario. En la recuperación de la información se ha incorporado el clustering de documentos con el propósito de mejorar la eficacia de los sistemas de recuperación de información. La hipótesis de clustering confirma que los documentos relevantes aparecen en los mismos grupos cuando éstos tienden a ser similares entre sí. Sin embargo, en investigaciones realizadas anteriormente no se ha podido concluir respecto a si el clustering dinámico de documentos trae mejoras. Este trabajo tiene como objetivo principal mejorar la precisión de los documentos recuperados, aplicados en un contexto dinámico, con la motivación de investigar la efectividad del clustering de documentos. Es por esto, que se llevan a cabo algunos supuestos los cuales tratan de la forma dinámica en la que se realiza el clustering de documentos con respecto a una consulta. En este proyecto de título se lleva a cabo la agrupación con el fin de investigar el comportamiento de los principales algoritmos de clustering, al realizar consultas con un grupo de documentos relevantes. Se realizan dos tipos de experimentos, los cuales se llevan a cabo con dos conjuntos de documentos, que se denominan como documentos antiguos y documentos nuevos. En primer lugar se realizaron los experimentos relacionados con la precisión de los documentos y en segundo lugar se analizó el comportamiento de tres algoritmos de clustering (Single Link, Complete Link y Average Link). Se tiene como enfoque principal el clustering en línea, realizando una investigación analítica con una serie de cosas relacionadas con la eficacia de la recuperación en un contexto dinámico. En esta tesis la recuperación en línea se emplea sobre la base de su potencial para mejorar la eficacia de la agrupación de documentos y tener un mejor resultado en los sistemas de recuperación de información. Los resultados obtenidos por medio de los experimentos con respecto a la precisión obtenida con la recuperación de documentos antiguos y la recuperación donde se unen documentos antiguos con documentos nuevos, demostró que existe un momento en el cual, la precisión siempre mejora, a medida que se van incorporando nuevos documentos. En la segunda parte de los experimentos, se proporciona evidencia con respecto a la agrupación realizada, donde se toma en cuenta la cantidad de documentos relevantes al recorrer el clúster generado sólo con los documentos antiguos y la cantidad de documentos relevantes visitados al recorrer el clúster construido con la unión de los documentos antiguos y nuevos, dichos clústeres fueron generados con cada uno de los algoritmos de clustering, para así poder observar cuál de los tres algoritmos obtuvo los mejores resultados.
Descripción : Memoria (Ingeniero Civil en Informática) -- Universidad del Bío-Bío. Concepción, 2017.
URI : http://repobib.ubiobio.cl/jspui/handle/123456789/3155
Aparece en las colecciones: Ingeniería Civil en Informática

Ficheros en este ítem:

Fichero Descripción Tamaño Formato
Lara Sánchez, Frederick Edecio.pdf4,07 MBAdobe PDFVisualizar/Abrir
View Statistics

Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2008 MIT and Hewlett-Packard - Comentarios