(Institución) Sobre el software DSpace
 

Repositorio Digital - Sistema de Bibliotecas Universidad del Bio-Bio (SIBUBB) >
PUBLICACIONES DIGITALES >
MEMORIAS: Proyectos de Título de Pregrado >
Facultad de Ciencias Empresariales >
Ingeniería de Ejecución en Computación e Informática >

Por favor, use este identificador para citar o enlazar este ítem: http://repobib.ubiobio.cl/jspui/handle/123456789/2712

Título : Análisis de algoritmos de selección para mejorar tiempos de ejecución en obtención de características de interacción de proteína-proteína
Autor : Gutierrez Bunster, Tatiana A.
Tare Bustos, Sebastián Alberto -- deathshadow_s@hotmail.com
Universidad del Bío-Bío. Departamento de Sistemas de Información (Chile)
Palabras clave : PROTEINAS-PROCESAMIENTO DE DATOS
ALGORITMOS-USOS
BIOINFORMATICA
Fecha de publicación : 2017
Resumen : Hoy en d´ıa existe una gran motivaci´on por entender los procesos biolo´gicos de los seres vivos. Las prote´ınas son unas bio-mol´eculas muy importantes para la vida y pr´acti- camente todos los procesos biol´ogicos dependen de la presencia o la actividad de las proteínas. Este proyecto de t´ıtulo comprende el estudio algoritmos de selecci´on de caracter´ısticas para procesar datos de interacciones entre prote´ınas. La motivaci´on para esto es por- que las prote´ınas actu´an en conjunto con otras prote´ınas, y dependiendo del tipo de interacci´on se puede ayudar a definir las funciones que poseen. Se estudiaron 19 algoritmos de selecci´on de caracter´ısticas y se eligieron 5 de los m´as pro- metedores para probar su desempen˜o. Estos algoritmos fueron ejecutados con 5 matrices de 295 complejos proteicos(filas) y entre un rango de 600-1800 caracter´ısticas (colum- nas) por matriz. Los subconjuntos generados fueron luego utilizados para construir un clasificador, el cual es un algoritmo que trata de aprender sobre los datos e inferir una regla general para evaluar nuevos datos y poder clasificar si son de clase A o clase B. Se evalu´o el desempen˜o de 4 clasificadores, Na¨ıve Bayes, SVM lineal, Random Tree y Random Forest. Se encontr´o que al utilizar el algoritmo T score con la matriz de datos sin residuo, se alcanz´o un 93.3 % de exactitud en la clasificaci´on utilizando divisi´on por porcentaje de 90 %.
Descripción : Memoria (Ingeniero de Ejecución en Computación e Informática) -- Universidad del Bío-Bío. Concepción, 2017.
URI : http://repobib.ubiobio.cl/jspui/handle/123456789/2712
Aparece en las colecciones: Ingeniería de Ejecución en Computación e Informática

Ficheros en este ítem:

Fichero Descripción Tamaño Formato
Tare_Bustos_Sebastian.pdf2,2 MBAdobe PDFVisualizar/Abrir
View Statistics

Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2008 MIT and Hewlett-Packard - Comentarios