Repositorio Digital - Sistema de Bibliotecas Universidad del Bio-Bio (SIBUBB) >
PUBLICACIONES DIGITALES >
MEMORIAS: Proyectos de Título de Pregrado >
Facultad de Ciencias Empresariales >
Ingeniería de Ejecución en Computación e Informática >
Por favor, use este identificador para citar o enlazar este ítem:
http://repobib.ubiobio.cl/jspui/handle/123456789/2712
|
Título : | Análisis de algoritmos de selección para mejorar tiempos de ejecución en obtención de características de interacción de proteína-proteína |
Autor : | Gutierrez Bunster, Tatiana A. Tare Bustos, Sebastián Alberto -- deathshadow_s@hotmail.com Universidad del Bío-Bío. Departamento de Sistemas de Información (Chile) |
Palabras clave : | PROTEINAS-PROCESAMIENTO DE DATOS ALGORITMOS-USOS BIOINFORMATICA |
Fecha de publicación : | 2017 |
Resumen : | Hoy en d´ıa existe una gran motivaci´on por entender los procesos biolo´gicos de los seres
vivos. Las prote´ınas son unas bio-mol´eculas muy importantes para la vida y pr´acti- camente todos los procesos biol´ogicos dependen de la presencia o la actividad de las
proteínas.
Este proyecto de t´ıtulo comprende el estudio algoritmos de selecci´on de caracter´ısticas para procesar datos de interacciones entre prote´ınas. La motivaci´on para esto es por- que las prote´ınas actu´an en conjunto con otras prote´ınas, y dependiendo del tipo de interacci´on se puede ayudar a definir las funciones que poseen.
Se estudiaron 19 algoritmos de selecci´on de caracter´ısticas y se eligieron 5 de los m´as pro- metedores para probar su desempen˜o. Estos algoritmos fueron ejecutados con 5 matrices de 295 complejos proteicos(filas) y entre un rango de 600-1800 caracter´ısticas (colum- nas) por matriz. Los subconjuntos generados fueron luego utilizados para construir un clasificador, el cual es un algoritmo que trata de aprender sobre los datos e inferir una regla general para evaluar nuevos datos y poder clasificar si son de clase A o clase B. Se evalu´o el desempen˜o de 4 clasificadores, Na¨ıve Bayes, SVM lineal, Random Tree y Random Forest. Se encontr´o que al utilizar el algoritmo T score con la matriz de datos sin residuo, se alcanz´o un 93.3 % de exactitud en la clasificaci´on utilizando divisi´on por porcentaje de 90 %. |
Descripción : | Memoria (Ingeniero de Ejecución en Computación e Informática) -- Universidad del Bío-Bío. Concepción, 2017. |
URI : | http://repobib.ubiobio.cl/jspui/handle/123456789/2712 |
Aparece en las colecciones: | Ingeniería de Ejecución en Computación e Informática
|
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.
|