|
Repositorio Digital - Sistema de Bibliotecas Universidad del Bio-Bio (SIBUBB) >
PUBLICACIONES DIGITALES >
MEMORIAS: Proyectos de Título de Pregrado >
Facultad de Ciencias Empresariales >
Ingeniería Civil en Informática >
Por favor, use este identificador para citar o enlazar este ítem:
http://repobib.ubiobio.cl/jspui/handle/123456789/3723
|
Título : | Análisis de datos a través de machine learning para predecir el comportamiento de máquinas de aserrío de alta productividad |
Autor : | Galdames Sepúlveda, Patricio Alejandro Ramos Maldonado, Mario Alejandro Reyes Hernández, Diego Joaquín -- diegorh.contacto@gmail.com Universidad del Bío-Bío. Departamento de Sistemas de Información |
Palabras clave : | APRENDIZAJE AUTOMATICO MINERIA DE DATOS MADERA ASERRADA-MAQUINARIA-PROGRAMAS PARA COMPUTADOR ALGORITMOS COMPUTACIONALES MACHINE LEARNING REDES NEURONALES INDUSTRIA FORESTAL MAQUINAS DE ASERRIO MODELOS DE PREDICCION |
Fecha de publicación : | 2020 |
Resumen : | La presente investigación tiene como propósito presentar y explicar la comparación de diferentes modelos Machine Learning, para la problemática que se nos presenta y es de suma importancia para el sector forestal. La predicción de la velocidad de alimentación en el proceso de aserrado, muy importante para la productividad de las empresas industriales del sector primario y secundario, lo que hace que, predecir este tipo de valores tenga un impacto en diferentes procesos, en particular en la industria forestal.
Gracias las nuevas tecnologías digitales es posible recopilar gran cantidad de datos sobre maquinarias claves en procesos transversales para este tipo de compañías manufactureras. La disponibilidad de sensores y técnicas de máquinas de aprendizaje automático (Machine Learning) permiten el despliegue y análisis inteligente capaz de asociarse a estrategias modernas de prescripción, esto es, recomendaciones operacionales para que las variables se mantengan en los límites de control y garanticen el cumplimiento de la función objetivo. El problema puede observarse como una caja negra desde el punto de vista del sistema, con muchas entradas (Características) y una sola salida (Velocidad de alimentación).
Para el desarrollo de este proyecto de título se utilizó la metodología CRIS-DM, que es una metodología de proceso estándar de la industria, probado y robusto, para proyectos de minería de datos y análisis. Esta metodología describe claramente los pasos, procesos y flujos necesarios para ejecutar cualquier proyecto analítico, desde la formalización de los requisitos comerciales hasta la prueba y el despliegue de la solución. La ciencia de datos, la minería de datos y el ML se caracterizan por ejecutar múltiples procesos para extraer conocimientos e información de los datos. “Por lo tanto se puede decir que el análisis de datos es realmente tanto un arte como una ciencia, porque no siempre trata de ejecutar algoritmos sin razón; gran parte del esfuerzo principal implica la comprensión del negocio, siendo el valor real de los esfuerzos, y los métodos adecuados para articular los resultados finales y las percepciones” (Sarkar,2018).
“La metodología CRIS-DM se describe en términos de un modelo de procesos jerárquico, que consiste en conjunto de tareas descritas en cuatro niveles de abstracción: Fase, Tarea genérica, Tarea especializada e instancia de proceso” (Chapman et al., 2000). Esta metodología nos permite construir una solución de extremo a extremo para cualquier proyecto. Se identifican 6 pasos claves (figura 1) algunos de ellos iterativos, al igual que un proyecto de software tenemos un ciclo de vida del desarrollo de software con varias fases o pasos a seguir para un proyecto de desarrollo de software:1. Comprensión del negocio
Esta fase inicial se centra en la comprensión de los objetivos y requisitos del proyecto desde una perspectiva empresarial, y luego convertir este conocimiento en una definición del problema de la minería de datos y un plan preliminar diseñado para lograr los objetivos.
2. Comprensión de los datos
La segunda fase denominada comprensión de los datos comienza con la recopilación inicial de datos y continua con actividades que permitirán familiarizarse con los datos, identifica problemas de calidad de estos datos descubrir las primeras percepciones de los datos, y/o detectar subconjuntos interesantes para formar hipótesis sobre la información global y parcial.
3. Preparación de datos
La tercera fase denominada preparación de los datos abarca todas las actividades necesarias para construir el conjunto de datos definitivo (datos que se introducirán en el modelo ML) a partir de los datos iniciales en bruto. Es probable que las tareas de preparación de datos se realicen vareas veces y no en cualquier orden prescrito. Las tareas abarcan la selección de tablas, registros y atributos, así como la transformación y limpieza de los datos para el modelo ML.
4. Modelo
En esta cuarta fase se seleccionan y aplican diversas técnicas de modelización y se calibran sus parámetros para su optimo valor. En general existen varias técnicas para el mismo tipo de problema de minería de datos. Algunas de ellas tienen determinados requisitos sobre la forma de los datos, en algunas ocasiones se debe a preparar los datos nuevamente dependiendo del modelo que requiera el problema. 5. Evaluación
En esta etapa del proyecto, se ha seleccionado y construido un modelo (o modelos) indicado a partir de la perspectiva de los datos. Pero antes de poder proceder al desarrollo final del modelo, es importante evaluar y revisar el desempeño del modelo, para así asegurar que el modelo alcance adecuadamente los objetivos establecidos. Al término de esta fase se decidirá la utilización de los resultados a partir de la extracción de datos.
6. Implementación
La creación del modelo no suele ser el fin del proyecto. Incluso si el propósito del modelo es aumentar el conocimiento de los datos, los conocimientos adquiridos deben organizarse y presentarse de manera que el cliente pueda utilizarlos sin inconvenientes. Esto implica en algunas ocasiones la aplicación de modelos “Vivos” dentro de los procesos para la toma de decisiones de una organización, por ejemplo, en tiempo real la personalización de las páginas web o la repetición de la puntuación de las bases de datos de marketing.
En relación a los requisitos, la última fase llamada de implementación, puede ser tan simple como la generación de un informe o tan compleja como la implementación de una extracción de datos de la empresa. Es relevante, que el cliente entienda por adelantado que acciones deben llevarse a cabo, para poder utilizar realmente y de forma correcta los modelos generados.
Durante la investigación y siguiendo el orden que nos plantea la metodología, se pudo llegar a entrenar con éxito modelos predictivos que se presentan en literatura (Multilayer Perceptron, Redes neuronales recurrentes, Maquinas de soporte vectorial de regresión) que pudieran predecir la velocidad de alimentación, comparándolos entre ellos, a través de métricas que nos permitiera conocer y entender los resultados. |
Descripción : | Memoria (Ingeniero Civil en Informática) -- Universidad del Bío-Bío. Concepción, 2020. |
URI : | http://repobib.ubiobio.cl/jspui/handle/123456789/3723 |
Aparece en las colecciones: | Ingeniería Civil en Informática
|
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.
|