In the chemical process industry, the decision-making hierarchy is inherently model-based. The scale and complexity of the considered models (e.g., enterprise, plant or unit model) depend on the decision-making level (e.g., supply-chain management, planning, scheduling, operation) and the allowable time slot (weeks, hours, seconds) within which model simulation runs must be performed and their output is analyzed to support the decision making. The use of high-fidelity models, which include detailed physics-based description of the process, is attracting wide interests of the process engineers. Since, these First Principle Model (FPMs) are able to accurately predict the real behavior of the process, leading to realistic optimal decisions. However, their use is hindered by practical challenges as the high computational time required for their simulation and the unguaranteed reliability of their consistent convergence. The challenges become prohibitive at lower levels of the decision-making hierarchy (i.e., operation), where decisions are required online within time slots of minutes or seconds entailing lots of simulation runs using such complex and highly nonlinear FPMs. Surrogate modelling techniques are potential solution for these challenges, which relies on developing simplified, but accurate, data-driven or machine learning models using data generated by a FPM simulations, or collected from a real process. Although, there are progressive developments of surrogate-based methods in the chemical engineering area, they are concentrated in process design and steady-state optimization areas.
This Thesis presents a framework for the proper and effective use of surrogate models and machine learning techniques in different phases of the process operation. The objective is to provide efficient methodologies, each supports the decision making in a specific phase of the process operation, namely; steady-state operation optimization, Model Predictive Control (MPC), multivariate system identification and multistep-ahead predictions, dynamic optimization, Fault Detection and Diagnosis (FDD) and soft-sensing. Each developed methodology is designated according to careful State-Of-Art (SOA) review that identifies the gaps and missing requirements to be covered. The SOA, identified gaps and the contributions of each methodology are summarized in Chapter 1 and detailed in the introduction of each of the following chapters.
In this context, Chapter 3 presents a surrogate-based methodology for steady-state operation optimization of complex nonlinear chemical processes modelled by black-box functions. Chapter 4 proposes machine learning-based methodologies for multiparametric solution of complex operation optimization problems subjected to uncertainty. Chapter 5 presents a data-based multiparametric MPC methodology that enables simple implementations of explicit MPC for nonlinear chemical processes. Chapter 6 proposes a data-driven methodology for multivariate dynamic modelling of nonlinear chemical processes and for multistep-ahead prediction. Chapter 7 suggests a dynamic optimization methodology for solving optimal control problems of complex nonlinear processes based on data-driven dynamic models. Chapter 8 shows a hybrid methodology to improve FDD of chemical processes run under time-varying inputs based on multivariate data-driven dynamic models and classification techniques. Chapter 9 presents data-driven soft-sensing methodologies for batch processes operated under changeable initial conditions. The effectiveness of the developed methodologies is proved by comparing their performances to those of classical solution procedures existing in the SOA, via their applications to different benchmark examples and case studies. The promising results and their sound analysis allowed to publish many papers in top-ranked journals and proceedings, and to present them at several top-ranked international conferences including two Keynote presentations.
En la Industria de Proceso, como en otros ámbitos, la toma de decisiones se basa en la valoración de las consecuencias de dichas decisiones a través de modelos (implícitos o explícitos). La escala y complejidad de los modelos necesarios dependen de la complejidad del proceso, del nivel jerárquico al que se toman las decisiones (p. ej.: gestión de la cadena de suministro, planificación de proceso, programación de operaciones, control) y del horizonte de tiempo considerado. El uso de modelos basados en principios básicos (First Principle Models (FPM) habitualmente permite predecir con precisión el comportamiento de un sistema y llevar así a decisiones fundamentadas y explicables. Sin embargo, su uso se ve obstaculizado por problemas prácticos, dado que en ocasiones requiere cálculos iterativos aún sin tener garantizada su convergencia a una solución factible. Estos problemas son más frecuentes a medida que se desciende en la jerarquía de toma de decisiones (p. ej.: control supervisor), especialmente si la resolución (optimización) del sistema implica muchos cálculos de simulación utilizando un FPM complejo (p. ej.: altamente no lineal, involucrando variables enteras, etc.). Una forma de superar estas dificultades consiste en aplicar técnicas basadas en “modelos subrogados” o sustitutos, construidos a partir de datos recopilados del proceso real, de datos previamente simulados (utilizando un FPM), o de una combinación de ambos. Aunque estos modelos se utilizan en muchas áreas, en el ámbito de la ingeniería química habitualmente se emplean solo para el diseño de procesos y en sistemas de optimización de estado estacionario. Esta tesis presenta un marco para el uso eficaz y eficiente de modelos subrogados, construidos mediante técnicas de aprendizaje automático, en la toma de decisiones en diferentes fases de la operación, el control y la optimización de un proceso. En este contexto, el Capítulo 3 presenta una metodología para la optimización de la operación en estado estacionario de procesos no lineales. El Capítulo 4 propone la utilización de metodologías basadas en el aprendizaje automático en problemas de optimización de operaciones sujetas a incertidumbre (optimización multiparamétrica). El Capítulo 5 extiende este planteamiento a la construcción de sistemas de control predictivo (MPC) explícito de procesos no lineales. El Capítulo 6 propone una metodología para la construcción sistemática de modelos subrogados en sistemas dinámicos no-lineales multivariable, metodología que se aplica en el capítulo 7 a la de optimización de procesos dinámicos (control óptimo de sistemas no lineales en estado no estacionario). Esta misma metodología se integra en el Capítulo 8 con técnicas de clasificación para su aplicación a la detección y diagnosis de fallos (Fault Detection and Diagnosis - FDD) de sistemas dinámicos multivariable. Finalmente, en el Capítulo 9 se presenta la aplicación de estas metodologías para el entrenamiento de sensores virtuales (“soft-sensors”) y su aplicación a procesos de producción por lotes que trabajan con condiciones iniciales cambiantes. Cada una de estas aplicaciones, y los prototipos resultantes, se han plateado después de una cuidadosa revisión de las aportaciones más recientes en estos campos, que ha permitido identificar las dificultades para la implementación de las técnicas existentes en sistemas prácticos de soporte a la toma de decisiones, y la forma de superar estas dificultades mediante la utilización de modelos alternativos, que se resumen en el Capítulo 1. La eficacia de las metodologías desarrolladas se ilustra a través del análisis de su aplicación a diferentes casos, tanto propuestos en esta Tesis como de referencia en los diferentes ámbitos de aplicación. Estos resultados han merecido su publicación en diferentes revistas científicas de primer nivel, así como su difusión a través de congresos internacionales de primer nivel, incluidas dos presentaciones de Keynote.