Artículo

Gemelos digitales y modelos híbridos en la producción de productos biológicos: Una comparación de modelos

  • Thomas de Marchin

La tecnología de gemelos digitales tiene el potencial de desempeñar un papel transformador en el desarrollo y la fabricación de fármacos. 

En nuestro primer artículo : Cómo los gemelos digitales y el modelado híbrido optimizan el proceso de cultivo celular para una mejor producción, presentamos nuestra visión de los gemelos digitales para bioprocesos como réplicas virtuales que combinan modelos mecanicistas y basados en datos para optimizar la fabricación de productos biológicos. Mostramos cómo los modelos híbridos pueden respaldar la optimización en tiempo real, el escalado vertical y el cumplimiento normativo. Los gemelos digitales son especialmente cruciales para la medicina personalizada y las terapias celulares y génicas, ya que permiten la producción adaptable de pequeños lotes adaptados a tratamientos individualizados.1

En este segundo artículo, ponemos en práctica la teoría comparando un modelo clásico basado en datos con un modelo híbrido para predecir la densidad celular viable (VCD) y la acumulación de productos, parámetros clave de la productividad, en un biorreactor de perfusión.

Demostramos cómo los gemelos digitales permiten a los innovadores responder a preguntas como:

  • ¿Cómo podemos identificar las condiciones óptimas para maximizar el crecimiento y la productividad celular?
  • ¿Cuándo debemos iniciar la perfusión y ajustar las estrategias de alimentación para evitar el agotamiento del sustrato y el colapso de la densidad celular?
  • ¿Podemos detectar signos tempranos de inestabilidad y predecir parámetros difíciles de medir, como la concentración de sustrato en el biorreactor?
Figura 1: Ilustración de un biorreactor de perfusión

Estudio de casos: Modelado de cultivos celulares de biorreactores de perfusión

Figura 1: Ilustración de un biorreactor de perfusión
En un biorreactor de perfusión, las células reciben continuamente nutrientes frescos mientras se eliminan los desechos y el producto, pero las propias células se retienen. Esto crea un entorno estable y rico en nutrientes donde las células pueden prosperar durante largos períodos, lo que conduce a densidades celulares más altas y una mayor productividad. Los biorreactores de perfusión se utilizan ampliamente para la producción de productos biológicos.2

Modelar atributos como la densidad celular viable (VCD) o la acumulación de productos junto con parámetros de proceso como la concentración de sustrato, la temperatura o la agitación mediante modelos predictivos es un paso crucial en la caracterización de procesos farmacológicos.3
Figura 1: Ilustración de un biorreactor de perfusión
El modelado clásico de biorreactores generalmente se basa en enfoques puramente basados en datos, donde funciones matemáticas simples (como líneas o curvas) se ajustan a los datos experimentales para hacer predicciones. 3 Aunque este método es sencillo y eficiente desde el punto de vista computacional, a menudo no logra capturar los mecanismos biológicos o físicos subyacentes que impulsan el sistema. Como resultado, proporciona una visión limitada de por qué se producen resultados específicos y tiene dificultades para generalizar más allá del rango de datos de entrenamiento.

Además, los métodos basados en datos se enfrentan a desafíos cuando se trata de sistemas complejos que involucran numerosos parámetros de proceso y datos experimentales limitados, lo cual es común en el desarrollo de fármacos. Los modelos mecanicistas o híbridos resuelven algunos de estos problemas incorporando el conocimiento previo del proceso en forma de leyes biológicas y físicas. 4 Por lo tanto, si bien los modelos clásicos basados en datos sirven como un punto de partida útil, creemos que la integración del conocimiento mecanicista a través de enfoques híbridos mejora el poder predictivo y facilita una mejor optimización del proceso en los biorreactores.
Desarrollamos un modelo híbrido que integra el conocimiento mecanicista, como las tasas de consumo de nutrientes y las vías metabólicas, con componentes de aprendizaje automático basados en datos que capturan aspectos complejos o poco comprendidos. La parte mecanicista proporciona una base sólida de conocimiento previo del proceso, mientras que el componente de aprendizaje automático modela comportamientos desconocidos. Los modelos híbridos ofrecen una mayor robustez en la extrapolación y pueden capturar con precisión comportamientos dinámicos, como cambios en las tasas de crecimiento celular y la absorción de nutrientes en condiciones variables.  Aunque son más complejos de desarrollar, pueden reducir la necesidad de una amplia experimentación y permitir la reutilización de modelos existentes en todos los productos. También se destacan en la optimización en tiempo real, el escalado predictivo y el cumplimiento normativo al mejorar la comprensión del proceso durante la caracterización (Etapa 1 de la FDA) y respaldar el desarrollo de límites de control en tiempo real para lotes específicos (Etapa 3 de la FDA).

Nuestro modelo híbrido toma los parámetros del proceso como insumos y predice variables biológicas como tasas, rendimientos y niveles de meseta para la formación de biomasa y productos. Estos parámetros predichos se introducen en un sistema de ecuaciones diferenciales ordinarias (ODE), que calculan las respuestas dinámicas del biorreactor a lo largo del tiempo. La figura 2 ilustra los pasos clave tanto del enfoque clásico puramente basado en datos como del enfoque híbrido.
Figura 2: Comparación de modelos basados en datos e híbridos
Para evaluar ambos enfoques, simulamos 29 experimentos que variaban la temperatura (20-40 °C) y la velocidad de agitación (150-350 rpm), capturando diferentes dinámicas de crecimiento de biomasa, formación de productos y consumo de glucosa a lo largo del tiempo (Figura 3). El modelo se entrenó en 21 experimentos. A continuación, se probó el rendimiento en dos conjuntos de cuatro experimentos no vistos: un conjunto dentro del dominio de entrenamiento (prueba1) para evaluar la capacidad de interpolación, y otro fuera de este dominio (prueba2) para evaluar la extrapolación y la generalización.

Imagen del artículo de recurso de gemelos digitales

Figura 3: Dominio experimental de los datos utilizados para entrenar y probar los modelos. El conjunto de datos de la prueba 1 se encuentra dentro del dominio experimental del conjunto de datos de entrenamiento, mientras que el conjunto de datos de la prueba 2 se encuentra fuera.
En la Figura 4 y en la Figura 5 se muestran las predicciones de los dos conjuntos de datos de prueba. Podemos ver que el modelo híbrido (verde) se ajusta mejor a los datos (puntos rojos) que el enfoque clásico (azul). Esto también se muestra en la Figura 6, que muestra el error cuadrático medio (RMSE), una medida común de la precisión de la predicción que cuantifica la diferencia promedio entre los valores predichos y observados. Cuanto menor sea el RMSE, mejor será el rendimiento predictivo del modelo. El modelo híbrido logra un RMSE consistentemente más bajo que el enfoque clásico en ambos dominios. Esto indica que el modelo híbrido generaliza mejor y hace predicciones más precisas, incluso cuando se extrapolan más allá de las condiciones de entrenamiento.
Imagen del artículo de recurso de gemelos digitales

Figura 4: Datos (rojo) y predicciones mediante el modelo híbrido (verde) y el enfoque clásico (azul) para el conjunto de datos dentro del dominio experimental.
Imagen del artículo de recurso de gemelos digitales

Figura 5: Datos (rojo) y predicciones mediante el modelo híbrido (verde) y el enfoque clásico (azul) para el conjunto de datos del dominio experimental externo.
Imagen del artículo de recurso de gemelos digitales

Figura 6: Comparación predictiva del rendimiento de los enfoques de modelización clásicos e híbridos medidos por RMSE (error cuadrático medio). Los valores RMSE más bajos indican una mejor precisión predictiva.

Como muestra nuestro estudio de caso, los modelos híbridos no solo encajan en el dominio de la formación, sino que también demuestran una robustez mucho mayor cuando se extrapolan a nuevas condiciones, una característica esencial para la fabricación de fármacos en el mundo real. Esto muestra claramente la superioridad de este tipo de modelos sobre los enfoques clásicos comúnmente utilizados.

Históricamente, la creación y adaptación de modelos híbridos requería conocimientos especializados en matemáticas y ciencia de datos, lo que limitaba su accesibilidad en muchas empresas. Sin embargo, este panorama está cambiando con la llegada de aplicaciones fáciles de usar como TwinLab, que se muestra en la Figura 7. Creamos esta aplicación para permitir a los usuarios sin conocimientos técnicos profundos explorar fácilmente diferentes escenarios de procesos y predecir resultados. Estas herramientas hacen que el modelado híbrido avanzado sea práctico y procesable, apoyando a los científicos e ingenieros en el desarrollo de bioprocesos mediante la integración del conocimiento mecanicista con la información basada en datos a través de interfaces intuitivas.
Figura 7: Aplicación de simulación que permite el análisis de escenarios mediante la variación de los parámetros clave del proceso, incluida la velocidad de agitación, la temperatura, la tasa de dilución, la concentración de sustrato en el alimento y la concentración inicial de semillas. Estas entradas se procesan mediante un modelo híbrido que predice los cursos temporales de la densidad celular viable (VCD), la formación del producto y el consumo de sustrato.
Incluso con un modelo híbrido, la precisión de la predicción no es perfecta, y requerir 21 muestras para el entrenamiento puede presentar una barrera, especialmente para las pequeñas empresas de biotecnología que no pueden generar fácilmente este volumen de datos de alta calidad. Hay varios enfoques que pueden ayudar a abordar esta limitación.

Un enfoque consiste en aplicar un diseño inteligente de los experimentos. Por un lado, cubrir el espacio de parámetros del proceso sigue siendo muy importante, mientras que los diseños óptimos para estos modelos mecanicistas ayudan a garantizar que se proporcione suficiente soporte de datos donde la información es más relevante. Por otro lado, la optimización bayesiana mecanicistamente informada podría ser un primer paso para cubrir rápidamente el dominio experimental, mientras que se mantiene la precaución con respecto a la cobertura adecuada del dominio.

Otra solución es el uso del Diseño Intensificado de Experimentos (iDoE), que introduce cambios deliberados en los parámetros del proceso dentro de un solo experimento (por ejemplo, el funcionamiento del biorreactor). Esta estrategia condensa de manera efectiva múltiples combinaciones convencionales de DoE en un número menor de ejecuciones experimentales, maximizando así la información obtenida por experimento.

Por último, una estrategia más ambiciosa pero muy prometedora consiste en aprovechar los gemelos digitales previamente entrenados. En este escenario, el modelo híbrido primero se entrenaría previamente en miles de conjuntos de datos experimentales agregados de varias fuentes, de manera similar a cómo se desarrollan grandes modelos de lenguaje como ChatGPT. Luego, los usuarios podrían usar y mejorar el modelo utilizando sus propios datos de entrenamiento limitados, mejorando continuamente su rendimiento para todos los involucrados, lo que en última instancia beneficia tanto a los usuarios como a los pacientes. Para proteger los datos propietarios, la plataforma implementaría el aprendizaje federado, un enfoque que preserva la privacidad y permite a los usuarios mejorar el gemelo digital de forma colaborativa. Este método garantiza que los datos experimentales individuales permanezcan confidenciales y nunca se compartan directamente entre los usuarios, al tiempo que contribuye a un modelo colectivo en constante mejora.

 Continuaremos explorando el potencial del gemelo digital y las metodologías estadísticas para respaldar mejores predicciones, incluido el uso de iDoE y diseños óptimos bayesianos. 


Nota: Los resultados se generaron con la asistencia de BioWin ASBL y el apoyo financiero de la Región, de acuerdo con las disposiciones del Acuerdo de Subvención (Convenio 8881 ATMP Thérapie cellulaire).
*Fuentes que continúan a continuación

Sobre el autor:

Thomas de Marchin es director asociado de Estadística y Ciencia de Datos en Cencora, donde aplica metodologías estadísticas avanzadas y algoritmos de aprendizaje automático para optimizar el descubrimiento de fármacos y la eficiencia de la fabricación. Con una amplia experiencia en el cumplimiento normativo, en particular en las normas de la FDA y las GMP, cierra la brecha entre los enfoques analíticos complejos y las aplicaciones farmacéuticas prácticas.


Descargo de responsabilidad:
La información proporcionada en este artículo no constituye asesoramiento legal. Cencora, Inc. recomienda encarecidamente a los lectores que revisen la información disponible relacionada con los temas tratados y que confíen en su propia experiencia y conocimientos para tomar decisiones al respecto.

 


Conecte con nuestro equipo

Nuestro equipo de expertos líderes en valor se dedica a transformar las pruebas, los conocimientos sobre políticas y la inteligencia de mercado en estrategias efectivas de acceso al mercado global. Permítanos ayudarle a navegar con confianza por el complejo panorama de la atención sanitaria actual. Póngase en contacto con nosotros para descubrir cómo podemos ayudarle en sus objetivos.

Fuentes:


1. Gemelos digitales: De la medicina personalizada a la salud pública de precisión, J Pers Med., julio de 2021. https://pubmed.ncbi.nlm.nih.gov/34442389/
2. Informe de investigación de la industria de biorreactores de perfusión 2025, Investigación y mercados. https://www.globenewswire.com/news-release/2025/10/09/3164326/28124/en/Perfusion-Bioreactors-Industry-Research-Report-2025-Biopharmaceutical-Growth-Drives-Demand-Amid-Cell-Culture-Advancements-Global-Forecast-to-2032.html
3. Modelos predictivos para el desarrollo de cultivos de células de mamíferos aguas arriba: una revisión, Digital Chemical Engineering, marzo de 2024. https://www.sciencedirect.com/science/article/pii/S2772508123000558
4. Modelado semiparamétrico híbrido en ingeniería de sistemas de procesos: Pasado, presente y futuro, Informática e Ingeniería Química, enero de 2014. https://www.sciencedirect.com/science/article/pii/S0098135413002639

 

Recursos relacionados

Artículo

A medida que avanza la adopción de eCTD 4.0, una nueva directriz de la ICH lo pone a prueba

Artículo

Nuevos caminos hacia el valor del producto: Estrategias para optimizar la cartera de productos maduros

Artículo

Preparación para el inserto electrónico para el paciente en Europa