Gemelos digitales y modelos híbridos en la producción de productos biológicos: Una comparación de modelos
La tecnología de gemelos digitales tiene el potencial de desempeñar un papel transformador en el desarrollo y la fabricación de fármacos.
En este segundo artículo, ponemos en práctica la teoría comparando un modelo clásico basado en datos con un modelo híbrido para predecir la densidad celular viable (VCD) y la acumulación de productos, parámetros clave de la productividad, en un biorreactor de perfusión.
Demostramos cómo los gemelos digitales permiten a los innovadores responder a preguntas como:
- ¿Cómo podemos identificar las condiciones óptimas para maximizar el crecimiento y la productividad celular?
- ¿Cuándo debemos iniciar la perfusión y ajustar las estrategias de alimentación para evitar el agotamiento del sustrato y el colapso de la densidad celular?
- ¿Podemos detectar signos tempranos de inestabilidad y predecir parámetros difíciles de medir, como la concentración de sustrato en el biorreactor?
Estudio de casos: Modelado de cultivos celulares de biorreactores de perfusión
Modelar atributos como la densidad celular viable (VCD) o la acumulación de productos junto con parámetros de proceso como la concentración de sustrato, la temperatura o la agitación mediante modelos predictivos es un paso crucial en la caracterización de procesos farmacológicos.3
Además, los métodos basados en datos se enfrentan a desafíos cuando se trata de sistemas complejos que involucran numerosos parámetros de proceso y datos experimentales limitados, lo cual es común en el desarrollo de fármacos. Los modelos mecanicistas o híbridos resuelven algunos de estos problemas incorporando el conocimiento previo del proceso en forma de leyes biológicas y físicas. 4 Por lo tanto, si bien los modelos clásicos basados en datos sirven como un punto de partida útil, creemos que la integración del conocimiento mecanicista a través de enfoques híbridos mejora el poder predictivo y facilita una mejor optimización del proceso en los biorreactores.
Nuestro modelo híbrido toma los parámetros del proceso como insumos y predice variables biológicas como tasas, rendimientos y niveles de meseta para la formación de biomasa y productos. Estos parámetros predichos se introducen en un sistema de ecuaciones diferenciales ordinarias (ODE), que calculan las respuestas dinámicas del biorreactor a lo largo del tiempo. La figura 2 ilustra los pasos clave tanto del enfoque clásico puramente basado en datos como del enfoque híbrido.
Figura 3: Dominio experimental de los datos utilizados para entrenar y probar los modelos. El conjunto de datos de la prueba 1 se encuentra dentro del dominio experimental del conjunto de datos de entrenamiento, mientras que el conjunto de datos de la prueba 2 se encuentra fuera.

Figura 4: Datos (rojo) y predicciones mediante el modelo híbrido (verde) y el enfoque clásico (azul) para el conjunto de datos dentro del dominio experimental.

Figura 5: Datos (rojo) y predicciones mediante el modelo híbrido (verde) y el enfoque clásico (azul) para el conjunto de datos del dominio experimental externo.

Figura 6: Comparación predictiva del rendimiento de los enfoques de modelización clásicos e híbridos medidos por RMSE (error cuadrático medio). Los valores RMSE más bajos indican una mejor precisión predictiva.
Históricamente, la creación y adaptación de modelos híbridos requería conocimientos especializados en matemáticas y ciencia de datos, lo que limitaba su accesibilidad en muchas empresas. Sin embargo, este panorama está cambiando con la llegada de aplicaciones fáciles de usar como TwinLab, que se muestra en la Figura 7. Creamos esta aplicación para permitir a los usuarios sin conocimientos técnicos profundos explorar fácilmente diferentes escenarios de procesos y predecir resultados. Estas herramientas hacen que el modelado híbrido avanzado sea práctico y procesable, apoyando a los científicos e ingenieros en el desarrollo de bioprocesos mediante la integración del conocimiento mecanicista con la información basada en datos a través de interfaces intuitivas.
Un enfoque consiste en aplicar un diseño inteligente de los experimentos. Por un lado, cubrir el espacio de parámetros del proceso sigue siendo muy importante, mientras que los diseños óptimos para estos modelos mecanicistas ayudan a garantizar que se proporcione suficiente soporte de datos donde la información es más relevante. Por otro lado, la optimización bayesiana mecanicistamente informada podría ser un primer paso para cubrir rápidamente el dominio experimental, mientras que se mantiene la precaución con respecto a la cobertura adecuada del dominio.
Otra solución es el uso del Diseño Intensificado de Experimentos (iDoE), que introduce cambios deliberados en los parámetros del proceso dentro de un solo experimento (por ejemplo, el funcionamiento del biorreactor). Esta estrategia condensa de manera efectiva múltiples combinaciones convencionales de DoE en un número menor de ejecuciones experimentales, maximizando así la información obtenida por experimento.
Por último, una estrategia más ambiciosa pero muy prometedora consiste en aprovechar los gemelos digitales previamente entrenados. En este escenario, el modelo híbrido primero se entrenaría previamente en miles de conjuntos de datos experimentales agregados de varias fuentes, de manera similar a cómo se desarrollan grandes modelos de lenguaje como ChatGPT. Luego, los usuarios podrían usar y mejorar el modelo utilizando sus propios datos de entrenamiento limitados, mejorando continuamente su rendimiento para todos los involucrados, lo que en última instancia beneficia tanto a los usuarios como a los pacientes. Para proteger los datos propietarios, la plataforma implementaría el aprendizaje federado, un enfoque que preserva la privacidad y permite a los usuarios mejorar el gemelo digital de forma colaborativa. Este método garantiza que los datos experimentales individuales permanezcan confidenciales y nunca se compartan directamente entre los usuarios, al tiempo que contribuye a un modelo colectivo en constante mejora.
Continuaremos explorando el potencial del gemelo digital y las metodologías estadísticas para respaldar mejores predicciones, incluido el uso de iDoE y diseños óptimos bayesianos.
Nota: Los resultados se generaron con la asistencia de BioWin ASBL y el apoyo financiero de la Región, de acuerdo con las disposiciones del Acuerdo de Subvención (Convenio 8881 ATMP Thérapie cellulaire).
Sobre el autor:
Descargo de responsabilidad:
La información proporcionada en este artículo no constituye asesoramiento legal. Cencora, Inc. recomienda encarecidamente a los lectores que revisen la información disponible relacionada con los temas tratados y que confíen en su propia experiencia y conocimientos para tomar decisiones al respecto.
Conecte con nuestro equipo
Fuentes:
1. Gemelos digitales: De la medicina personalizada a la salud pública de precisión, J Pers Med., julio de 2021. https://pubmed.ncbi.nlm.nih.gov/34442389/
2. Informe de investigación de la industria de biorreactores de perfusión 2025, Investigación y mercados. https://www.globenewswire.com/news-release/2025/10/09/3164326/28124/en/Perfusion-Bioreactors-Industry-Research-Report-2025-Biopharmaceutical-Growth-Drives-Demand-Amid-Cell-Culture-Advancements-Global-Forecast-to-2032.html
3. Modelos predictivos para el desarrollo de cultivos de células de mamíferos aguas arriba: una revisión, Digital Chemical Engineering, marzo de 2024. https://www.sciencedirect.com/science/article/pii/S2772508123000558
4. Modelado semiparamétrico híbrido en ingeniería de sistemas de procesos: Pasado, presente y futuro, Informática e Ingeniería Química, enero de 2014. https://www.sciencedirect.com/science/article/pii/S0098135413002639
