Artikel

Digitale tweelingen en hybride modellen in de productie van biologische geneesmiddelen: Een modelvergelijking

  • Thomas de Marchin

Digital twin-technologie heeft het potentieel om een transformerende rol te spelen bij de ontwikkeling en productie van geneesmiddelen. 

In ons eerste artikel How Digital Twins and Hybrid Modelling Optimize Cell Culture Process for Better Production introduceerden we onze visie op digital twins voor bioprocessen als virtuele replica's die datagestuurde en mechanistische modellen combineren om de productie van biologische geneesmiddelen te optimaliseren. We hebben laten zien hoe hybride modellen real-time optimalisatie, opschaling en naleving van de regelgeving kunnen ondersteunen. Digitale tweelingen zijn vooral cruciaal voor gepersonaliseerde geneeskunde en cel- en gentherapieën, omdat ze een aanpasbare productie van kleine batches mogelijk maken die zijn afgestemd op geïndividualiseerde behandelingen.1

In dit tweede artikel brengen we de theorie in de praktijk door een klassiek datagedreven model te vergelijken met een hybride model voor het voorspellen van levensvatbare celdichtheid (VCD) en productaccumulatie – belangrijke parameters van productiviteit – in een perfusiebioreactor.

We laten zien hoe digital twins innovators in staat stellen om vragen te beantwoorden zoals:

  • Hoe kunnen we optimale omstandigheden identificeren voor het maximaliseren van celgroei en productiviteit?
  • Wanneer moeten we perfusie initiëren en voerstrategieën aanpassen om uitputting van het substraat en ineenstorting van de celdichtheid te voorkomen?
  • Kunnen we vroege tekenen van instabiliteit detecteren en moeilijk te meten parameters voorspellen, zoals de substraatconcentratie in de bioreactor?
Figuur 1: Illustratie van een perfusiebioreactor

Casestudy: Perfusie Bioreactor celcultuur modellering

Figuur 1: Illustratie van een perfusiebioreactor
In een perfusiebioreactor worden cellen continu voorzien van verse voedingsstoffen terwijl afval en product worden verwijderd, maar de cellen zelf worden vastgehouden. Dit creëert een stabiele, voedselrijke omgeving waar cellen gedurende lange perioden kunnen gedijen, wat leidt tot hogere celdichtheden en verhoogde productiviteit. Perfusiebioreactoren worden op grote schaal gebruikt voor de productie van biologische geneesmiddelen.2

Het modelleren van attributen zoals levensvatbare celdichtheid (VCD) of productaccumulatie naast procesparameters zoals substraatconcentratie, temperatuur of agitatie met behulp van voorspellende modellen is een cruciale stap in de karakterisering van geneesmiddelenprocessen.3
Figuur 1: Illustratie van een perfusiebioreactor
Klassieke bioreactormodellering is doorgaans gebaseerd op puur datagestuurde benaderingen, waarbij eenvoudige wiskundige functies (zoals lijnen of krommen) worden aangepast aan experimentele gegevens om voorspellingen te doen. 3 Hoewel deze methode eenvoudig en rekenkundig efficiënt is, slaagt het er vaak niet in om de onderliggende biologische of fysische mechanismen vast te leggen die het systeem aansturen. Als gevolg hiervan geeft het beperkt inzicht in waarom specifieke resultaten optreden en heeft het moeite om te generaliseren buiten het bereik van de trainingsgegevens.

Bovendien worden datagestuurde methoden geconfronteerd met uitdagingen bij het omgaan met complexe systemen met tal van procesparameters en beperkte experimentele gegevens, wat gebruikelijk is bij de ontwikkeling van geneesmiddelen. Mechanistische of hybride modellen lossen sommige van deze problemen op door voorafgaande proceskennis op te nemen in de vorm van biologische en fysische wetten. 4 Hoewel klassieke datagestuurde modellen als een nuttig startpunt dienen, geloven we dat het integreren van mechanistische kennis door middel van hybride benaderingen het voorspellend vermogen vergroot en een betere procesoptimalisatie in bioreactoren mogelijk maakt.
We hebben een hybride model ontwikkeld dat mechanistische kennis - zoals nutriëntenconsumptie en metabole routes - integreert met datagestuurde machine learning-componenten die complexe of slecht begrepen aspecten vastleggen. Het mechanistische deel biedt een solide basis van eerdere proceskennis, terwijl de machine learning-component onbekend gedrag modelleert. Hybride modellen bieden verbeterde robuustheid in extrapolatie en kunnen dynamisch gedrag nauwkeurig vastleggen, zoals veranderingen in celgroeisnelheden en opname van voedingsstoffen onder verschillende omstandigheden.  Hoewel ze complexer zijn om te ontwikkelen, kunnen ze de noodzaak van uitgebreide experimenten verminderen en hergebruik van bestaande modellen in verschillende producten mogelijk maken. Ze blinken ook uit in real-time optimalisatie, voorspellende opschaling en naleving van de regelgeving door het procesbegrip tijdens karakterisering te verbeteren (FDA Stage 1) en de ontwikkeling van real-time controlelimieten voor specifieke batches te ondersteunen (FDA Stage 3).

Ons hybride model neemt procesparameters als input en voorspelt biologische variabelen zoals snelheden, opbrengsten en plateauniveaus voor biomassa en productvorming. Deze voorspelde parameters worden vervolgens ingevoerd in een systeem van gewone differentiaalvergelijkingen (ODE's), die de dynamische reacties van de bioreactor in de loop van de tijd berekenen. Figuur 2 illustreert de belangrijkste stappen van zowel de klassieke puur datagedreven aanpak als de hybride aanpak.
Figuur 2: Vergelijking van datagedreven en hybride modellen
Om beide benaderingen te evalueren, hebben we 29 experimenten gesimuleerd met verschillende temperaturen (20-40 °C) en roersnelheid (150-350 tpm), waarbij we verschillende dynamieken van biomassagroei, productvorming en glucoseconsumptie in de loop van de tijd vastlegden (Figuur 3). Het model is getraind op 21 experimenten. De prestaties werden vervolgens getest op twee sets van vier ongeziene experimenten: een set binnen het trainingsdomein (test1) om het interpolatievermogen te beoordelen, en een andere buiten dit domein (test2) om extrapolatie en generalisatie te evalueren.

Digitale tweelingen bron artikel afbeelding

Figuur 3: Experimenteel domein van de gegevens die worden gebruikt om de modellen te trainen en te testen. De dataset van test 1 ligt binnen het experimentele domein van de trainingsdataset, terwijl de dataset van test 2 daarbuiten ligt.
Figuur 4 en figuur 5 tonen de voorspellingen op de twee testdatasets. We kunnen zien dat het hybride model (groen) beter aansluit bij de data (rode punten) dan de klassieke benadering (blauw). Dit wordt ook weergegeven in figuur 6 die de Root Mean Square Error (RMSE) laat zien, een veelgebruikte maatstaf voor voorspellingsnauwkeurigheid die het gemiddelde verschil tussen voorspelde en waargenomen waarden kwantificeert. Hoe kleiner de RMSE, hoe beter de voorspellende prestaties van het model. Het hybride model behaalt in beide domeinen een consistent lagere RMSE dan de klassieke benadering. Dit geeft aan dat het hybride model beter generaliseert en nauwkeurigere voorspellingen doet, zelfs wanneer het buiten de trainingsomstandigheden extrapoleert.
Digitale tweelingen bron artikel afbeelding

Figuur 4: Data (rood) en voorspellingen door het hybride model (groen) en de klassieke (blauw) benadering voor de binnen het experimentele domein dataset.
Digitale tweelingen bron artikel afbeelding

Figuur 5: Data (rood) en voorspellingen door het hybride model (groen) en de klassieke (blauw) benadering voor de externe experimentele domein dataset.
Digitale tweelingen bron artikel afbeelding

Figuur 6: Voorspellende prestatievergelijking van klassieke en hybride modelleringsbenaderingen gemeten door RMSE (root mean square error). Lagere RMSE-waarden duiden op een betere voorspellende nauwkeurigheid.

Zoals onze casestudy laat zien, passen hybride modellen niet alleen binnen het trainingsdomein, maar vertonen ze ook een veel grotere robuustheid bij het extrapoleren naar nieuwe omstandigheden - een essentieel kenmerk voor de productie van geneesmiddelen in de echte wereld. Dit toont duidelijk de superioriteit van dergelijke modellering ten opzichte van veelgebruikte klassieke benaderingen.

Historisch gezien vereiste het maken en aanpassen van hybride modellen gespecialiseerde kennis in wiskunde en datawetenschap, wat hun toegankelijkheid in veel bedrijven beperkte. Dit landschap is echter aan het veranderen met de komst van gebruiksvriendelijke applicaties zoals TwinLab, weergegeven in figuur 7. We hebben deze applicatie gemaakt om gebruikers zonder diepgaande technische expertise in staat te stellen eenvoudig verschillende processcenario's te verkennen en resultaten te voorspellen. Dergelijke tools maken geavanceerde hybride modellering praktisch en bruikbaar en ondersteunen wetenschappers en ingenieurs bij de ontwikkeling van bioprocessen door mechanistische kennis te integreren met datagestuurde inzichten via intuïtieve interfaces.
Figuur 7: Simulatietoepassing die scenarioanalyse mogelijk maakt door de belangrijkste procesparameters te variëren, waaronder roersnelheid, temperatuur, verdunningssnelheid, substraatconcentratie in het voer en initiële zaadconcentratie. Deze inputs worden verwerkt door een hybride model dat het tijdsverloop van levensvatbare celdichtheid (VCD), productvorming en substraatconsumptie voorspelt.
Zelfs met een hybride model is de voorspellingsnauwkeurigheid niet perfect, en het vereisen van 21 monsters voor training kan een barrière vormen - vooral voor kleine biotechbedrijven die deze hoeveelheid gegevens van hoge kwaliteit niet gemakkelijk kunnen genereren. Verschillende benaderingen kunnen helpen deze beperking aan te pakken.

Een benadering is om slim ontwerp van experimenten toe te passen. Aan de ene kant blijft het afdekken van de procesparameterruimte erg belangrijk, terwijl optimale ontwerpen voor dergelijke mechanistische modellen helpen om ervoor te zorgen dat er voldoende gegevensondersteuning wordt geboden waar de informatie het meest relevant is. Aan de andere kant zou mechanistisch geïnformeerde Bayesiaanse optimalisatie een eerste stap kunnen zijn om snel het experimentele domein te bestrijken, terwijl voorzichtigheid geboden blijft met betrekking tot de juiste dekking van het domein.

Een andere oplossing is het gebruik van Intensified Design of Experiments (iDoE), dat opzettelijke verschuivingen in procesparameters introduceert binnen een enkel experiment (bijv. bioreactorrun). Deze strategie condenseert effectief meerdere conventionele DoE-combinaties in een kleiner aantal experimentele runs, waardoor de verkregen informatie per experiment wordt gemaximaliseerd.

Ten slotte is een ambitieuzere maar veelbelovende strategie het gebruik van vooraf getrainde digitale tweelingen. In dit scenario zou het hybride model eerst vooraf worden getraind op duizenden experimentele datasets die uit verschillende bronnen zijn geaggregeerd, vergelijkbaar met hoe grote taalmodellen zoals ChatGPT worden ontwikkeld. Gebruikers kunnen het model vervolgens gebruiken en verbeteren met behulp van hun eigen beperkte trainingsgegevens, waardoor de prestaties voor alle betrokkenen voortdurend worden verbeterd, wat uiteindelijk zowel gebruikers als patiënten ten goede komt. Om bedrijfseigen gegevens te beschermen, zou het platform federated learning inzetten, een privacybeschermende aanpak waarmee gebruikers de digitale tweeling samen kunnen verbeteren. Deze methode zorgt ervoor dat individuele experimentele gegevens vertrouwelijk blijven en nooit rechtstreeks tussen gebruikers worden gedeeld, terwijl ze toch bijdragen aan een steeds beter collectief model.

 We zullen het potentieel van de digitale tweeling en statistische methodologieën blijven onderzoeken om betere voorspellingen te ondersteunen, waaronder het gebruik van iDoE en Bayesiaanse optimale ontwerpen. 


Notitie: De resultaten werden gegenereerd met de hulp van BioWin ASBL en de financiële steun van het Gewest, in overeenstemming met de bepalingen van de subsidieovereenkomst (conventie 8881 ATMP Thérapie cellulaire).
*Bronnen worden hieronder vervolgd

Over de auteur:

Thomas de Marchin is Associate Director of Statistics and Data Science bij Cencora, waar hij geavanceerde statistische methodologieën en machine learning-algoritmen toepast om de ontdekking van geneesmiddelen en de productie-efficiëntie te optimaliseren. Met diepgaande expertise op het gebied van naleving van regelgeving - met name FDA- en GMP-normen - overbrugt hij de kloof tussen complexe analytische benaderingen en praktische farmaceutische toepassingen.


Disclaimer:
De informatie in dit artikel vormt geen juridisch advies. Cencora, Inc. raadt lezers ten zeerste aan om de beschikbare informatie met betrekking tot de besproken onderwerpen door te nemen en te vertrouwen op hun eigen ervaring en expertise bij het nemen van beslissingen met betrekking tot deze onderwerpen.

 


Neem contact op met ons team

Ons ervaren team van waarde-experts creëert op basis van bewijsmateriaal, beleidsinzichten en marktinformatie effectieve strategieën voor toegang tot wereldwijde markten. We maken u wegwijs in de complexe wereld van de gezondheidszorg in verschillende delen van de wereld. Neem contact op om te ontdekken hoe we uw doelen kunnen ondersteunen.

Bronnen:


1. Digitale tweelingen: Van gepersonaliseerde geneeskunde tot precisie volksgezondheid, J Pers Med., juli 2021. https://pubmed.ncbi.nlm.nih.gov/34442389/
2. Perfusie Bioreactoren Industrie Onderzoeksrapport 2025, Onderzoek en Markten. https://www.globenewswire.com/news-release/2025/10/09/3164326/28124/en/Perfusion-Bioreactors-Industry-Research-Report-2025-Biopharmaceutical-Growth-Drives-Demand-Amid-Cell-Culture-Advancements-Global-Forecast-to-2032.html
3. Voorspellende modellen voor de ontwikkeling van stroomopwaartse celculturen van zoogdieren - Een overzicht, Digital Chemical Engineering, maart 2024. https://www.sciencedirect.com/science/article/pii/S2772508123000558
4. Hybride semi-parametrische modellering in processysteemtechniek: Verleden, heden en toekomst, Computers & Chemical Engineering, januari 2014. https://www.sciencedirect.com/science/article/pii/S0098135413002639

 

Gerelateerde bronnen

Artikel

Naarmate de adoptie van eCTD 4.0 vordert, stelt een nieuwe ICH-richtlijn het op de proef

Artikel

Nieuwe wegen naar productwaarde: Strategieën om het volwassen productportfolio te optimaliseren

Artikel

Voorbereiding op de elektronische patiëntenbijlage in Europa