Artikkel

Digitale tvillinger og hybridmodeller i biologisk produksjon: En sammenligning av modeller

  • Thomas de Marchin

Digital tvillingteknologi har potensial til å spille en transformerende rolle i legemiddelutvikling og produksjon. 

I vår første artikkel How Digital Twins and Hybrid Modelling Optimize Cell Culture Process for Better Production, introduserte vi vår visjon om digitale tvillinger for bioprosesser som virtuelle replikaer som kombinerer datadrevne og mekanistiske modeller for å optimalisere produksjonen av biologiske produkter. Vi viste hvordan hybridmodeller kan støtte sanntidsoptimalisering, oppskalering og overholdelse av regelverk. Digitale tvillinger er spesielt avgjørende for personlig medisin og celle- og genterapier, da de muliggjør tilpasningsdyktig produksjon av små partier skreddersydd for individualiserte behandlinger.1

I denne andre artikkelen setter vi teori ut i livet ved å sammenligne en klassisk datadrevet modell med en hybridmodell for å forutsi levedyktig celletetthet (VCD) og produktakkumulering – nøkkelparametere for produktivitet – i en perfusjonsbioreaktor.

Vi demonstrerer hvordan digitale tvillinger gjør det mulig for innovatører å svare på spørsmål som:

  • Hvordan kan vi identifisere optimale forhold for å maksimere cellevekst og produktivitet?
  • Når bør vi sette i gang perfusjon og justere fôrstrategier for å unngå substratutarming og celletetthetskollaps?
  • Kan vi oppdage tidlige tegn på ustabilitet og forutsi parametere som er vanskelige å måle som substratkonsentrasjon i bioreaktoren?
Figur 1: Illustrasjon av en perfusjonsbioreaktor

Casestudie: Perfusjon Bioreaktor cellekulturmodellering

Figur 1: Illustrasjon av en perfusjonsbioreaktor
I en perfusjonsbioreaktor tilføres cellene kontinuerlig ferske næringsstoffer mens avfall og produkt fjernes, men selve cellene beholdes. Dette skaper et stabilt, næringsrikt miljø der cellene kan trives i lange perioder, noe som fører til høyere celletetthet og økt produktivitet. Perfusjonsbioreaktorer brukes mye til produksjon av biologiske legemidler.2

Modelleringsattributter som levedyktig celletetthet (VCD) eller produktakkumulering sammen med prosessparametere som substratkonsentrasjon, temperatur eller agitasjon ved hjelp av prediktive modeller er et avgjørende skritt i karakterisering av legemiddelprosesser.3
Figur 1: Illustrasjon av en perfusjonsbioreaktor
Klassisk bioreaktormodellering er vanligvis avhengig av rent datadrevne tilnærminger, der enkle matematiske funksjoner (som linjer eller kurver) er tilpasset eksperimentelle data for å lage prediksjoner.3 Selv om denne metoden er enkel og beregningseffektiv, klarer den ofte ikke å fange opp de underliggende biologiske eller fysiske mekanismene som driver systemet. Som et resultat gir det begrenset innsikt i hvorfor spesifikke resultater oppstår og sliter med å generalisere utover treningsdataområdet.

Videre møter datadrevne metoder utfordringer når de håndterer komplekse systemer som involverer mange prosessparametere og begrensede eksperimentelle data, noe som er vanlig i legemiddelutvikling. Mekanistiske eller hybride modeller løser noen av disse problemene ved å inkorporere tidligere prosesskunnskap i form av biologiske og fysiske lover.4 Derfor, mens klassiske datadrevne modeller fungerer som et nyttig utgangspunkt, tror vi at integrering av mekanistisk kunnskap gjennom hybride tilnærminger forbedrer prediktiv kraft og legger til rette for bedre prosessoptimalisering i bioreaktorer.
Vi utviklet en hybridmodell som integrerer mekanistisk kunnskap – som næringsforbruk og metabolske veier – med datadrevne maskinlæringskomponenter som fanger opp komplekse eller dårlig forståtte aspekter. Den mekanistiske delen gir et solid grunnlag av tidligere prosesskunnskap, mens maskinlæringskomponenten modellerer ukjent atferd. Hybridmodeller gir forbedret robusthet i ekstrapolering og kan nøyaktig fange opp dynamisk atferd som endringer i celleveksthastigheter og næringsopptak under varierende forhold.  Selv om de er mer komplekse å utvikle, kan de redusere behovet for omfattende eksperimentering og muliggjøre gjenbruk av eksisterende modeller på tvers av produkter. De utmerker seg også i sanntidsoptimalisering, prediktiv oppskalering og overholdelse av regelverk ved å forbedre prosessforståelsen under karakterisering (FDA trinn 1) og støtte utvikling av sanntidskontrollgrenser for spesifikke partier (FDA trinn 3).

Vår hybridmodell tar prosessparametere som input og forutsier biologiske variabler som hastigheter, avlinger og platånivåer for biomasse og produktdannelse. Disse forutsagte parametrene blir deretter matet inn i et system av ordinære differensialligninger (ODE), som beregner de dynamiske responsene til bioreaktoren over tid. Figur 2 illustrerer de viktigste trinnene i både den klassiske rent datadrevne tilnærmingen og den hybride tilnærmingen.
Figur 2: Sammenligning av datadrevne og hybride modeller
For å evaluere begge tilnærmingene simulerte vi 29 eksperimenter som varierte temperatur (20–40 °C) og agitasjonshastighet (150–350 rpm), og fanget opp forskjellig dynamikk i biomassevekst, produktdannelse og glukoseforbruk over tid (figur 3). Modellen ble trent på 21 eksperimenter. Ytelsen ble deretter testet på to sett med fire usette eksperimenter: ett sett innenfor treningsdomenet (test1) for å vurdere interpolasjonsevne, og et annet utenfor dette domenet (test2) for å evaluere ekstrapolering og generalisering.

Bilde av ressursartikkel for digitale tvillinger

Figur 3: Eksperimentelt domene for dataene som brukes til å trene og teste modellene. Test 1 datasett ligger innenfor det eksperimentelle domenet til treningsdatasettet, mens test 2 datasett ligger utenfor.
Figur 4 og figur 5 viser prediksjonene på de to testdatasettene. Vi kan se at hybridmodellen (grønn) passer bedre til dataene (røde punkter) enn den klassiske tilnærmingen (blå). Dette er også vist i figur 6 som viser Root Mean Square Error (RMSE), et vanlig mål på prediksjonsnøyaktighet som kvantifiserer den gjennomsnittlige forskjellen mellom forutsagte og observerte verdier. Jo mindre RMSE, jo bedre er modellens prediktive ytelse. Hybridmodellen oppnår konsekvent lavere RMSE enn den klassiske tilnærmingen i begge domener. Dette indikerer at hybridmodellen generaliserer bedre og gir mer nøyaktige prediksjoner, selv når den ekstrapolerer utover treningsforholdene.
Bilde av ressursartikkel for digitale tvillinger

Figur 4: Data (rød) og prediksjoner ved hjelp av hybridmodellen (grønn) og klassisk (blå) tilnærming for datasettet innenfor det eksperimentelle domenet.
Bilde av ressursartikkel for digitale tvillinger

Figur 5: Data (rød) og prediksjoner etter hybridmodellen (grønn) og klassisk (blå) tilnærming for datasettet utenfor eksperimentelt domene.
Bilde av ressursartikkel for digitale tvillinger

Figur 6: Prediktiv ytelsessammenligning av klassiske og hybride modelleringstilnærminger målt ved RMSE (root mean square error). Lavere RMSE-verdier indikerer bedre prediktiv nøyaktighet.

Som vår casestudie viser, passer hybridmodeller ikke bare innenfor treningsdomenet, men viser også langt større robusthet når de ekstrapolerer til nye forhold – en viktig funksjon for legemiddelproduksjon i den virkelige verden. Dette viser tydelig overlegenheten til slik modellering i forhold til ofte brukte klassiske tilnærminger.

Historisk sett krevde det spesialisert kunnskap innen matematikk og datavitenskap å lage og montere hybridmodeller, noe som begrenset tilgjengeligheten på tvers av mange selskaper. Dette landskapet er imidlertid i endring med bruken av brukervennlige applikasjoner som TwinLab, vist i figur 7. Vi opprettet denne applikasjonen for å la brukere uten dyp teknisk ekspertise enkelt utforske ulike prosessscenarier og forutsi resultater. Slike verktøy gjør avansert hybridmodellering praktisk og handlingsdyktig, og støtter forskere og ingeniører i bioprosessutvikling ved å integrere mekanistisk kunnskap med datadrevet innsikt gjennom intuitive grensesnitt.
Figur 7: Simuleringsapplikasjon som muliggjør scenarioanalyse ved å variere viktige prosessparametere, inkludert omrøringshastighet, temperatur, fortynningshastighet, substratkonsentrasjon i fôret og initial frøkonsentrasjon. Disse inngangene behandles av en hybridmodell som forutsier tidsforløpene for levedyktig celletetthet (VCD), produktdannelse og substratforbruk.
Selv med en hybridmodell er ikke prediksjonsnøyaktigheten perfekt, og å kreve 21 prøver for opplæring kan utgjøre en barriere – spesielt for små bioteknologiselskaper som ikke lett kan generere dette volumet av data av høy kvalitet. Flere tilnærminger kan bidra til å løse denne begrensningen.

En tilnærming er å bruke smart design av eksperimenter. På den ene siden er det fortsatt svært viktig å dekke prosessparameterrommet, mens optimale design for slike mekanistiske modeller bidrar til å sikre at det gis nok datastøtte der informasjonen er mest relevant. På den annen side kan mekanistisk informert Bayesiansk optimalisering være et første skritt for raskt å dekke det eksperimentelle domenet, mens forsiktigheten fortsatt er med hensyn til riktig dekning av domenet.

En annen løsning er bruken av Intensified Design of Experiments (iDoE), som introduserer bevisste endringer i prosessparametere innenfor et enkelt eksperiment (f.eks. bioreaktorkjøring). Denne strategien kondenserer effektivt flere konvensjonelle DoE-kombinasjoner til et mindre antall eksperimentelle kjøringer, og maksimerer dermed informasjonen som oppnås per eksperiment.

Til slutt, en mer ambisiøs, men svært lovende strategi innebærer å utnytte forhåndstrente digitale tvillinger. I dette scenariet vil hybridmodellen først bli forhåndstrent på tusenvis av eksperimentelle datasett samlet fra ulike kilder, på samme måte som store språkmodeller som ChatGPT utvikles. Brukere kan deretter bruke og forbedre modellen ved å bruke sine egne begrensede treningsdata, og kontinuerlig forbedre ytelsen for alle involverte – til slutt til fordel for både brukere og pasienter. For å beskytte proprietære data vil plattformen distribuere føderert læring, en personvernbevarende tilnærming som gjør det mulig for brukere å forbedre den digitale tvillingen i samarbeid. Denne metoden sikrer at individuelle eksperimentelle data forblir konfidensielle og aldri deles direkte mellom brukere, samtidig som den bidrar til en stadig bedre kollektiv modell.

 Vi vil fortsette å utforske potensialet til den digitale tvillingen og statistiske metoder for å støtte bedre prediksjoner, inkludert bruk av iDoE og Bayesianske optimale design. 


Notat: Resultatene ble generert med hjelp fra BioWin ASBL og økonomisk støtte fra regionen, i samsvar med bestemmelsene i tilskuddsavtalen (konvensjon 8881 ATMP Thérapie cellulaire).
*Kildene fortsetter nedenfor

Om forfatteren:

Thomas de Marchin er assisterende direktør for statistikk og datavitenskap hos Cencora, hvor han bruker avanserte statistiske metoder og maskinlæringsalgoritmer for å optimalisere legemiddeloppdagelse og produksjonseffektivitet. Med dyp ekspertise innen overholdelse av regelverk – spesielt FDA- og GMP-standarder – bygger han bro mellom komplekse analytiske tilnærminger og praktiske farmasøytiske anvendelser.


Ansvarserklæring:
Informasjonen i denne artikkelen utgjør ikke juridisk rådgivning. Cencora, Inc. oppfordrer leserne på det sterkeste til å gjennomgå tilgjengelig informasjon relatert til emnene som diskuteres og stole på sin egen erfaring og ekspertise når de tar beslutninger relatert til dette.

 


Ta kontakt med teamet vårt

Vårt team av ledende verdieksperter arbeider iherdig med å omsette bevis, policy-innsikt og markedsinformasjon til effektive tilgangsstrategier for det globale markedet. Vi hjelper deg med å finne frem i dagens komplekse helsetjenester. Kontakt oss, så hjelper vi deg med å nå målene dine.

Kilder:


1. Digitale tvillinger: Fra personlig medisin til presisjonsfolkehelse, J Pers Med., juli 2021. https://pubmed.ncbi.nlm.nih.gov/34442389/
2. Perfusjonsbioreaktorindustriens forskningsrapport 2025, forskning og markeder. https://www.globenewswire.com/news-release/2025/10/09/3164326/28124/en/Perfusion-Bioreactors-Industry-Research-Report-2025-Biopharmaceutical-Growth-Drives-Demand-Amid-Cell-Culture-Advancements-Global-Forecast-to-2032.html
3. Prediktive modeller for oppstrøms utvikling av pattedyrcellekultur - En gjennomgang, Digital Chemical Engineering, mars 2024. https://www.sciencedirect.com/science/article/pii/S2772508123000558
4. Hybrid semi-parametrisk modellering i prosesssystemteknikk: Fortid, nåtid og fremtid, Datamaskiner og kjemiteknikk, januar 2014. https://www.sciencedirect.com/science/article/pii/S0098135413002639

 

Relaterte ressurser

Artikkel

Etter hvert som eCTD 4.0-adopsjonen går fremover, setter en ny ICH-retningslinje den på prøve

Artikkel

Nye veier til produktverdi: Strategier for å optimalisere den modne produktporteføljen

Artikkel

Klargjøring av elektronisk pasientinnlegg i Europa