Článek

Digitální dvojčata a hybridní modely ve výrobě biologických látek: Porovnání modelů

  • Thomas de Marchin

Technologie digitálních dvojčat má potenciál hrát transformační roli ve vývoji a výrobě léčiv. 

V našem prvním článku Jak digitální dvojčata a hybridní modelování optimalizují proces buněčných kultur pro lepší produkci jsme představili naši vizi digitálních dvojčat pro bioprocesy jako virtuálních replik, které kombinují modely založené na datech a mechanistické modely za účelem optimalizace výroby biologických látek. Ukázali jsme, jak mohou hybridní modely podporovat optimalizaci v reálném čase, škálování a dodržování předpisů. Digitální dvojčata jsou obzvláště důležitá pro personalizovanou medicínu a buněčné a genové terapie, protože umožňují adaptabilní výrobu malých šarží přizpůsobených individualizované léčbě.1

V tomto druhém článku převedeme teorii do praxe porovnáním klasického modelu založeného na datech s hybridním modelem pro predikci hustoty životaschopných buněk (VCD) a akumulace produktu – klíčových parametrů produktivity – v perfuzním bioreaktoru.

Ukazujeme, jak digitální dvojčata umožňují inovátorům odpovídat na otázky, jako jsou:

  • Jak můžeme identifikovat optimální podmínky pro maximalizaci buněčného růstu a produktivity?
  • Kdy bychom měli zahájit perfuzi a upravit krmné strategie, abychom zabránili vyčerpání substrátu a kolapsu buněčné hustoty?
  • Můžeme detekovat časné známky nestability a předpovědět těžko měřitelné parametry, jako je koncentrace substrátu v bioreaktoru?
Obrázek 1: Ilustrace perfuzního bioreaktoru

Případová studie: Modelování buněčných kultur perfuzního bioreaktoru

Obrázek 1: Ilustrace perfuzního bioreaktoru
V perfuzním bioreaktoru jsou buňky neustále zásobovány čerstvými živinami, zatímco odpad a produkt jsou odstraňovány, ale samotné buňky jsou zachovány. To vytváří stabilní prostředí bohaté na živiny, kde mohou buňky prospívat po dlouhou dobu, což vede k vyšší hustotě buněk a zvýšené produktivitě. Perfuzní bioreaktory jsou široce využívány pro výrobu biologických látek.2

Modelování atributů, jako je hustota životaschopných buněk (VCD) nebo akumulace produktu, spolu s procesními parametry, jako je koncentrace substrátu, teplota nebo míchání, pomocí prediktivních modelů, je zásadním krokem při charakterizaci procesů léčiv.3
Obrázek 1: Ilustrace perfuzního bioreaktoru
Klasické modelování bioreaktorů se obvykle spoléhá na přístupy založené čistě na datech, kde jsou jednoduché matematické funkce (jako přímky nebo křivky) přizpůsobeny experimentálním datům, aby bylo možné provádět předpovědi. 3 Ačkoli je tato metoda přímočará a výpočetně efektivní, často nedokáže zachytit základní biologické nebo fyzikální mechanismy, které systém pohánějí. V důsledku toho poskytuje omezený přehled o tom, proč dochází ke konkrétním výsledkům, a snaží se zobecnit mimo rozsah trénovacích dat.

Metody založené na datech navíc čelí výzvám při práci se složitými systémy zahrnujícími řadu procesních parametrů a omezená experimentální data, což je při vývoji léčiv běžné. Mechanistické nebo hybridní modely řeší některé z těchto problémů začleněním předchozích znalostí procesů ve formě biologických a fyzikálních zákonů. 4 Zatímco klasické modely založené na datech slouží jako užitečný výchozí bod, věříme, že integrace mechanistických znalostí prostřednictvím hybridních přístupů zvyšuje prediktivní sílu a usnadňuje lepší optimalizaci procesů v bioreaktorech.
Vyvinuli jsme hybridní model, který integruje mechanistické znalosti – jako je míra spotřeby živin a metabolické dráhy – s komponentami strojového učení založenými na datech, které zachycují složité nebo špatně pochopené aspekty. Mechanistická část poskytuje pevný základ předchozích znalostí procesů, zatímco komponenta strojového učení modeluje neznámé chování. Hybridní modely nabízejí zvýšenou robustnost při extrapolaci a mohou přesně zachytit dynamické chování, jako jsou změny v rychlosti růstu buněk a příjmu živin za různých podmínek.  I když jsou jejich vývoj složitější, mohou snížit potřebu rozsáhlého experimentování a umožnit opětovné použití stávajících modelů napříč produkty. Vynikají také v optimalizaci v reálném čase, prediktivním rozšiřování a dodržování předpisů tím, že zlepšují porozumění procesu během charakterizace (FDA fáze 1) a podporují vývoj kontrolních limitů v reálném čase pro konkrétní šarže (FDA fáze 3).

Náš hybridní model bere parametry procesu jako vstupy a předpovídá biologické proměnné, jako jsou rychlosti, výnosy a úrovně plošin pro tvorbu biomasy a produktů. Tyto předpovězené parametry jsou pak vloženy do systému obyčejných diferenciálních rovnic (ODE), které počítají dynamické odezvy bioreaktoru v čase. Obrázek 2 znázorňuje klíčové kroky jak klasického přístupu založeného čistě na datech, tak hybridního přístupu.
Obrázek 2: Porovnání modelů založených na datech a hybridních modelů
Pro vyhodnocení obou přístupů jsme simulovali 29 experimentů s různou teplotou (20–40 °C) a rychlostí míchání (150–350 ot./min), zachycujícími různou dynamiku růstu biomasy, tvorby produktu a spotřeby glukózy v čase (obrázek 3). Model byl trénován na 21 experimentech. Výkon byl poté testován na dvou sadách čtyř neviditelných experimentů: jedna sada v trénovací doméně (test1) pro posouzení schopnosti interpolace a druhá mimo tuto doménu (test2) pro vyhodnocení extrapolace a zobecnění.

Obrázek článku o zdrojích digitálních dvojčat

Obrázek 3: Experimentální doména dat použitých k trénování a testování modelů. Datová sada testu 1 leží v experimentální doméně trénovací datové sady, zatímco datová sada testu 2 leží mimo.
Obrázek 4 a obrázek 5 ukazují předpovědi na dvou testovacích datových sadách. Vidíme, že hybridní model (zelený) odpovídá datům (červené body) lépe než klasický přístup (modrý). To je také znázorněno na obrázku 6, který ukazuje střední kvadratickou chybu (RMSE), běžné měřítko přesnosti predikce, které kvantifikuje průměrný rozdíl mezi předpovězenými a pozorovanými hodnotami. Čím menší je RMSE, tím lepší je prediktivní výkon modelu. Hybridní model dosahuje konzistentně nižších RMSE než klasický přístup v obou doménách. To znamená, že hybridní model lépe zobecňuje a dělá přesnější předpovědi, a to i při extrapolaci nad rámec trénovacích podmínek.
Obrázek článku o zdrojích digitálních dvojčat

Obrázek 4: Data (červeně) a predikce hybridním modelem (zelená) a klasickým (modře) přístupem pro datovou sadu v rámci experimentální domény.
Obrázek článku o zdrojích digitálních dvojčat

Obrázek 5: Data (červeně) a predikce hybridním modelem (zelená) a klasickým (modrá) přístupem pro externí experimentální doménu datasetu.
Obrázek článku o zdrojích digitálních dvojčat

Obrázek 6: Prediktivní srovnání klasických a hybridních modelovacích přístupů měřených RMSE (střední kvadratická chyba). Nižší hodnoty RMSE znamenají lepší přesnost predikce.

Jak ukazuje naše případová studie, hybridní modely nejen zapadají do oblasti trénování, ale také vykazují mnohem větší robustnost při extrapolaci na nové podmínky – což je zásadní vlastnost pro výrobu léků v reálném světě. To jasně ukazuje nadřazenost takového modelování nad běžně používanými klasickými přístupy.

Historicky vytváření a přizpůsobování hybridních modelů vyžadovalo specializované znalosti v oblasti matematiky a datové vědy, což omezovalo jejich dostupnost v mnoha společnostech. Toto prostředí se však mění s příchodem uživatelsky přívětivých aplikací, jako je TwinLab, jak je znázorněno na obrázku 7. Tuto aplikaci jsme vytvořili, abychom uživatelům bez hlubokých technických znalostí umožnili snadno prozkoumat různé scénáře procesů a předvídat výsledky. Díky těmto nástrojům je pokročilé hybridní modelování praktické a použitelné a podporuje vědce a inženýry při vývoji bioprocesů integrací mechanistických znalostí s poznatky založenými na datech prostřednictvím intuitivních rozhraní.
Obrázek 7: Simulační aplikace umožňující analýzu scénářů změnou klíčových parametrů procesu, včetně rychlosti míchání, teploty, rychlosti ředění, koncentrace substrátu v krmivu a počáteční koncentrace osiva. Tyto vstupy jsou zpracovány hybridním modelem, který předpovídá časové průběhy hustoty životaschopných buněk (VCD), tvorbu produktu a spotřebu substrátu.
Ani u hybridního modelu není přesnost predikce dokonalá a vyžadování 21 vzorků pro trénování může představovat překážku – zejména pro malé biotechnologické společnosti, které nemohou snadno generovat takový objem vysoce kvalitních dat. K řešení tohoto omezení může přispět několik přístupů.

Jedním z přístupů je použití chytrého designu experimentů. Na jedné straně zůstává velmi důležité pokrýt prostor procesních parametrů, zatímco optimální návrhy takových mechanistických modelů pomáhají zajistit dostatečnou datovou podporu tam, kde jsou informace nejrelevantnější. Na druhou stranu, mechanisticky informovaná bayesovská optimalizace by mohla být prvním krokem k rychlému pokrytí experimentální oblasti, přičemž opatrnost zůstává s ohledem na správné pokrytí oblasti.

Dalším řešením je použití intenzifikovaného návrhu experimentů (iDoE), který zavádí záměrné posuny v parametrech procesu v rámci jednoho experimentu (např. běh bioreaktoru). Tato strategie efektivně kondenzuje více konvenčních kombinací DoE do menšího počtu experimentálních běhů, čímž maximalizuje informace získané na experiment.

A konečně, ambicióznější, ale velmi slibná strategie zahrnuje využití předem natrénovaných digitálních dvojčat. V tomto scénáři by byl hybridní model nejprve předem natrénován na tisících experimentálních datových sad agregovaných z různých zdrojů, podobně jako se vyvíjejí velké jazykové modely, jako je ChatGPT. Uživatelé by pak mohli model používat a vylepšovat pomocí vlastních omezených trénovacích dat a neustále zlepšovat jeho výkon pro všechny zúčastněné – což by v konečném důsledku prospělo uživatelům i pacientům. Aby byla chráněna chráněná data, platforma by nasadila federované učení, což je přístup k ochraně soukromí, který uživatelům umožňuje vylepšovat digitální dvojče společně. Tato metoda zajišťuje, že jednotlivá experimentální data zůstávají důvěrná a nikdy nejsou přímo sdílena mezi uživateli, a zároveň přispívá ke stále se zlepšujícímu kolektivnímu modelu.

 Budeme pokračovat ve zkoumání potenciálu digitálních dvojčat a statistických metodologií na podporu lepších předpovědí, včetně použití iDoE a bayesovských optimálních návrhů. 


Poznámka: Výsledky byly získány za pomoci BioWin ASBL a finanční podpory regionu v souladu s ustanoveními grantové dohody (úmluva č. 8881 ATMP Thérapie cellulaire).
*Zdroje pokračují níže

O autorovi:

Thomas de Marchin je zástupcem ředitele pro statistiku a datovou vědu ve společnosti Cencora, kde aplikuje pokročilé statistické metodologie a algoritmy strojového učení k optimalizaci objevování léků a efektivity výroby. Díky hlubokým odborným znalostem v oblasti dodržování předpisů – zejména standardů FDA a GMP – překlenuje propast mezi komplexními analytickými přístupy a praktickými farmaceutickými aplikacemi.


Zřeknutí se odpovědnosti:
Informace uvedené v tomto článku nepředstavují právní radu. Společnost Cencora, Inc. důrazně doporučuje čtenářům, aby si prostudovali dostupné informace týkající se probíraných témat a při rozhodování s nimi se spoléhali na vlastní zkušenosti a odborné znalosti.

 


Spojte se s naším týmem

Náš tým špičkových odborníků se zaměřuje na přetváření důkazů, poznatků z analýz politik a informací o trhu v účinné strategie přístupu na globální trh. Dovolte nám, abychom vám pomohli s jistotou se orientovat v dnešním složitém prostředí zdravotní péče. Ozvěte se nám a zjistěte, jak můžeme podpořit dosažení vašich cílů.

Zdroje:


1. Digitální dvojčata: Od personalizované medicíny k preciznímu veřejnému zdraví, J Pers Med., červenec 2021. https://pubmed.ncbi.nlm.nih.gov/34442389/
2. Výzkumná zpráva o průmyslu perfuzních bioreaktorů 2025, výzkum a trhy. https://www.globenewswire.com/news-release/2025/10/09/3164326/28124/en/Perfusion-Bioreactors-Industry-Research-Report-2025-Biopharmaceutical-Growth-Drives-Demand-Amid-Cell-Culture-Advancements-Global-Forecast-to-2032.html
3. Prediktivní modely pro vývoj savčích buněčných kultur - přehled, Digital Chemical Engineering, březen 2024. https://www.sciencedirect.com/science/article/pii/S2772508123000558
4. Hybridní semiparametrické modelování v projektování procesních systémů: Minulost, současnost a budoucnost, Computers & Chemical Engineering, leden 2014. https://www.sciencedirect.com/science/article/pii/S0098135413002639

 

Související zdroje

Článek

S tím, jak se zavádění eCTD 4.0 posouvá kupředu, je nová směrnice ICH podrobuje zkoušce

Článek

Nové cesty k hodnotě produktu: Strategie pro optimalizaci vyspělého produktového portfolia

Článek

Příprava na elektronický příbalový leták pro pacienty v Evropě