Articol

Gemenii digitali și modelele hibride în producția de produse biologice: O comparație a modelelor

  • Thomas de Marchin

Tehnologia gemenilor digitali are potențialul de a juca un rol transformațional în dezvoltarea și fabricarea medicamentelor. 

În primul nostru articol Cum gemenii digitali și modelarea hibridă optimizează procesul de cultură celulară pentru o producție mai bună, am prezentat viziunea noastră despre gemeni digitali pentru bioprocese ca replici virtuale care combină modele bazate pe date și mecanice pentru a optimiza producția de produse biologice. Am arătat cum modelele hibride pot sprijini optimizarea în timp real, extinderea și conformitatea cu reglementările. Gemenii digitali sunt deosebit de cruciali pentru medicina personalizată și terapiile celulare și genetice, deoarece permit producția adaptabilă de loturi mici adaptate la tratamente individualizate.1

În acest al doilea articol, punem teoria în practică prin compararea unui model clasic bazat pe date cu un model hibrid pentru prezicerea densității celulare viabile (VCD) și a acumulării de produse – parametri cheie ai productivității – într-un bioreactor de perfuzie.

Demonstrăm modul în care gemenii digitali permit inovatorilor să răspundă la întrebări precum:

  • Cum putem identifica condițiile optime pentru maximizarea creșterii și productivității celulare?
  • Când ar trebui să inițiem perfuzia și să ajustăm strategiile de hrănire pentru a evita epuizarea substratului și colapsul densității celulare?
  • Putem detecta semnele timpurii de instabilitate și putem prezice parametri greu de măsurat, cum ar fi concentrația de substrat în bioreactor?
Figura 1: Ilustrație a unui bioreactor de perfuzie

Studiu de caz: Modelarea culturilor celulare cu bioreactor de perfuzie

Figura 1: Ilustrație a unui bioreactor de perfuzie
Într-un bioreactor de perfuzie, celulele sunt alimentate continuu cu nutrienți proaspeți, în timp ce deșeurile și produsul sunt îndepărtate, dar celulele în sine sunt păstrate. Acest lucru creează un mediu stabil, bogat în nutrienți, în care celulele pot prospera pentru perioade lungi de timp, ceea ce duce la densități celulare mai mari și la o productivitate crescută. Bioreactoarele de perfuzie sunt utilizate pe scară largă pentru producerea de produse biologice.2

Modelarea atributelor precum densitatea celulară viabilă (VCD) sau acumularea de produse împreună cu parametrii de proces precum concentrația substratului, temperatura sau agitația folosind modele predictive este un pas crucial în caracterizarea proceselor medicamentoase.3
Figura 1: Ilustrație a unui bioreactor de perfuzie
Modelarea clasică a bioreactorului se bazează de obicei pe abordări pur bazate pe date, în care funcțiile matematice simple (cum ar fi liniile sau curbele) sunt ajustate la datele experimentale pentru a face predicții.3 Deși această metodă este simplă și eficientă din punct de vedere computațional, adesea nu reușește să surprindă mecanismele biologice sau fizice care stau la baza sistemului. Ca urmare, oferă o perspectivă limitată asupra motivului pentru care apar rezultate specifice și se luptă să generalizeze dincolo de intervalul de date de antrenament.

Mai mult, metodele bazate pe date se confruntă cu provocări atunci când au de-a face cu sisteme complexe care implică numeroși parametri de proces și date experimentale limitate, ceea ce este comun în dezvoltarea de medicamente. Modelele mecanice sau hibride rezolvă unele dintre aceste probleme prin încorporarea cunoștințelor anterioare de proces sub formă de legi biologice și fizice.Prin urmare, în timp ce modelele clasice bazate pe date servesc ca un punct de plecare util, credem că integrarea cunoștințelor mecaniciste prin abordări hibride îmbunătățește puterea predictivă și facilitează o mai bună optimizare a proceselor în bioreactoare.
Am dezvoltat un model hibrid care integrează cunoștințe mecanice – cum ar fi ratele de consum de nutrienți și căile metabolice – cu componente de învățare automată bazate pe date care surprind aspecte complexe sau slab înțelese. Partea mecanică oferă o bază solidă de cunoștințe anterioare de proces, în timp ce componenta de învățare automată modelează comportamente necunoscute. Modelele hibride oferă o robustețe sporită în extrapolare și pot surprinde cu precizie comportamente dinamice, cum ar fi modificările ratelor de creștere celulară și absorbția nutrienților în condiții diferite.  Deși mai complexe de dezvoltat, acestea pot reduce nevoia de experimente extinse și pot permite reutilizarea modelelor existente în toate produsele. De asemenea, excelează în optimizarea în timp real, extinderea predictivă și conformitatea cu reglementările prin îmbunătățirea înțelegerii proceselor în timpul caracterizării (FDA Etapa 1) și sprijinirea dezvoltării limitelor de control în timp real pentru loturi specifice (FDA Etapa 3).

Modelul nostru hibrid ia parametrii de proces ca intrări și prezice variabile biologice, cum ar fi ratele, randamentele și nivelurile de platou pentru biomasă și formarea produsului. Acești parametri prezizați sunt apoi introduși într-un sistem de ecuații diferențiale obișnuite (ODE), care calculează răspunsurile dinamice ale bioreactorului în timp. Figura 2 ilustrează pașii cheie atât ai abordării clasice bazate pe date, cât și ai abordării hibride.
Figura 2: Compararea modelelor bazate pe date și hibride
Pentru a evalua ambele abordări, am simulat 29 de experimente variind temperatura (20-40 °C) și viteza de agitație (150-350 rpm), surprinzând diferite dinamici de creștere a biomasei, formarea produsului și consumul de glucoză în timp (Figura 3). Modelul a fost antrenat pe 21 de experimente. Performanța a fost apoi testată pe două seturi de patru experimente nevăzute: un set în domeniul de antrenament (test1) pentru a evalua capacitatea de interpolare și altul în afara acestui domeniu (test2) pentru a evalua extrapolarea și generalizarea.

Gemenii digitali imagine articol de resursă

Figura 3: Domeniul experimental al datelor utilizate pentru antrenarea și testarea modelelor. Setul de date de testare 1 se află în domeniul experimental al setului de date de antrenament, în timp ce setul de date de test 2 se află în exterior.
Figura 4 și Figura 5 arată predicțiile celor două seturi de date de testare. Putem vedea că modelul hibrid (verde) se potrivește mai bine datelor (puncte roșii) decât abordarea clasică (albastru). Acest lucru este arătat și în Figura 6 care arată Root Mean Square Error (RMSE), o măsură comună a acurateței predicției care cuantifică diferența medie dintre valorile prezise și cele observate. Cu cât RMSE este mai mic, cu atât performanța predictivă a modelului este mai bună. Modelul hibrid atinge în mod constant un RMSE mai mic decât abordarea clasică în ambele domenii. Acest lucru indică faptul că modelul hibrid generalizează mai bine și face predicții mai precise, chiar și atunci când extrapolează dincolo de condițiile de antrenament.
Gemenii digitali imagine articol de resursă

Figura 4: Date (roșu) și predicții prin abordarea modelului hibrid (verde) și clasică (albastru) pentru setul de date din domeniul experimental.
Gemenii digitali imagine articol de resursă

Figura 5: Date (roșu) și predicții prin abordarea modelului hibrid (verde) și clasic (albastru) pentru setul de date din domeniul experimental extern.
Gemenii digitali imagine articol de resursă

Figura 6: Compararea performanței predictive a abordărilor de modelare clasice și hibride măsurate prin RMSE (eroare pătratică medie). Valorile RMSE mai mici indică o acuratețe predictivă mai bună.

După cum arată studiul nostru de caz, modelele hibride nu numai că se încadrează în domeniul antrenamentului, dar demonstrează și o robustețe mult mai mare atunci când extrapolează la noi condiții – o caracteristică esențială pentru producția de medicamente în lumea reală. Acest lucru arată în mod clar superioritatea unei astfel de modelări față de abordările clasice utilizate în mod obișnuit.

Din punct de vedere istoric, crearea și montarea modelelor hibride au necesitat cunoștințe specializate în matematică și știința datelor, ceea ce le-a limitat accesibilitatea în multe companii. Cu toate acestea, acest peisaj se schimbă odată cu apariția aplicațiilor ușor de utilizat, cum ar fi TwinLab, prezentate în Figura 7. Am creat această aplicație pentru a permite utilizatorilor fără expertiză tehnică profundă să exploreze cu ușurință diferite scenarii de proces și să prezică rezultatele. Astfel de instrumente fac ca modelarea hibridă avansată să fie practică și acționabilă, sprijinind oamenii de știință și inginerii în dezvoltarea bioproceselor prin integrarea cunoștințelor mecanice cu informații bazate pe date prin interfețe intuitive.
Figura 7: Aplicație de simulare care permite analiza scenariilor prin varierea parametrilor cheie ai procesului, inclusiv rata de agitare, temperatura, rata de diluare, concentrația de substrat în furaj și concentrația inițială a semințelor. Aceste intrări sunt procesate de un model hibrid care prezice cursurile de timp ale densității celulare viabile (VCD), formarea produsului și consumul de substrat.
Chiar și cu un model hibrid, acuratețea predicției nu este perfectă, iar necesitarea a 21 de probe pentru antrenament poate reprezenta o barieră – în special pentru companiile mici de biotehnologie care nu pot genera cu ușurință acest volum de date de înaltă calitate. Mai multe abordări pot ajuta la rezolvarea acestei limitări.

O abordare este aplicarea unui design inteligent al experimentelor. Pe de o parte, acoperirea spațiului parametrilor procesului rămâne foarte importantă, în timp ce proiectele optime pentru astfel de modele mecaniciste ajută la asigurarea unui suport suficient pentru date acolo unde informațiile sunt cele mai relevante. Pe de altă parte, optimizarea bayesiană informată mecanic ar putea fi un prim pas pentru a acoperi rapid domeniul experimental, în timp ce rămâne prudența în ceea ce privește acoperirea adecvată a domeniului.

O altă soluție este utilizarea proiectării intensificate a experimentelor (iDoE), care introduce schimbări deliberate ale parametrilor de proces într-un singur experiment (de exemplu, rularea bioreactorului). Această strategie condensează efectiv mai multe combinații DoE convenționale într-un număr mai mic de rulări experimentale, maximizând astfel informațiile obținute pe experiment.

În cele din urmă, o strategie mai ambițioasă, dar foarte promițătoare, implică utilizarea gemenilor digitali pre-instruiți. În acest scenariu, modelul hibrid ar fi mai întâi pre-antrenat pe mii de seturi de date experimentale agregate din diverse surse, similar cu modul în care sunt dezvoltate modele lingvistice mari precum ChatGPT. Utilizatorii ar putea apoi să utilizeze și să îmbunătățească modelul folosind propriile date de antrenament limitate, îmbunătățind continuu performanța acestuia pentru toți cei implicați - în cele din urmă beneficiază atât utilizatorii, cât și pacienții. Pentru a proteja datele proprietare, platforma ar implementa învățarea federativă, o abordare de păstrare a confidențialității care permite utilizatorilor să îmbunătățească geamănul digital în colaborare. Această metodă asigură că datele experimentale individuale rămân confidențiale și nu sunt niciodată partajate direct între utilizatori, contribuind în același timp la un model colectiv în continuă îmbunătățire.

 Vom continua să explorăm potențialul geamănului digital și al metodologiilor statistice pentru a sprijini predicții mai bune, inclusiv utilizarea modelelor optime iDoE și bayesiane. 


Notă: Rezultatele au fost generate cu asistența BioWin ASBL și sprijinul financiar din partea Regiunii, în conformitate cu prevederile Acordului de grant (Convenția 8881 ATMP Thérapie cellulaire).
*Sursele continuă mai jos

Despre autor:

Thomas de Marchin este director asociat de statistică și știința datelor la Cencora, unde aplică metodologii statistice avansate și algoritmi de învățare automată pentru a optimiza descoperirea medicamentelor și eficiența producției. Cu o experiență profundă în conformitatea cu reglementările – în special standardele FDA și GMP – el reduce decalajul dintre abordările analitice complexe și aplicațiile farmaceutice practice.


Precizare:
Informațiile furnizate în acest articol nu constituie consultanță juridică. Cencora, Inc. încurajează insistent cititorii să revizuiască informațiile disponibile legate de subiectele discutate și să se bazeze pe propria experiență și expertiză în luarea deciziilor legate de acestea.

 


Luați legătura cu echipa noastră

Echipa noastră de experți în valoare este dedicată transformării dovezilor, informațiilor privind politicile și informațiilor de piață în strategii eficiente de acces la piața globală. Permiteți-ne să vă ajutăm să navigați cu încredere prin peisajul complex al asistenței medicale din ziua de azi. Contactați-ne pentru a afla în ce mod vă putem sprijini în atingerea obiectivelor.

Surse:


1. Gemenii digitali: De la medicina personalizată la sănătatea publică de precizie, J Pers Med., iulie 2021. https://pubmed.ncbi.nlm.nih.gov/34442389/
2. Raportul de cercetare a industriei bioreactoarelor de perfuzie 2025, cercetare și piețe. https://www.globenewswire.com/news-release/2025/10/09/3164326/28124/en/Perfusion-Bioreactors-Industry-Research-Report-2025-Biopharmaceutical-Growth-Drives-Demand-Amid-Cell-Culture-Advancements-Global-Forecast-to-2032.html
3. Modele predictive pentru dezvoltarea culturilor de celule de mamifere în amonte - O revizuire, Digital Chemical Engineering, martie 2024. https://www.sciencedirect.com/science/article/pii/S2772508123000558
4. Modelarea semiparametrică hibridă în ingineria sistemelor de proces: Trecut, prezent și viitor, Calculatoare și Inginerie Chimică, ianuarie 2014. https://www.sciencedirect.com/science/article/pii/S0098135413002639

 

Resurse conexe

Articol

Pe măsură ce adoptarea eCTD 4.0 avansează, un nou ghid ICH îl pune la încercare

Articol

Noi căi către valoarea produsului: Strategii de optimizare a portofoliului de produse mature

Articol

Pregătirea pentru prospectul electronic al pacientului în Europa