Artikkel
Farlige projeksjoner: Hvordan dårlige valg av overlevelsesmodeller med umodne data kan feilstyre HTA-beslutninger og påvirke pasienter
Hvor mye kan vi stole på overlevelsesprognoser når dataene fortsatt er umodne? I metodevurderinger (HTA) kan valg av modell utgjøre forskjellen mellom robust dokumentasjon og misvisende konklusjoner.
Betydningen av overlevelsesprognoser i metodevurdering
Når man vurderer verdien av en innovasjon innen onkologi i sammenheng med metodevurderinger (HTA), fokuserer evalueringen ofte på kostnadseffektivitetsanalyse (CEA) eller kostnadsnytteanalyse (CUA). Disse rammeverkene vurderer verdien som nye behandlinger gir pasienter, vanligvis kvantifisert som leveår, avledet fra total overlevelse (OS), eller leveår fri for kreft, avledet fra progresjonsfri overlevelse (PFS), i forhold til kostnadene ved behandlingene. Å projisere leveårene som er oppnådd over en livstidshorisont er grunnleggende for HTA fordi fordelene med en ny behandling kan akkumuleres over lengre perioder, spesielt for behandlinger som brukes i tidligere sykdomsstadier eller de som har potensial til å kurere.
Det er viktig å merke seg at disse gevinstene i leveår er forskjellige fra median OS- eller PFS-verdier. Immunterapier ved melanom gir et tydelig eksempel. Mens median PFS mellom CTLA-4-antistoffer og anti-PD-1-terapier varierer med bare noen få måneder, er den gjennomsnittlige tiden pasienter bruker uten sykdomsprogresjon betydelig større for de som får anti-PD-1-behandling. Dette er fordi anti-PD-1-terapier er assosiert med et PFS-platå, med mer enn 25 % av pasientene som forblir progresjonsfrie etter 66 måneder, og påløper flere år uten progresjon, sammenlignet med de som behandles med CTLA-4-antistoffer. I tilfeller som dette klarer ikke median PFS å fange nøyaktig opp den gjennomsnittlige fordelen for pasientene gitt av behandlingen, og livstidsprognoser er nødvendig, langt utover median overlevelsestid.
Som et resultat legger HTA-prosesser betydelig vekt på å projisere livstidsoverlevelsesfordeler. Disse framskrivningene er basert på data fra randomiserte kontrollerte studier (RCT). RCT-er har imidlertid ofte begrensede oppfølgingsperioder på tidspunktet for markedsinntreden, noe som fører til høye rater av høyresensur i overlevelsesdataene. Følgelig er dataene som er tilgjengelige for overlevelsesprognoser ofte umodne (dvs. med en betydelig mengde rettsensur) når innledende regulatoriske beslutninger og HTA-beslutninger må tas.
Som et resultat legger HTA-prosesser betydelig vekt på å projisere livstidsoverlevelsesfordeler. Disse framskrivningene er basert på data fra randomiserte kontrollerte studier (RCT). RCT-er har imidlertid ofte begrensede oppfølgingsperioder på tidspunktet for markedsinntreden, noe som fører til høye rater av høyresensur i overlevelsesdataene. Følgelig er dataene som er tilgjengelige for overlevelsesprognoser ofte umodne (dvs. med en betydelig mengde rettsensur) når innledende regulatoriske beslutninger og HTA-beslutninger må tas.
Økende avhengighet av umodne overlevelsesdata i onkologisk HTA
For å estimere langsiktige overlevelsesutfall brukes parametriske overlevelsesfunksjoner og ekstrapolasjonsteknikker, som er basert på antagelser om farefunksjoner avledet fra observerte data. Gjeldende anbefalinger fra Storbritannias National Institute for Health and Care Excellence (NICE) tar til orde for tilpasning av seks standard parametriske modeller, eksponentiell, Weibull, Gompertz, log-logistisk, log-normal og generalisert gamma, til overlevelsesdata. Disse modellene evalueres ved å vurdere deres gode passform gjennom visuell inspeksjon og beregninger som Akaike Information Criterion (AIC), samt vurdere plausibiliteten til ekstrapolerte haler ved hjelp av eksterne data, ekspertuttalelser og biologisk resonnement. Hvis ingen av de standard parametriske modellene er egnet for de observerte overlevelsesdataene, kan mer fleksible og komplekse modelleringstilnærminger, for eksempel parametriske splinemodeller, brukes. Det er viktig å erkjenne at disse mer fleksible modellene ble designet for å gi bedre tilpasning til observerte overlevelsesdata, spesielt når dataene viser komplekse faremønstre, slik tilfellet er med immunterapier. Denne modelleringsprosessen er avgjørende for å generere robuste langsiktige overlevelsesprognoser, som til syvende og sist støtter beslutningstaking som påvirker pasientens tilgang til behandlinger og allokering av helseressurser.
I onkologi har denne prosessen blitt hindret av økende avhengighet av umodne overlevelsesdata. For eksempel, mellom 2015 og 2017, var 41 % av kreftenkeltteknologivurderinger utført av NICE basert på umodne overlevelsesdata. Denne prosentandelen steg til 56 % for utviklingssamtaler publisert mellom 2018 og 2022.
Denne trenden mot å bruke mindre modne data i HTA-innsendinger reiser viktige spørsmål om optimalt modellvalg. Selv om standard parametriske modeller fortsatt er mye brukt, har bruken av fleksible modeller som spline-modeller i nylige HTA-innsendinger økt. Selv om disse modellene ofte passer bedre til de observerte dataene, betyr ikke dette nødvendigvis mer pålitelige langsiktige prognoser.
Gjeldende retningslinjer anbefaler å velge den modellen som passer best til de tilgjengelige dataene, inkludert å sammenligne langsiktig nøyaktighet ved hjelp av eksterne data, og bruke ekspertuttalelser og biologisk resonnement. Spesielt i sammenheng med enarmsstudier og uavhengig tilpasning av intervensjons- og komparatorarmer er imidlertid tilgangen til langsiktige eksterne data ofte begrenset, mens avhengighet av ekspertuttalelser og biologisk resonnement kan mangle tilstrekkelig robusthet. I slike situasjoner kan data fra den virkelige verden gi verdifulle tilleggsbevis for å vurdere haleplausibilitet og styrke langsiktige anslag.
På ISPOR Europe 2025 i Glasgow undersøkte vi om overlevelsesekstrapoleringer bør prioritere tilpasning av eksisterende data eller redusere fremtidig usikkerhet når overlevelsesdata er begrenset. Vi fokuserte på standard parametriske modeller som er de mest brukte i HTA-innsendinger.
I onkologi har denne prosessen blitt hindret av økende avhengighet av umodne overlevelsesdata. For eksempel, mellom 2015 og 2017, var 41 % av kreftenkeltteknologivurderinger utført av NICE basert på umodne overlevelsesdata. Denne prosentandelen steg til 56 % for utviklingssamtaler publisert mellom 2018 og 2022.
Denne trenden mot å bruke mindre modne data i HTA-innsendinger reiser viktige spørsmål om optimalt modellvalg. Selv om standard parametriske modeller fortsatt er mye brukt, har bruken av fleksible modeller som spline-modeller i nylige HTA-innsendinger økt. Selv om disse modellene ofte passer bedre til de observerte dataene, betyr ikke dette nødvendigvis mer pålitelige langsiktige prognoser.
Gjeldende retningslinjer anbefaler å velge den modellen som passer best til de tilgjengelige dataene, inkludert å sammenligne langsiktig nøyaktighet ved hjelp av eksterne data, og bruke ekspertuttalelser og biologisk resonnement. Spesielt i sammenheng med enarmsstudier og uavhengig tilpasning av intervensjons- og komparatorarmer er imidlertid tilgangen til langsiktige eksterne data ofte begrenset, mens avhengighet av ekspertuttalelser og biologisk resonnement kan mangle tilstrekkelig robusthet. I slike situasjoner kan data fra den virkelige verden gi verdifulle tilleggsbevis for å vurdere haleplausibilitet og styrke langsiktige anslag.
På ISPOR Europe 2025 i Glasgow undersøkte vi om overlevelsesekstrapoleringer bør prioritere tilpasning av eksisterende data eller redusere fremtidig usikkerhet når overlevelsesdata er begrenset. Vi fokuserte på standard parametriske modeller som er de mest brukte i HTA-innsendinger.
Prioritere langsiktig nøyaktighet fremfor passform
Vi presenterte en analyse som brukte OS- og PFS-data fra et mangfoldig sett med nylige onkologiske studier som inneholdt tilstrekkelig modne datasett. De nødvendige dataene ble innhentet ved å digitalisere de publiserte Kaplan-Meier (KM) overlevelseskurvene og generere datasett på pseudo-pasientnivå, inkludert sensur, i henhold til metodikken anbefalt av NICE. De kliniske studiene som ble valgt for denne studien inkluderte CLEAR, CM-649, COU-AA-301, KEYNOTE-A39, KEYNOTE-A39 (8/8/24), SUNLIGHT og TROPICS-02. For hver av disse studiene opprettet vi flere, mer umodne datasett ved kunstig høyresensurering av dataene ved varierende hendelsesterskler: 60 %–70 %, 50 %, 30 % og 20 %. Dette ble oppnådd ved å sensurere alle gjenværende pasienter etter at den spesifiserte hendelsesterskelen var nådd, og dermed simulere datasett med økende nivåer av umodenhet.
Etter dette utførte vi overlevelsesekstrapolering i henhold til standard HTA-innsendingsretningslinjer. Ekstrapoleringer ble utført ved hjelp av fem standard parametriske modeller som er de mest brukte i HTA-innsending: generalisert gamma, Weibull, eksponentiell, log-normal og loglogistisk. Disse modellene ble brukt på alle datasett for å forutsi langsiktige overlevelsesutfall. Den prediktive nøyaktigheten til hver ekstrapolering ble vurdert ved hjelp av begrenset gjennomsnittlig overlevelsestid (RMST). RMST representerer gjennomsnittlig overlevelsestid begrenset til en spesifisert maksimal oppfølgingstid, som i vårt tilfelle tilsvarte den maksimale observerte varigheten for hver KM-kurve. For å kvantifisere nøyaktigheten til overlevelsesprojeksjonene, beregnet vi den absolutte gjennomsnittsforskjellen, den relative forskjellen og den kvadrerte feilen mellom RMST avledet fra KM-kurvene i de observerte, publiserte dataene og RMST forutsagt av hver parametrisk modell.
Som forventet, som illustrert i figur 1, var variasjonen i den ekstrapolerte RMST høy for modeller estimert med begrenset oppfølging (f.eks. med mer enn 25 % av hendelsene sensurert). Med de valgte dataene og sensurnivåene utforsket, kan anslag være opptil 60 % rabatt sammenlignet med de mer modne KM-dataene. Dette er ikke overraskende og har blitt sett i tidligere lignende arbeid. Potensiell usikkerhet er imidlertid viktig. Dette kan føre til en dobling eller halvering av CEA- eller CUA-resultatene når mer modne data er tilgjengelige, noe som radikalt endrer HTA-konklusjonen og potensielt påvirker refusjonsbeslutninger og pasienttilgang. De fleste funksjonene fungerte på samme måte når de ble brukt på modne data, og viste gjennomsnittlige forskjeller på mindre enn 2,5 % mellom anslåtte og KM RMST-resultater, spesielt for den best passende funksjonen. Dette indikerer at modelltilpasning til tilgjengelige data har mindre innflytelse på utfall enn valg av en funksjon med mer pålitelig langsiktig projeksjonsatferd.
Figur 1. Relative RMST-forskjeller på tvers av sensurnivåer og ekstrapoleringsfunksjoner
Etter dette utførte vi overlevelsesekstrapolering i henhold til standard HTA-innsendingsretningslinjer. Ekstrapoleringer ble utført ved hjelp av fem standard parametriske modeller som er de mest brukte i HTA-innsending: generalisert gamma, Weibull, eksponentiell, log-normal og loglogistisk. Disse modellene ble brukt på alle datasett for å forutsi langsiktige overlevelsesutfall. Den prediktive nøyaktigheten til hver ekstrapolering ble vurdert ved hjelp av begrenset gjennomsnittlig overlevelsestid (RMST). RMST representerer gjennomsnittlig overlevelsestid begrenset til en spesifisert maksimal oppfølgingstid, som i vårt tilfelle tilsvarte den maksimale observerte varigheten for hver KM-kurve. For å kvantifisere nøyaktigheten til overlevelsesprojeksjonene, beregnet vi den absolutte gjennomsnittsforskjellen, den relative forskjellen og den kvadrerte feilen mellom RMST avledet fra KM-kurvene i de observerte, publiserte dataene og RMST forutsagt av hver parametrisk modell.
Som forventet, som illustrert i figur 1, var variasjonen i den ekstrapolerte RMST høy for modeller estimert med begrenset oppfølging (f.eks. med mer enn 25 % av hendelsene sensurert). Med de valgte dataene og sensurnivåene utforsket, kan anslag være opptil 60 % rabatt sammenlignet med de mer modne KM-dataene. Dette er ikke overraskende og har blitt sett i tidligere lignende arbeid. Potensiell usikkerhet er imidlertid viktig. Dette kan føre til en dobling eller halvering av CEA- eller CUA-resultatene når mer modne data er tilgjengelige, noe som radikalt endrer HTA-konklusjonen og potensielt påvirker refusjonsbeslutninger og pasienttilgang. De fleste funksjonene fungerte på samme måte når de ble brukt på modne data, og viste gjennomsnittlige forskjeller på mindre enn 2,5 % mellom anslåtte og KM RMST-resultater, spesielt for den best passende funksjonen. Dette indikerer at modelltilpasning til tilgjengelige data har mindre innflytelse på utfall enn valg av en funksjon med mer pålitelig langsiktig projeksjonsatferd.
Figur 1. Relative RMST-forskjeller på tvers av sensurnivåer og ekstrapoleringsfunksjoner
Nøkkel: RMST – begrenset gjennomsnittlig overlevelsestid.
Interessant nok viste forskjellige funksjoner varierende nivåer av langsiktig nøyaktighet (figur 2). Lognormale og eksponentielle funksjoner hadde hver ca. ±6 % total usikkerhet, mens den generaliserte gammafunksjonen ble stadig mer ustabil etter hvert som sensurterskelen økte. De fleste funksjoner hadde en tendens til å undervurdere langsiktige overlevelsesprojeksjoner, selv om den eksponentielle funksjonen generelt overestimerte overlevelsesgevinster. Blant underestimeringsmodellene produserte log-normale og loglogistiske funksjoner de mest nøyaktige langsiktige estimatene i gjennomsnitt. Disse funnene reiser et viktig spørsmål når vi velger overlevelsesmodeller for langsiktige fremskrivninger: Bør vi prioritere å tilpasse tilgjengelige KM-data, potensielt ignorere usikkerheter i umodne datasett, eller velge modeller som gir bedre gjennomsnittlige langsiktige fremskrivninger? Et alternativ til gjeldende retningslinjer kan være å fokusere på å velge funksjoner som gir større langsiktig prediktiv nøyaktighet i stedet for bare kortsiktig tilpasning.
Figur 2. Gjennomsnittlig RMST-forskjell vs. KM (0 %–10 %, 10–30 %, 30 %–50 %, >50 %) på tvers av sensurnivåer og ekstrapoleringsfunksjoner
Figur 2. Gjennomsnittlig RMST-forskjell vs. KM (0 %–10 %, 10–30 %, 30 %–50 %, >50 %) på tvers av sensurnivåer og ekstrapoleringsfunksjoner
Nøkkel: KM – Kaplan–Meier; RMST – begrenset gjennomsnittlig overlevelsestid.
Disse resultatene understreker behovet for å revurdere metodiske retningslinjer etter hvert som omstendighetene endres. Etter hvert som overlevelsesdata blir mer umodne og farefunksjoner blir mer komplekse, er det verdt å revurdere om tradisjonelle tilnærminger fortsatt er hensiktsmessige. Å levere nøyaktig HTA krever kontinuerlig forbedring for å sikre at pasientene får optimal behandling og at helseressursene brukes effektivt. Hos Cencora er det fortsatt viktig å fremme innovasjon og ekspertise.
Disse resultatene understreker behovet for å revurdere metodiske retningslinjer etter hvert som omstendighetene endres. Etter hvert som overlevelsesdata blir mer umodne og farefunksjoner blir mer komplekse, er det verdt å revurdere om tradisjonelle tilnærminger fortsatt er hensiktsmessige. Å levere nøyaktig HTA krever kontinuerlig forbedring for å sikre at pasientene får optimal behandling og at helseressursene brukes effektivt. Hos Cencora er det fortsatt viktig å fremme innovasjon og ekspertise.
Kilder oppført nedenfor.
Ansvarserklæring:
Denne artikkelen oppsummerer Cencoras forståelse av emnet basert på offentlig tilgjengelig informasjon i skrivende stund (se oppførte kilder) og forfatternes ekspertise på dette området. Eventuelle anbefalinger gitt i artikkelen gjelder kanskje ikke for alle situasjoner og utgjør ikke juridisk rådgivning; Lesere bør ikke stole på artikkelen når de tar avgjørelser knyttet til temaene som diskuteres.
Ta kontakt med teamet vårt
Vårt team av ledende verdieksperter arbeider iherdig med å omsette bevis, policy-innsikt og markedsinformasjon til effektive tilgangsstrategier for det globale markedet. Vi hjelper deg med å finne frem i dagens komplekse helsetjenester. Kontakt oss, så hjelper vi deg med å nå målene dine.
Kilder
- Bakker LJ, Thielen FW, Redekop WK, Groot CU, Blommestein HM. Ekstrapolering av empiriske langtidsoverlevelsesdata: virkningen av oppdaterte oppfølgingsdata og parametriske ekstrapoleringsmetoder på overlevelsesestimater ved myelomatose. BMC Med Res Methodol. 2023; 23(1):132. Doi: 10.1186/s12874-023-01952-2. Referanse: 37248477; PMCID: PMC10226243.
- Bullement A, Meng Y, Cooper M, et al. En gjennomgang og validering av total overlevelsesekstrapolering i medisinske teknologivurderinger av kreftimmunterapi av National Institute for Health and Care Excellence: hvordan var det første beste estimatet sammenlignet med forsøksdata som senere ble gjort tilgjengelige? J Med Econ. 2019; 22(3):205-214. Doi: 10.1080/13696998.2018.1547303. Epub 2018 november 30. Referanse: 30422080.
- Everest L, Blommaert S, Chu RW, Chan KKW, Parmar A. Parametrisk overlevelsesekstrapolering av tidlige overlevelsesdata i økonomiske analyser: en sammenligning av anslått versus observert oppdatert overlevelse. Vurder helse. 2022; 25(4):622-629. Doi: 10.1016/j.jval.2021.10.004. Epub 2021 24. Referanse: 35365306.
- Fizazi K, Scher HI, Molina A, et al. . Abirateronacetat til behandling av metastatisk kastrasjonsresistent prostatakreft: endelig total overlevelsesanalyse av COU-AA-301 randomiserte, dobbeltblinde, placebokontrollerte fase 3-studien. Lancet Oncol. 2012; 13(10):983-992. Doi: 10.1016/S1470-2045(12)70379-0. Epub 2012 18. Erratum i: Lancet Oncol. 2012; 13(11):E464. Erratum i: Lancet Oncol. 2014; 15(9):E365. Referanse: 22995653.
- Gibbons CL, Latimer NR. Prevalens av umodne overlevelsesdata for kreftmedisiner presentert for National Institute for Health and Care Excellence mellom 2018 og 2022. Vurder helse. 2025; 28(3):406-414. Doi: 10.1016/j.jval.2024.11.013. Epub 2024 desember 24. Referanse: 39725010.
- Gray J, Sullivan T, Latimer NR, et al. Ekstrapolering av overlevelseskurver ved bruk av standard parametriske modeller og fleksible parametriske spline-modeller: sammenligninger i store registerkohorter med avansert kreft. Med Decis Making. 2021; 41(2):179-193. Doi: 10.1177/0272989X20978958. Epub 2020 desember 22. Referanse: 33349137.
- Janjigian YY, Shitara K, Moehler M, et al. Førstelinje nivolumab pluss kjemoterapi versus kjemoterapi alene for avansert gastrisk, gastroøsofageal kryss og spiserørsadenokarsinom (CheckMate 649): en randomisert, åpen fase 3-studie. Lancet. 2021; 398(10294):27-40. Doi: 10.1016/S0140-6736(21)00797-2. Epub 2021 juni 5. Referanse: 34102137; PMCID: PMC8436782.
- Kang J, Cairns J, Latimer NR, Duffield S, Grieve R. En vurdering av modenheten til kreftoverlevelsesdata brukt i økonomiske modeller for National Institute for Health and Care Excellences enkeltteknologivurderinger. Vurder helse. 2025; 28(11):1705-1713. Doi: 10.1016/j.jval.2025.07.010. Epub 2025 22. Referanse: 40706705.
- Latimer N. NICE DSU Teknisk støttedokument 14: Gjennomføre overlevelsesanalyse for økonomiske evalueringer sammen med kliniske studier – ekstrapolering med data på pasientnivå. Sheffield (Storbritannia): Enhet for beslutningsstøtte, ScHARR, Universitetet i Sheffield; 2011.
- Leleu H, Carette J, Berkovitch B. Balansering av passform og nøyaktighet: Evaluering av overlevelsesmodellprojeksjoner med umodne data i metodevurderinger. ISPOR EU25. 9.-12. november 2025. Glasgow, Storbritannia.
- Motzer R, Alekseev B, Rha SY, et al. Lenvatinib pluss pembrolizumab eller everolimus for avansert nyrecellekarsinom. N Engl J Med. 2021; 384(14):1289-1300. Doi: 10.1056/NEJMoa2035716. Epub 2021 februar 13. Referanse: 33616314.
- Powles T, Valderrama BP, Gupta S, et al. Enfortumab vedotin og pembrolizumab ved ubehandlet avansert urotelkreft. N Engl J Med. 2024; 390(10):875-888. Doi: 10.1056/NEJMoa2312117. Referanse: 38446675.
- Prager GW, Taieb J, Fakih M, et al. Trifluridin-tipiracil og bevacizumab ved refraktær metastatisk tykktarmskreft. N Engl J Med. 2023; 388(18):1657-1667. Doi: 10.1056/NEJMoa2214963. Referanse: 37133585.
- Rugo HS, Bardia A, Marmé F, et al. Total overlevelse med sacituzumab govitecan i hormonreseptorpositiv og human epidermal vekstfaktorreseptor 2-negativ metastatisk brystkreft (TROPiCS-02): en randomisert, åpen, multisenter, fase 3-studie. Lancet. 2023; 402(10411):1423-1433. Doi: 10.1016/S0140-6736(23)01245-X. Epub 2023 23. Referanse: 37633306.
- van Not OJ, van den Eertwegh AJM, Jalving H, et al. Langtidsoverlevelse hos pasienter med avansert melanom. JAMA Netw Open. 2024; 7(8):e2426641. Doi: 10.1001/jamanetworkopen.2024.26641. Referanse: 39141388; PMCID: PMC11325208.
- Zhu Y, Liu K, Zhu H, Li S, Yuan D. Enfortumab vedotin pluss pembrolizumab for tidligere ubehandlet lokalt avansert eller metastatisk urotelial karsinom: en kostnadseffektivitetsanalyse. Ther Adv Med Oncol. 2025;17:17588359241295544. Doi: 10.1177/17588359241295544. Referanse: 39776535; PMCID: PMC11705323.
