Article

Repenser les informations sur les patients et les traitements grâce à la RWE et à l’IA

  • Derek Swiger, PharmD, MS

  • Ryan Fiano, Ph.D., MPH

Le rôle des données probantes du monde réel (RWE) pour éclairer la prise de décision en matière de soins de santé s’élargit. Grâce à son potentiel à soutenir une base de données probantes plus large, RWE offre des informations qui complètent les essais cliniques traditionnels en capturant les expériences des patients, les modèles de traitement et les résultats dans des contextes réels.1,2 Alors que les parties prenantes du secteur de la santé exigent des données probantes plus solides, plus opportunes et plus exploitables, l’intelligence artificielle (IA) contribue à transformer la façon dont les données du monde réel sont générées, analysées et appliquées. L’IA est déjà exploitée pour soutenir les données probantes du monde réel de plusieurs manières et semble très prometteuse pour des applications plus larges à l’avenir. Néanmoins, il faut faire preuve de prudence et comprendre ses limites. 

Applications actuelles de l’IA dans les données probantes du monde réel

Améliorer le codage et le développement d’algorithmes

L’un des domaines dans lesquels l’IA révolutionne les études RWE est celui des flux de travail de codage requis pour les algorithmes complexes. Nous constatons que des tâches qui prenaient autrefois des mois peuvent maintenant être accomplies en quelques semaines, grâce à la capacité de l’IA à aider à développer, affiner et valider le code.

Ryan Fiano, PhD., chercheur chez Cencora, a expliqué qu’en tirant parti de l’IA dans un projet récent, le temps nécessaire à la  création d’algorithmes complexes pour les modèles de traitement est passé de plusieurs semaines à une semaine ou moins. « L’efficacité vient du fait de savoir comment stimuler l’IA et de l’expérience préalable pour transformer les résultats en étapes exploitables », a-t-il déclaré. 

Cette expertise spécifique est vitale car le travail préparatoire requis pour définir des résultats rétrospectifs communs - tels que les lignes de traitement (LOT), la persistance ou le changement de traitement - est rarement un processus standardisé ; Les définitions varient souvent considérablement d’une étude à l’autre. En combinant une connaissance approfondie du domaine avec des techniques d’incitation ciblées, les analystes peuvent équiper l’IA de modèles de code internes validés, lui « apprenant » efficacement à appliquer des approches de « codage » standard dans toutes les études. Par exemple, en « montrant » le modèle exactement comment l’équipe gère les règles typiques, telles que les chevauchements de médicaments et les contingences d’écart pour définir LOT, les analystes peuvent aider à s’assurer que les cas  limites plus complexes ne nécessitent qu’une refactorisation minimale. 

Nous avons constaté que ce processus réduit considérablement la « boucle de débogage », transformant ce qui était autrefois un cycle de plusieurs jours de dépannage syntaxique en un processus de validation rationalisé où les analystes se concentrent sur la vérification de l’intention clinique plutôt que sur la correction de la structure du code. 

Amélioration de la validation et de la qualité des données

Il est essentiel de garantir la validité et la qualité des données du monde réel pour générer des preuves crédibles. L’IA joue un rôle clé dans ce processus en identifiant les lacunes, les incohérences et les erreurs dans les ensembles de données. 

Par exemple, M. Fiano a noté que son équipe a pu tirer parti de modèles d’invites dérivés des pratiques de contrôle de la qualité établies pour générer systématiquement des points de contrôle de la qualité qui valident les résultats tout en assurant la cohérence. 

« Cette approche transforme l’assurance qualité manuelle en un processus évolutif et reproductible intégré de manière transparente dans les flux de travail de l’IA », a noté le Dr Fiano.

En automatisant ces processus de validation, l’IA permet aux chercheurs de se concentrer sur des tâches à plus forte valeur ajoutée, telles que la conception et l’interprétation des études, tout en maintenant la rigueur requise pour les soumissions réglementaires et les payeurs.
 

Défis et limites de l’IA dans les données probantes du monde réel

Garantir la validité et la transparence

Bien que l’IA offre des gains d’efficacité significatifs, elle présente également des défis liés à la validité et à la transparence. Les modèles d’IA, en particulier les grands modèles de langage (LLM), fonctionnent comme des systèmes de boîte noire, ce qui rend difficile la compréhension de la façon dont certains résultats sont générés.3

Derek Swiger, PharmD, MS, expert en innovation numérique chez Cencora, a souligné l’importance d’intégrer des mesures de protection dans les flux de travail :

« En fin de compte, les outils d’IA générative sont des boîtes noires, nous devons donc faire preuve de créativité pour intégrer des contrôles dans le processus qui garantissent que les résultats sont valides et alignés sur les besoins des clients. »

Par exemple, les chercheurs peuvent valider les données générées par l’IA en les comparant à des points de référence connus ou en utilisant des mécanismes d’autovérification pour assurer la cohérence. Ces garanties sont essentielles pour maintenir la confiance dans les données probantes du monde réel basées sur l’IA.

De l’expertise humaine à l’efficacité de l’IA

L’efficacité de l’IA dans le domaine des données probantes du monde réel dépend fortement de l’expertise de ses utilisateurs. L’élaboration d’invites précises et l’interprétation des résultats générés par l’IA nécessitent une compréhension approfondie des données et du contexte de la recherche.

« La valeur de l’IA à l’heure actuelle réside dans la combinaison de l’expertise en matière de contenu avec la capacité de créer des invites efficaces », a expliqué le Dr Fiano. « Vous devez savoir comment guider l’IA pour obtenir des résultats significatifs et vous assurer que ces résultats correspondent aux objectifs de l’étude. »

Cette approche humaine souligne l’importance de conserver la pensée critique et l’expertise du domaine, même si l’IA automatise de nombreux aspects de la génération de données du monde réel.4,2

Si l’expertise humaine fait partie intégrante, l’accès à  des données de haute qualité l’est tout autant, un problème persistant étant donné la fréquence à laquelle les données sont cloisonnées entre les institutions ou enfermées derrière des systèmes propriétaires. Les modèles d’apprentissage fédérés, qui permettent aux données de rester décentralisées tout en permettant une analyse collaborative, offrent une solution potentielle. Cependant, la mise en œuvre de ces modèles nécessite de surmonter les obstacles techniques et réglementaires.

Tendances et opportunités futures

L’apprentissage fédéré - et, plus largement, l’analyse fédérée - remodèle déjà les données probantes du monde réel en permettant une collaboration multi-institutionnelle sans nécessiter la centralisation des données au niveau des patients. 

Le Dr Fiano a partagé son point de vue sur le potentiel de l’apprentissage fédéré. « Les cadres fédérés permettent d’analyser des ensembles de données dispersés comme s’ils étaient regroupés en un seul endroit, créant ainsi une cohorte virtuelle unifiée qui surmonte les limites d’une seule institution sans jamais centraliser physiquement les dossiers sensibles des patients. »

Plutôt que de regrouper des enregistrements identifiables, les architectures fédérées exécutent localement des requêtes analytiques standardisées sur chaque partenaire de données, ne renvoyant que des résultats agrégés ou des statistiques récapitulatives. Le réseau  européen DARWIN EU en est un exemple à grande échelle. En décembre 2025, il a lancé plus de 100 études auprès de 32 partenaires de données couvrant environ 188 millions de patients6,toutes coordonnées par une approche fédérée basée sur le modèle de données commun (CDM) OMOP. 
Ce modèle est directement rendu possible par l’harmonisation basée sur l’IA via une tokenisation préservant la confidentialité qui permet des liens entre les parcours des patients à travers des ensembles de données disparates (réclamations, DSE, mortalité, génomique) sans exposer d’informations identifiables. De plus, l’alignement des schémas sémantiques et le mappage CDM automatisé réduisent la charge traditionnelle d’extraction, de transformation et de chargement (ETL) de plusieurs mois à plusieurs semaines. 

Une initiative antérieure était le Réseau européen de données et de preuves en matière de santé (EHDEN), qui se concentrait sur la collecte d’informations générales et de preuves à partir de données cliniques réelles. Le projet a depuis été transféré à la Fondation EHDEN, basée aux Pays-Bas, qui se concentre sur la construction de l’infrastructure d’un réseau fédéré à travers l’Europe.7 

Aux États-Unis, le récent changement de politique de la Food and Drug Administration (FDA) visant à accepter les données probantes du monde réel anonymisées pour certaines soumissions réglementaires valide davantage les données probantes fédérées en tant que solution de rechange crédible aux entrepôts de données centralisés.

Pour les maladies rares ou les populations de niche où une seule institution manque de puissance statistique, l’analyse fédérée permet aux chercheurs de générer des preuves d’efficacité comparative solides tout en maintenant une gouvernance stricte des données - chaque institution conserve la garde de ses données et le risque de réidentification est atténué grâce à des contrôles architecturaux qui séparent les jetons des quasi-identifiants. 9 Par exemple, les requêtes fédérées peuvent désormais relier les données génomiques, les réclamations et les registres de mortalité de plusieurs institutions pour étudier les modèles de traitement et les résultats à long terme dans les maladies ultra-rares où les sites individuels peuvent avoir moins de 50 patients, mais le réseau fédéré atteint collectivement des tailles d’échantillon suffisantes pour l’inférence causale et les preuves de niveau réglementaire.10

Conclusion

L’IA remodèle fondamentalement le paysage des données probantes du monde réel, offrant une efficacité sans précédent dans la consolidation des données, le codage, la validation et la conception d’études. Bien que les défis liés à la validité, à la transparence et à l’accès des données demeurent, les opportunités offertes par l’apprentissage fédéré et la conception d’études basées sur l’IA sont immenses.

L’IA jouera un rôle de plus en plus important dans le développement des solutions RWE  alors que les entreprises cherchent à naviguer dans les complexités de la génération de données probantes et à atteindre leurs objectifs d’accès au marché.
*Sources suite ci-dessous



Clause de non responsabilité :
Les informations fournies dans cet article ne constituent pas des conseils juridiques. Cencora, Inc. encourage vivement les lecteurs à consulter les informations disponibles relatives aux sujets abordés et à s’appuyer sur leur propre expérience et expertise pour prendre des décisions à ce sujet.

 


Entrez en contact avec notre équipe

Notre équipe d’experts en valeur de premier plan se consacre à la transformation des données probantes, des informations sur les politiques et des renseignements sur le marché en stratégies efficaces d’accès au marché mondial. Laissez-nous vous aider à naviguer en toute confiance dans les méandres complexes des soins de santé d’aujourd’hui. N’hésitez pas à nous contacter pour découvrir comment nous pouvons vous aider à atteindre vos objectifs.

Sources


1. Vers une intelligence artificielle responsable dans les soins de santé - prendre conscience des données et des preuves du monde réel. J Am Med Inform Assoc., novembre 2025. https://pmc.ncbi.nlm.nih.gov/articles/PMC12626219/
2. Opportunités et défis pour l’analyse basée sur l’IA des RWD dans la R&D pharmaceutique : Une perspective pratique, Künstliche Intelligenz, octobre 2023.  https://link.springer.com/article/10.1007/s13218-023-00809-6#:~:text=analysis%20approach,illustrate%20challenges%20and%20methodological%20considerations
3. Qu’est-ce que l’IA en boîte noire ? IBM, octobre 2024. https://www.ibm.com/think/topics/black-box-ai
4. Vers une intelligence artificielle responsable dans les soins de santé - devenir réaliste sur les données et les preuves du monde réel, J Am Med Inform Assoc., novembre 2025. https://pmc.ncbi.nlm.nih.gov/articles/PMC12626219/
5. Darwin UE. https://www.darwin-eu.org/
6. Faits saillants des mégadonnées, EMA, décembre 2025. https://ec.europa.eu/newsroom/ema/newsletter-archives/70356
7. Réseau européen des données et des preuves en matière de santé (EHDEN) : Façonner l’avenir des données de santé en Europe, Union européenne. https://data.europa.eu/en/news-events/news/european-health-data-and-evidence-network-ehden-shaping-future-health-data-europe
8. La FDA élimine un obstacle majeur à l’utilisation de preuves du monde réel dans les examens des demandes de médicaments et de dispositifs, FDA, décembre 2025. https://www.fda.gov/news-events/press-announcements/fda-eliminates-major-barrier-using-real-world-evidence-drug-and-device-application-reviews
9. Techniques de tokenisation pour préserver la confidentialité des données de santé : écrous et boulons de tokenisation., Front Drug Saf Regul., décembre 2025. https://pubmed.ncbi.nlm.nih.gov/41488932/
10. La protection de la vie privée dès la conception avec l’apprentissage fédéré stimulera la recherche future sur les maladies rares, Journal of Neuromuscular Diseases, décembre 2024. https://journals.sagepub.com/doi/10.1177/22143602241296276

 

Ressources connexes

Article

Problèmes de NICE : Preuves cliniques limitées

Article

Encadrer les prévisions sur cinq ans avec des preuves allemandes du monde réel : Modifications récentes du règlement intérieur du G-BA et implications pour l’utilisation des données relatives aux demandes de remboursement dans les dossiers AMNOG allemands

Article

La base de données nationale de santé : Une occasion de produire des preuves concrètes pour le programme d’accès anticipé ?