Data et Covid-19

La Data Science au service de la lutte contre le Covid-19

par Marlon Cárdenas - Data Scientist, Sopra Steria | minutes de lecture
Afin de couvrir certains besoins actuels et futurs de la société, la data science et l’Intelligence Artificielle (IA) peuvent favoriser la création de solutions technologiques dont les utilisateurs pourraient profiter au quotidien. De ce fait, nombreuses sont les disciplines qui s’unissent pour cette cause, notamment la santé, qui se distinguent tout particulièrement dans la situation de pandémie de Covid-19 que nous vivons actuellement. À cet égard, les solutions qui reposent sur ces technologies sont utilisées pour résoudre des problématiques en optimisant le temps passé ainsi que les efforts nécessaires.

Le défi de la connaissance

Le Machine Learning est un processus complexe qui peut nous aider, en tant que société, à fournir une assistance aux personnes confrontées à des problèmes complexes. Cependant, face à cet objectif ambitieux, de nouveaux défis surgissent et doivent être relevés afin de faire une place à ces technologies. Nous n’avons de cesse de vouloir tirer des enseignements de la nature, mais pour ce faire, nous avons besoin de dispositifs qui facilitent la collecte d’un grand nombre de données. De même, décrire un virus et prédire le comportement de la société face à celui-ci peut se révéler être une tâche très délicate qui nécessite des schémas d’expérimentation permettant de tirer des enseignements de ces nouvelles expériences.


Le défi se complexifie lorsque nous devons apprendre en observant jour après jour comment des situations de crise frappent la société à l’heure où les scientifiques de différentes disciplines s’efforcent d’acquérir des connaissances que personne ne possède a priori. Dans ce contexte, l’Intelligence Artificielle devient un facteur clé pour accélérer les processus d’apprentissage. Les différentes techniques qui sous-tendent cette technologie sont mises en opposition pour déterminer comment les appliquer afin de décrire le plus précisément possible la situation actuelle, prévoir ce qui pourrait se passer demain et enfin, nous aider en tant que société à déterminer la meilleure manière de procéder et d’agir. 

Outils et usages actuels

Dans ce contexte, les technologies numériques et plus précisément la data et l’Intelligence Artificielle facilitent l’émergence de fonctionnalités qui, lorsqu’elles sont appliquées dans le milieu médical, apportent une aide précieuse à la médecine. Certaines d’entre elles sont actuellement utilisées pour contribuer à la lutte contre le Covid-19.

L’exemple qui nous vient immédiatement à l’esprit est celui des applications qui sont développées dans plusieurs pays pour surveiller la propagation du virus. Ces applications génèrent un identifiant sur le téléphone et enregistrent les identifiants d'autres utilisateurs avec lesquels l’individu a été en contact. De cette façon, si un individu est positif au Covid-19, l’information est enregistrée dans l’application et le système revoit l’historique des données des personnes avec lesquelles l’individu a été en contact au cours des jours précédents pour éviter la propagation de la contamination. 
En résumé, l’application indique que l’individu a été en contact avec un certain nombre de personnes au cours d’un certain nombre de jours et permet d’obtenir des statistiques agrégées et des données globales pour aider à la prise de décisions. Afin de garantir le respect de la vie privée et de la protection des données, les informations sont anonymes et ne sont pas transmises en temps réel.

Par ailleurs, ces technologies peuvent servir à réaliser des prévisions sur la contagion et permettre notamment de détecter de nouveaux cas. Il existe déjà quelques exemples de ce type d’utilisations. Les approches analytiques permettant le diagnostic des maladies supposent de déterminer la probabilité de la présence d'une maladie sur la base d'une série de symptômes et de caractéristiques du patient. Pour cela, il est impératif d’avoir la capacité de mesurer ces symptômes et ces caractéristiques, et de les analyser conjointement, ce qui permettra d’améliorer et d’augmenter la rapidité du diagnostic au fur et à mesure que le volume des données augmente.

Pour parvenir à ce diagnostic, on utilise des modèles prédictifs basés sur des ensembles de données qui doivent être traités préalablement, en appliquant pour cela des techniques comme le traitement du langage naturel, le nettoyage des données, la reconnaissance des images médicales, etc. L’objectif consiste à agréger toutes les informations dans un ensemble de données prêt à être analysé.

Les modèles prédictifs visent à déterminer une probabilité d’appartenance à une catégorie spécifique, par exemple, la probabilité selon laquelle un nouveau cas d’étude (un nouveau patient avec ses propres variables symptomatiques mesurées) est susceptible de contracter la maladie.

De même, on peut favoriser la télémédecine en permettant aux professionnels de la santé, quel que soit leur domaine de compétence, de travailler en collaboration, ou bien faciliter le diagnostic à distance, par exemple, à travers des systèmes de vidéoconférence, des solutions de réalité augmentée, l’analyse de données et l’IoT.

Toutes les disciplines, tous les secteurs et tous les individus ont un rôle à jouer et peuvent apporter leur soutien, que ce soit en développant des solutions, en aidant à la distribution, en s’occupant des patients, en nettoyant et désinfectant les hôpitaux ou bien en restant chez eux. Dans ce contexte, la Data Science est une alliée précieuse dans ce combat dans lequel nous sommes tous engagés.
Search