JustOneGiantLab : Quantifier les communautés pour analyser une pandémie

Publié le 22 mai 2020 par Cherise Fong

Si l’Initiative OpenCovid19 de JOGL est née d’une crise, les collaborations multidisciplinaires qui se tissent entre ses membres autour d’un nombre croissant de projets prouvent que cette plateforme ouverte en ligne est beaucoup plus qu’une mobilisation éclair. Que nous racontent les chiffres ?

Marc Santolini, un des cofondateurs de Just One Giant Lab (JOGL) avec le pionnier français de la biologie communautaire Thomas Landrain et le bioinformaticien Léo Blondel, a passé les deux dernières années au Centre de Recherche Interdisciplinaire (CRI) à étudier comment les communautés s’organisent et collaborent en utilisant la science des réseaux et des approches basées sur les données dans le but de développer des outils qui facilitent l’intelligence collective.

Dans le cadre de l’Initiative OpenCovid19, il dirige l’équipe Metastudy pour examiner de près l’activité de cette communauté ouverte depuis son lancement en mars 2020. En même temps, l’équipe développe un système de recommandation algorithmique pour optimiser les correspondances entre les besoins des projets et les compétences ou les ressources des contributeurs du réseau.

« L’idée c’est que derrière JOGL il y a un réseau d’acteurs, explique Marc Santolini. Ces acteurs sont liés à des projets qu’ils suivent, à des personnes avec qui ils interagissent, à des compétences, à des besoins, et bien d’autres objets qui sont sur la plateforme. C’est un réseau d’acteurs que nous appelons un réseau d’information hétérogène. L’algorithme prédit des connexions potentielles dans ce réseau hétérogène. En d’autres termes nous pouvons prédire un lien d’une personne à une autre personne qui n’existe pas encore, mais basé sur le réseau, nous pouvons dire que très probablement il devrait exister. Nous pouvons le faire en nous appuyant sur la structure du réseau mais aussi sur certains méta-chemins du réseau que nous voulons mettre en avant. Par exemple, nous pouvons faire de la correspondance entre des besoins qui existent sur la plateforme et des gens qui pourraient répondre à ces besoins, ou entre des projets similaires. »

Visualisation des liens entre des projets JOGL en avril 2020. © JOGL

Fonctionnant en prototypage itératif, l’équipe a déjà appliqué cette méthodologie pour mieux connaître l’espace de travail Slack OpenCovid19, où l’outil d’analyse TeamChatViz indiquait que les nouveaux membres étaient souvent bloqués à l’entrée du réseau. A présent, les nouveaux membres sont automatiquement inscrits à des canaux où ils sont susceptibles de faire des rencontres intéressantes, de personnes qu’ils n’auraient peut-être pas connues autrement.

« On essaie de faire un algorithme qui évite les effets de bulle et maximise l’intelligence collective sur la plateforme. »

– Marc Santolini

Marc Santolini et Bastian Greshake Tzovaras, codirecteur de la communauté Open Humans pour l’auto-recherche sur les données de santé personnelles, ont récemment reçu une subvention Nesta sur l’intelligence collective pour animer ces groupes de recherche menée par les patients (les personnes suivent et analysent leur propres symptômes, les diabétiques construisant leur propre matériel…). JOGL aidera ces personnes à mieux s’organiser en communautés d’auto-recherche plus spécialisées en développant un système dédié de recommandations et en testant leur impact relatif en les comparant à des recommandations randomisées.

La puissance des pairs

Cohérente avec cette approche horizontale, la sélection des projets OpenCovid19 pour les micro-bourses de JOGL est déterminée par les évaluations d’autres membres (peer reviews) du réseau OpenCovid19. Ce processus participatif a été conçu par Chris Graham et Elliot Lawton, sur la base de l’architecture originale du programme JOGL Co-Immune. Ce dernier a également servi de base pour la communauté jumelle d’OpenCovid19, Helpful Engineering.

« Dans le monde universitaire, le financement des bourses est lent, l’évaluation par les pairs est lente, et honnêtement, toute la science est lente, à moins de concentrer ses efforts sur un champ très réduit. Mais tout cela peut être accéléré par la collaboration et l’augmentation du nombre de personnes afin de répartir les responsabilités de certains individus, avance Chris Graham. Chez JOGL, le système ouvert des bourses et l’analyse des réflexions collectives sur les projets qui en découle nous permet de soutenir financièrement et de manière éthique une liste de projets fantastiques qui conviennent à la fois à la science et à la communauté. »

« Je crois à la science ouverte et au partage collectif des idées, poursuit-il. Nous rêvons tous qu’à l’avenir, les scientifiques utiliseront le Web pour collaborer et atteindre leurs objectifs de manière plus efficace, en brisant toutes les barrières hiérarchiques traditionnelles pour aller directement à la source, qu’il s’agisse de financement, de partage d’idées ou d’évaluation par les pairs. »

Résultats du deuxième tour des micro-bourses de JOGL. © JOGL

Pendant que JOGL collabore avec Kap Code pour créer une base de données ouverte sur le Covid-19, Kaggle a déjà lancé son COVID-19 Open Research Dataset (CORD-19), un ensemble de plus de 63.000 articles universitaires libres d’accès sur le Covid-19, le Sars-CoV-2 et d’autres coronavirus, suivi par « un appel aux experts du monde en intelligence artificielle pour développer des outils d’analyse de texte et de données qui puissent aider la communauté médicale à trouver des réponses aux questions scientifiques les plus pressantes ».

Au CRI, Marc Santolini (avec un de ses associés postdoctorant dont le sujet de recherche est « l’émergence et la disparition des champs de recherche ») compte explorer à fond les dynamiques entre chercheurs dans le contexte Covid-19, par exemple en analysant leurs comportements en terme de citations de leurs pairs et des projets réalisés, afin de les comparer avec les relations collaboratives sur le réseau de JOGL.

« Les gens ont-ils été plus collaboratifs ou au contraire plus compétitifs que d’habitude ? se demande Marc. Peut-on tracer un comparatif entre la communauté qu’on a réussi à faire émerger, qui a réussi à collaborer et à mener à bien des projets, et les collaborations et réussites du monde universitaire traditionnel ? En résumé, nous voulons analyser les différences entres les approches institutionnelles et non-institutionnelles dans ce sprint de la recherche sur le Covid. Quelles sont les forces particulières des communautés ouvertes ? »

Des prédictions à partir de données participatives

En plus de ces projets métascientifiques axées sur les données au sein de la communauté JOGL elle-même, de nombreux projets sur la plateforme se concentrent sur la recherche et le développement de méthodes de collecte de données, d’analyses, de modèles et de simulations pour décrire et prédire la pandémie de Covid-19.

Un des projets en intelligence artificielle les plus ambitieux sur JOGL (ainsi que sur la plateforme spécialisée CoronaWhy) est le Computational Epidemiology Modeling Toolkit (#epimodelingtoolkit) de John Urbanik, un ensemble d’outils ouverts qui permettent aux épidémiologistes d’échanger des données et de créer des modèles de l’évolution du Covid-19 dans des situations précises. Le projet est similaire à des efforts parallèles de la part des contributeurs au défi de prédiction Covid-19 de Kaggle ou de l’équipe universitaire derrière le site EpidemicForecasting.org.

Deux autres projets de l’Initiative OpenCovid19, tous deux lauréats de micro-bourses de JOGL, font face à la pandémie en utilisant des données désidentifiées provenant de sources participatives et communautaires. Leurs approches open source se distinguent des applications institutionnelles plus hiérarchiques.

Quantified Flu est un projet en cours porté par le chercheur au CRI Bastian Greshake Tzovaras et Mad Price Ball qui dirigent tous deux la communauté Open Humans. Il a pour but de rassembler, visualiser et analyser les données brutes récupérées par des appareils personnels de santé (Fitbit, Oura Ring, Google Fit, Apple Watch). Les participants ont accès en priorité à ces données pour essayer de comprendre leurs propres symptômes ; ils peuvent également choisir de les partager avec la communauté Open Humans ou même les chercheurs universitaires.

Du côté institutionnel, l’appli mobile COVID Symptom Study, approuvée par les gouvernements d’Ecosse et du Pays de Galles et lancé par un épidémiologiste du King’s College London et sa société Zoe, invite des millions de citoyens au Royaume-Uni et aux Etats-Unis à surveiller leurs symptômes en temps réel, pour éventuellement aider les universitaires à prédire la probabilité d’une infection de Covid-19.

CoughCheck App est un projet IA pour développer une application mobile qui analyse le son de votre toux pour déterminer sa prédiction algorithmique. Suite à son lancement à grand succès sur JOGL en mars, CoughCheck App compte actuellement 47 membres et 27 abonnés, et le porteur du projet Hernán Morales Durand collabore avec Open Humans pour récolter et stocker des échantillons sonores et autres données sur la santé des participants. En parallèle institutionnel, le COVID-19 Sounds App développé par l’université de Cambridge sollicite des gens du monde entier à contribuer les sons de leur toux, souffle et voix pour avancer leur recherche universitaire.

Des simulations de la courbe invisible

Une des forces inhérentes à JOGL en tant que plateforme mondiale, ouverte et collaborative est sa capacité de prolonger ses tentacules au-delà du biohacking, au-delà du monde universitaire, au-delà des réseaux sociaux pour pénétrer dans le chaos désordonné des communautés du monde réel. Ces communautés défavorisées et exceptionnellement denses des bidonvilles, des dortoirs de travailleurs migrants ou des camps de réfugiés surpeuplés nous rappellent que la distanciation sociale est un luxe. Si ces populations sont parmi les plus à risque en cas d’épidémie, elles sont souvent négligées par les prédictions officielles.

Il y a quelques mois, Billy Zhao, cofondateur de la communauté AI for Good London, a rassemblé une équipe internationale et multidisciplinaire de collaborateurs de l’Angleterre à l’Ethiopie pour étudier et modéliser la propagation possible de Covid-19 dans le camp de réfugiés Moria en Grèce. En avril, l’équipe est primée dans le hackathon Hack from Home pour la démonstration de faisabilité de leur projet AI for Good Simulator. Toujours à la recherche de collaborateurs issus d’une communauté plus vaste, le projet de simulateur a depuis rejoint l’Initiative OpenCovid19 de JOGL.

Avec ses milliers de tentes plantées sur une surface de moins d’un kilomètre carré, où habitent plus de 19.000 réfugiés venus de la Syrie et de l’Afghanistan, Moria est le plus grand camp de réfugiés en Europe. « Il y a des gens qui y habitent depuis des années dans des situations très tendues, raconte Billy. Ils se méfient des autorités, car ils étaient censés quitter l’île de Lesbos il y a longtemps, mais le gouvernement n’a pas tenu ses promesses. Dans certains cas, les résidents du camp n’ont pas de téléphones portables, ce qui fait que c’est difficile de les contacter. On veut vraiment comprendre leurs attitudes envers les différentes interventions possibles, pouvoir estimer combien de personnes vont effectivement suivre les règles, savoir ce qu’on peut envisager dans le camp. Actuellement ils ne sont même pas sûrs qu’il y ait suffisamment de terrain ou de capacité pour installer des centres de quarantaine. »

Heureusement, parmi les membres au sein de l’équipe du AI for Good Simulator figurent Alice Piterova, qui a beaucoup d’expérience avec les acteurs de l’humanitaire après avoir travaillé chez Techfugees, et Joel Hernandez, qui travaille avec une ONG sur place au camp Moria depuis plusieurs années. Billy a recruté une vingtaine de bénévoles sur les sites de Help with COVID et Data Science for Social Good, en espérant trouver d’autres sur JOGL. L’équipe est divisée en trois sous-groupes : la recherche sur les utilisateurs, la modélisation mathématique de l’épidémiologie et la visualisation des données pour le tableau de bord final. Ils sont également en contact régulier avec des épidémiologistes de la London School of Hygiene and Tropical Medicine.

Ensemble, ils travaillent sur la conception et le développement d’un modèle épidémiologique spécifique au camp Moria pour soutenir les ONG dans leurs actions de mobilisation et aider les autorités locales à rapidement implémenter des mesures efficaces. « Car au moment où l’on découvre le premier mort au sein du camp, le virus est probablement partout, il est peut-être déjà trop tard » prévient Billy.

Quant au AI for Good Simulator, Billy pense qu’il faut prendre le temps de recherche et de développement nécessaire pour bien contrôler son application sur le terrain. L’équipe compare actuellement trois modèles différents, dont un modèle basé sur la recherche universitaire d’une épidémie de choléra en 2014 dans le camp de réfugiés Daadab au Kenya.

« Ces trois différents modèles sont tous extraits d’une même réalité, mais parce qu’ils ont des hypothèses différentes, chacun raconte une histoire différente, explique Billy. Lorsque les trois modèles sont en accord, on voit tout de suite quelle serait probablement la meilleure intervention. Mais quand ils sont en désaccord, on peut les disséquer en disant cette hypothèse mène à ceci, cette autre hypothèse mène à cela, aussi il serait prudent d’y réfléchir un peu plus. »

« Maintenant nous sommes dans une première phase d’exploration, en contactant les différentes ONG pour essayer de comprendre leurs besoins, ce qu’ils font actuellement. Il y a également des groupes universitaires qui réfléchissent à comment utiliser des images de satellite haute-résolution pour identifier les points de congestion à l’intérieur du camp… Donc il y aura d’autres applications IA à faire dans le futur. »

Se projeter

Pendant que tous ces projets gagnent des membres sur JOGL, la plateforme collaborative continue à raffiner ses recommandations afin de créer des synergies pour un avenir durable au-delà du Covid-19.

« Après le feu de la crise vient le défi de pouvoir stabiliser ces projets de collaboration ouverte sur la durée, rappelle Marc Santolini. Des stratégies intelligentes sont essentielles pour orienter les nouveaux membres des communautés qui grandissent rapidement et où il est facile de se perdre. Aussi il est important de créer une architecture d’attention avec des systèmes de recommandations, mais il faut qu’elle tienne compte des besoins spécifiques associés aux différentes phases du cycle d’un projet : formation des équipes et des idées, implémentation, documentation. L’équipe de JOGL collabore actuellement avec des chercheurs en sciences sociales, des informaticiens, des chefs de projet et des spécialistes de l’expérience utilisateur pour aider à concevoir cette architecture. Paradoxalement, c’est l’intelligence collective qui est au cœur de son propre design. »

Rejoindre l’Initiative OpenCovid19 de JOGL