
Membre principal et co-leader de l'axe de recherche Innovation inclusive, ISSP
Professeure adjointe, Faculté des sciences sociales, uOttawa
Chercheur affilié, ISSP
Professeur titulaire, modélisation des maladies, Faculté des sciences, uOttawa
Le 3 avril, CBC News a publié un article avec le titre: « COVID-19 could kill 3,000 to 15,000 people in Ontario, provincial modelling shows. » Qu'est-ce que ce vaste éventail de scénarios futurs dit sur la modélisation des maladies? Et qu'est-ce que le fait que ce large éventail a fait l'actualité dit de la place de la modélisation dans les politiques et la culture ?
Une approche de politique de santé publique - qui traite des statistiques agrégées et prend des décisions dans l'intérêt de la population - est la sous-structure derrière le développement et l'utilisation de la modélisation mathématique que nous voyons maintenant rapportée presque tous les jours. Il s'agit d'une approche séculaire, du moins en Occident, que la plupart d'entre nous tenons maintenant pour acquise - par exemple en se vaccinant chaque année contre la grippe. Mais quelque chose est différent aujourd'hui dans notre capacité technique à éclairer les décisions de santé publique: l'omniprésence du suivi des données.
La grande nouveauté de notre moment historique est que nous vivons notre vie en perdant des points de données collectés numériquement (y compris chaque fois que nous nous déplaçons et cliquons en ligne). Ces données sont rassemblées par divers acteurs - de ceux qui essaient de nous vendre des grille-pain et des jeans aux mathématiciens qui essaient de prédire la propagation et l'impact de la maladie. Aujourd'hui, ces données - si volumineuses qu'elles sont qualifiées de mégadonnées - sont exploitées et intégrées dans des modèles mathématiques qui aident les décideurs politiques et les individus à donner un certain sens à des situations incroyablement complexes et, franchement, effrayantes. Autrement dit, nous pouvons compter sur le Big Data et la modélisation pour un sentiment de stabilité en période d'incertitude.
Les modèles ont deux composants. Le premier est mécaniste: décrire la façon dont les interactions se produisent entre les différents acteurs, qu'ils soient humains, animaux, virus, etc., ou toute combinaison de ceux-ci. Le second est quantitatif: déterminer la précision de ces interactions - le taux de transmission d'une maladie, le taux de naissance d'une espèce particulière, le taux de mutation d'un virus résistant aux médicaments et similaires. Les données informent les deux composantes: directement, dans le deuxième cas, et indirectement dans le premier, où les modèles doivent être discernés à partir des informations disponibles.
Il ne fait aucun doute que les données et les modèles sont utiles pour nous aider à compenser les faiblesses des biais et distorsions cognitifs humains. Ils éclairent également d'importantes décisions politiques telles que la mise à distance physique. Une partie de l'attrait des modèles est qu'ils sont la seule chose que nous ayons qui puisse prédire l'avenir. (Les boules de cristal n'existent pas). Les premières modélisations des épidémies de SRAS, de grippe porcine et de MERS se sont avérées globalement précises par rapport aux résultats globaux, suggérant que les outils dont nous disposons sont utiles, malgré la présence de données inconnues ou incomplètes. La modélisation, comme la science, est un processus précis qui produit souvent des résultats flous; par conséquent, les modèles doivent tenir compte de ce degré d'incertitude et peuvent compenser le manque de données en faisant plusieurs prédictions simultanément.
Cependant, il existe des limites aux modèles mathématiques. L'idée essentielle derrière la modélisation est de réduire les informations complexes sur le monde à des processus plus faciles à digérer, à partir desquels des décisions peuvent être prises. Cela revient à faire une carte qui inclut les principales caractéristiques géographiques et ignore le reste à travers un processus d'ignorance sélective: choisir ce qu'il faut inclure et ce qu'il faut ignorer.
Par exemple, les modèles de COVID-19 décrivent généralement la personne sensible moyenne, la personne infectée moyenne, la personne récupérée moyenne, etc. De par leur conception, ils ignorent généralement les valeurs aberrantes (il est bien sûr possible de les inclure s'ils sont jugés importants - une décision prise par les humains). Pendant l'épidémie de SRAS, par exemple, les super-épandeurs (individus qui propagent la maladie à un rythme beaucoup plus élevé que la plupart des gens) ont été un vecteur crucial et ont été inclus dans de nombreux modèles.
Les valeurs aberrantes peuvent être peu nombreuses, mais leurs expériences comptent. Les conseils de santé publique fondés sur la modélisation peuvent ne pas expliquer la vulnérabilité inéquitable des Canadiens. Par exemple, tout le monde n'est pas également capable de se distancier physiquement. Les agriculteurs et les travailleurs du système alimentaire dans les chaînes d'approvisionnement alimentaire sont particulièrement vulnérables s'ils éprouvent des difficultés à s'approvisionner en intrants agricoles, à accéder aux marchés ou à faire venir des travailleurs agricoles qui arrivent généralement d'autres pays.
Une autre limitation des modèles est liée à l'incertitude des données: la précision des modèles diminue plus la période de prédiction est longue. Tout comme les prévisions météorologiques sont précises pour demain, moins précises pour la semaine prochaine et totalement impossibles à prévoir avec précision pour l'année prochaine, les modèles de systèmes chaotiques perdent leur prévisibilité au fil du temps. Mais plus de données ne conduisent pas nécessairement à de meilleurs résultats de modélisation. Le célèbre statisticien et modéliste Nate Silver utilise l'aphorisme selon lequel «les mégadonnées créent de plus grandes meules de foin». Lorsque nous ajoutons plus de points de données, il arrive souvent que nous découvrions de nombreuses corrélations ou relations statistiquement significatives entre les variables. La plupart de ces corrélations sont fausses (sans lien de causalité) et ne sont donc pas nécessairement informatives. En fait, bon nombre des corrélations peuvent distraire et miner notre capacité à trouver un achat explicatif.
De plus, s'appuyer uniquement sur des modèles pour traverser une crise risque de substituer des données quantitatives à des explications qualitatives. Ces derniers contiennent souvent les informations nécessaires pour concevoir des modèles en premier lieu. En 2008, Chris Anderson, alors rédacteur en chef du magazine WIRED, a déclaré que la linguistique, la sociologie, la psychologie et le processus scientifique normal de développement et de test d'hypothèses étaient tous « morts » parce que « nous pouvons suivre et mesurer pourquoi les gens font ce qu'ils font avec une fidélité sans précédent. Avec suffisamment de données, les chiffres parlent d'eux-mêmes. »
Mais Anderson a tort. Les mégadonnées et les modèles mathématiques qu'ils alimentent fournissent quelques explications, mais ils ne réussissent pas bien quand il s'agit de décrire le contexte social autour des données. Nous avons fait de grands progrès dans la collecte de données quantitatives, mais nous avons toujours besoin d'une théorie qualitative pour interpréter et construire des relations mécanistes qui existent dans ces données mais qui ne peuvent être visibles sans une compréhension plus approfondie du comportement.
Les décisions humaines ne sont pas des points de données discrets; ils sont enchevêtrés dans des séquences et des contextes et des contradictions. Par exemple, les modèles ont fait très peu pour expliquer pourquoi l'Allemagne et d'autres pays européens ont montré des résultats COVID-19 si radicalement différents malgré des taux d'infection similaires. Cela nécessite des pistes d'enquête plus sociologiques: qu'en est-il des habitudes et de la culture quotidiennes des Allemands, par opposition aux Italiens, qui influencent la propagation et l'impact de la maladie?
Nous avons tous apporté des changements spectaculaires à nos vies pour empêcher la pire prévision mathématique (100 000 décès en Ontario), mais nous l'avons fait en grande partie en raison d'une incapacité à prendre en charge ce volume de malades en raison d'un manque de capacité dans nos soins de santé et systèmes d'approvisionnement médical. COVID-19 demande donc une analyse minutieuse des fragilités contenues dans nos soins de santé et nos chaînes d'approvisionnement mondiales. Un contexte désordonné (et les données qualitatives qui en parlent souvent), la théorie et l'histoire sont nécessaires pour une approche à travers COVID-19 qui est fondée sur les données et la modélisation tout en offrant quelque chose d'utile et d'équitable.