Plus que jamais, le monde a besoin d’intendants de données

October 1, 2020
2020-09-28T114354Z_169671063_RC2N7J9CCK2F_RTRMADP_3_HEALTH-CORONAVIRUS-SPAIN (1)_0.JPG
(Reuters/Sergio Perez)

This essay is also available in English.

 

Cet article est le premier d’une série d’analyses produites en collaboration avec Statistique Canada.

La crise du coronavirus (COVID-19) est la dernière illustration de l’importance du rôle des statistiques dans l’orientation des actions politiques et individuelles. En raison des différences relevées dans les taux de test et dans la façon dont la cause des décès est enregistrée dans les dossiers publics, l’ampleur de la pandémie est inconnue, ce qui complique la prise des mesures visant à la contrer. Par exemple, l’Afrique subsaharienne a enregistré son premier cas de COVID-19 à la fin février seulement, et même par la suite, ses dossiers à cet égard sont demeurés à la traîne par rapport aux autres régions du monde. Ce retard pourrait s’expliquer par l’arrivée et la propagation réellement lentes du virus dans cette région; par la « co-immunité » créée au sein de la population (en raison de l’exposition à d’autres microbes dont l’interaction avec la COVID-19 n’est actuellement pas comprise); ou par le manque de tests, et donc de données, sur le continent.

Autre exemple : certains analystes du renseignement américain pensent que l’ampleur de la pandémie et le nombre de décès survenus en Chine ont été sous-estimés par les autorités. Les différentes approches adoptées pour déterminer la  cause des décès durant la pandémie ont aussi donné lieu à des taux de mortalité disparates concernant ce virus, et certains États des É.-U. ont ainsi sous-estimé le nombre de décès liés à ce virus, tandis que d’autres l’ont surestimé.  Et comme des personnes infectées peuvent être asymptomatiques, le taux d’infection réel peut être plus élevé que le nombre de cas confirmés.

C’est pourquoi, sans données statistiques détaillées et comparables, et surtout, sans la volonté politique générale et sans la capacité, notamment institutionnelle, de réunir, de diffuser et d’interpréter ces données, nous n’arriverons jamais à distinguer les faits de la fiction, ou la coïncidence de la causalité.

Il faut des données, tant générales que détaillées

Au début de la pandémie, les décideurs de nombreux pays, dont le Canada, ont pris des mesures audacieuses pour prioriser la santé publique, réduire ou éliminer la mobilité des gens et offrir un soutien financier aux personnes et aux entreprises. Les effets socio-économiques de ces mesures nécessaires ont été rapides et intenses. 

Grâce à leurs outils (les sondages et les données administratives), les statisticiens ont pu montrer les différentes répercussions de la COVID-19 sur des segments spécifiques de la population et sur certains secteurs, ainsi que les premières incidences sociales de l’arrêt. En sus des instruments par lesquels ils obtiennent des indicateurs socio-économiques, les statisticiens ont complété leur boîte à outils d’un certain nombre de méthodes novatrices, comme l’externalisation ouverte, des comités Web, des applications Web, des données satellites et des données sur la mobilité, pour obtenir un tableau des effets non seulement généraux, mais aussi ciblés du virus et assurer la prise de décisions politiques en temps presque réel. 

Ces innovations, c’est-à-dire les estimations rapides du PIB et du commerce, les estimations à grande échelle au niveau de la mobilité (personnes et biens), les ajustements à certains concepts, comme le « chômage », et les expériences rapportées par la population dans des domaines aussi divers que la santé mentale, l’anxiété et le stress, les changements dans les tendances à l’épargne et à la consommation, les difficultés financières, l’éducation, ainsi que la confiance dans la science et les autorités publiques, pour ne citer que ces exemples, ont aidé les décideurs à tracer la voie vers une certaine forme de rétablissement. Les statisticiens tirent parti des normes et des classifications internationales courantes pour dresser un portrait intégré des différentes expériences nationales concernant ce virus, des politiques qui en ont découlé et de leurs effets sur les sociétés et les économies.

Les fondements d’une intendance des données solide 

La pandémie a exposé des lacunes au niveau des données (concernant certaines sous-populations et certaines régions géographiques) et de la rapidité de leur collecte et de leur traitement; elle a également soulevé des questions concernant la protection des renseignements personnels, la confidentialité, la confiance et l’accès aux données personnelles par des  organisations privées et publiques, et les cadres juridiques qui en découlent. Mais elle a aussi montré l’importance fondamentale des données. La rigueur statistique mise en place pour déterminer la prévalence et la propagation d’un virus dans toutes ses dimensions spatiales et temporelles forme la base des modèles utilisés pour orienter les décisions, que ce soit en temps normal ou dans des circonstances extraordinaires.

Les fondements de la gouvernance économique actuelle ont été établies dans les années 1940, plus particulièrement lors des conférences de Bretton Woods (1944) et de San Francisco (1945), d’où sont sorties les grandes institutions internationales de développement économique et sociale qui fonctionnent aujourd’hui encore. Pour ces institutions (le Fonds monétaire international, la Banque mondiale et les Nations Unies, et leurs agences respectives), qui reposent toutes sur la coopération mondiale pour mener à bien leurs mandats respectifs, la principale condition a toujours été d’avoir de bonnes données : elles ont besoin de chiffres fiables, à jour et utiles qui leur permettent de prendre des décisions pertinentes et de faire des comparaisons entre les administrations au fil du temps.

Moins connu que les réunions organisées à Bretton Woods et à San Francisco (mais au moins tout aussi important), un rassemblement a eu lieu au New Jersey à la fin décembre 1947. Sous la direction de Richard Stone, le sous-comité sur la statistique du revenu national du comité des experts statistiques de la Ligue des nations (Sub-Committee on National Income Statistics of the League of Nations Committee of Statistical Experts) s’est réuni à Princeton pour compléter la mesure du revenu national et l’édification des comptes sociaux (Measurement of National Income and the Construction of Social Accounts), un rapport qui a mené à l’établissement de la Commission statistique des Nations unies (CSNU). Mis en place par cette commission, le Système de comptabilité nationale (SCN) a, depuis, bien servi au monde, car les méthodes de mesure normalisées sont réellement un bien public mondial, accessible à tous (c’est-à-dire un bien dont personne n’est exclu et qui ne peut pas faire l’objet d’une quelconque rivalité), et il ne peut pas produire son plein potentiel si seul le marché en bénéficie. La structure du SCN a fondamentalement changé la nature de l’économie, qui est passée d’une science sociale déductive à une science fondée sur l’observation et la mesure empiriques.

L’évolution de Statistique Canada est inextricablement liée à l’évolution statistique sur la scène internationale ainsi qu’au développement des cadres statistiques qui assurent la cohérence et la comparabilité des données statistiques. Au fil du temps, et depuis sa création, en 1918, le Bureau fédéral de la statistique (BFS) a constamment amélioré ses mesures des activités économiques. À la fin des années 1940, il avait commencé à produire une série de comptes équilibrés. Il a poursuivi ce travail durant les années 1950 en produisant des estimations du flux des biens et des services. À ce moment là, le Canada jouait déjà un rôle substantiel sur la scène internationale du fait qu’il avait été nommé président de la CSNU lors de la création de cet organisme, en 1947. Durant les années 1960, le BFS a commencé à utiliser des ajustements saisonniers pour ses comptes semestriels, et a fait de grands pas dans l’amélioration de la classification des biens et des produits. C’est aussi durant cette période que les données statistiques sociales se sont raffinées grâce à la  modernisation de la définition de l’emploi dans l’Enquête sur la population active. En 1963, l'Institut international de la statistique a tenu sa conférence mondiale sur la statistique à Ottawa, dans laquelle le BFS a joué un rôle important, notamment au niveau du programme prévu. Parallèlement aux demandes de données plus détaillées, on a mis en place de meilleures pratiques de confidentialité.

Au-delà de la rapidité d'obtention et de la précision, la pertinence des données est fondamentale. Que mesurer et pourquoi sont des préoccupations majeures des bureaux de la statistique nationale du monde entier.

En 1971, le BFS est devenu Statistique Canada. À ce moment là, le Canada était devenu un pays mature en termes de données statistiques. Grâce à de multiples progrès dans le domaine de la comptabilité nationale, le Canada est parvenu à l’avant-garde, et le chef des comptes nationaux a été nommé directeur de la Division de la statistique des Nations Unies en 1972. Au fil du temps, le Canada s’est hissé parmi les grands du monde de la statistique internationale en développant constamment de nouvelles méthodes pour mesurer l’activité socio-économique. Dans le cadre des Nations Unies, le Canada a joué un rôle crucial dans la création d’une série de groupes de réflexion (connus sous le nom de groupes de ville) ayant pour mandat d’axer la recherche et le développement sur les façons de mesurer les nouveaux phénomènes.

Dans les années 1990, Statistique Canada a considérablement élargi son portefeuille des statistiques sociales avec, entre autres programmes, des enquêtes longitudinales liées à la dynamique des revenus, aux enfants et à la jeunesse. Cet organisme a aussi consenti de nombreux efforts afin de développer une capacité analytique pour les domaines économiques et sociaux et le secteur de la santé. À l’étranger, le Canada a été un important influenceur, qui a préconisé, et avec succès, la création du poste de statisticien en chef à l’Organisation de coopération et de développement économiques (OCDE). De plus, durant cette même décennie, Statistique Canada a obtenu deux fois le titre de première agence statistique du monde. C’est aussi pendant cette période que ce Ministère a entrepris le projet majeur d’améliorer les statistiques provinciales et économiques. Ce projet a été créé pour obtenir des estimations des parts provinciales liées à la nouvelle taxe sur les ventes harmonisées. Ce faisant, Statistique Canada a modernisé la façon dont les statistiques économiques étaient produites et influé sur certains programmes de statistiques sociales.

Statistique Canada a été l’une des premières organisations statistiques à offrir ses produits sur un site Web (1996) et un adepte précoce de la collecte et de l’administration du recensement en ligne (2006). Au fur et à mesure que des changements survenaient dans le contexte socio-économique, ce Ministère continuait d’innover. Il y a trois ans, il a amorcé un programme de modernisation ambitieux fondé sur cinq piliers : la prestation de services axée sur les utilisateurs, des méthodes et une intégration des données avant‑gardistes, le partage et la collaboration, le renforcement des capacités et du leadership statistiques et, finalement, une main-d'œuvre moderne et un milieu de travail souple. Les progrès liés à chacun des piliers lui ont permis de continuer de transmettre les données et les analyses nécessaires à la phase de rétablissement de la pandémie. Plus récemment, à cause de la pandémie, Statistique Canada a élaboré de nouveaux outils, tels que le Tableau de bord sur l’économie du Canada et la COVID-19, l’Explorateur géospatial des statistiques canadiennes et les données préliminaires sur le nombre de cas de COVID-19 confirmés au Canada afin de faciliter l’accès rapide à divers renseignements. Ce Ministère a aussi fortement influencé la stratégie de collecte des données du service public fédéral en jouant le rôle d’intendant des données afin, d’une part, de renforcer la capacité de gestion des données, l’infrastructure sous‑jacente, la gouvernance, la capacité générale et l’expertise et, d’autre part, d’accroître la valeur des données en tant qu’atout pour les Canadiens. Statistique Canada travaille en étroite collaboration avec des entités comme le Conseil canadien des normes sur le Collectif canadien de normalisation en matière de gouvernance des données, récemment formé, le Conseil stratégique des DPI (CSDPI) (une tribune à l’intention des directeurs de l'information) et le Centre pour l’innovation dans la gouvernance internationale, pour ne citer que ces exemples, afin d’édifier une société responsable axée sur les données.

L’obtention rapide des données : un point essentiel

La rapidité de la collecte des données est essentielle à bien des égards. La pandémie actuelle a montré l’importance de recueillir et de diffuser rapidement les données sur les aspects clés de la COVID-19, tant pour élaborer des réponses que pour informer et éduquer le public. 

Les bureaux nationaux de la statistique se sont transformés pour mieux utiliser les autres sources de données. Par exemple, la nécessité d’obtenir des renseignements plus détaillés et de l’information en temps réel entraîne un accroissement de l’utilisation des données de capteur, c’est-à-dire un flux de données plus continu, qui comprend des données de balayage, des données GPS (par exemple, les déplacements de camions) et des données issues de l’observation de la terre (y compris les données satellites). On utilise l’externalisation ouverte comme méthode de collecte souple pour obtenir des renseignements opportuns sur les effets de la COVID-19 sur la santé mentale des Canadiens, leur capacité de terminer leurs études, leur entreprise, et bien d’autres aspects. On continuera de développer ces nouvelles méthodes, qui joueront probablement un rôle prépondérant lorsque le Canada amorcera un début de rétablissement.

Le phénomène connu sous le nom d’« éclairage nocturne » constitue un exemple d’autre source des données qui améliore la rapidité de l’obtention des données. À partir de la moitié des années 2000, le contrôle spatial des schémas d’illumination au sol comme indicateurs de croissance des mesures du PIB a ajouté vitesse et précision aux formes conventionnelles de collecte des données, plus particulièrement dans les pays aux prises avec une capacité humaine et une infrastructure faibles. Suite à une récente étude des progrès dans ce domaine, on a découvert que, dans un vaste éventail de pays, les données satellites étaient solides par rapport aux approches plus conventionnelles de mesure de l’activité économique. Elles procurent même des renseignements que l’on ne trouve pas à l’aide des données recueillies par des méthodes traditionnelles. De même, on explore la surveillance par satellite des émissions de gaz à effet de serre pour évaluer sa capacité potentielle de produire des indicateurs rapides, précis et impartiaux de l’évolution vers les objectifs et les engagements liés au changement climatique.

La pandémie a mis au défi Statistique Canada et d’autres bureaux de la statistique nationaux en les incitant à aller au-delà de leurs rôles traditionnels de fournisseurs de bonnes données et de bonnes analyses pour jouer un rôle plus actif d’intendants de données et de fournisseurs de dépôts de données et de micro-données; or, ce nouveau rôle nécessite une infrastructure d’accès, de partage et d’analyse. De modestes investissements dans les technologies en nuage, dans l’analyse des données en tant que service ainsi que dans l’accès à distance en temps réel de chercheurs et de laboratoires de données virtuelles rapportent des dividendes, car ils permettent de relier des questions politiques complexes à des experts en analyse de données. 

Les données doivent être précises

En 2016, on a estimé que les mauvaises données coûtaient chaque année 3 billions USD à l’économie des É.-U. Ce chiffre couvre les coûts liés à la collecte, au nettoyage, à l’organisation et à la correction des données ainsi que les coûts imputables aux décisions inefficaces prises sur la base des mauvaises données.  Aucune estimation n’a encore été faite à cet égard pour le Canada, mais il serait raisonnable de penser que, vu la similarité des processus corporatifs et gouvernementaux entre les deux pays, les pertes imputables aux mauvaises données au Canada représentent chaque année environ un dixième de l’estimation faite aux É.-U., soit 400 milliards CDN.

Pour réduire au maximum les erreurs dans ses données statistiques officielles, Statistique Canada a élaboré et utilise des lignes directrices rigoureuses concernant la qualité des données, qui ont récemment été étendues pour couvrir les sources autres que les sondages, comme les mégadonnées. L’organisme fait un effort considérable pour tester ses chiffres avant leur publication, publier des estimations initiales sous la forme de « séries expérimentales » et chercher proactivement à obtenir une rétroaction avant de faire passer une série à la production normale. 

Par exemple, lorsque Statistique Canada est passé aux estimations par satellite du rendement des cultures, son évaluation comprenait la « confirmation sur le terrain » des données d'observation de la terre, soit, notamment, la vérification directe, sur place, des types de cultures. De plus, ce modèle a été validé par la réalisation du sondage traditionnel et, en parallèle, par la série modélisée (par satellite). Lorsque Statistique Canada a eu la conviction que ces modèles fonctionnaient comme prévu, il a demandé l’avis d’intervenants clés. Ce n’est que lorsqu’il a été satisfait de l’augmentation de la qualité des données modélisées que Statistique Canada a annulé le sondage correspondant, complété par des répondants, pour passer à une approche par satellite.

L’importance de la pertinence des données

Au-delà de la rapidité d'obtention et de la précision, la pertinence des données est fondamentale. Que mesurer et pourquoi sont des préoccupations majeures des bureaux de la statistique nationale du monde entier. Comme nous l’avons expliqué ci-dessus, l’évolution du  système statistique a commencé par le besoin de cerner les moteurs de l’activité économique à ce moment là. En1953, les statisticiens se sont posé les questions suivantes :

  • Quelle proportion du produit total d’une économie est consacrée à la consommation, et non pas à la formation de capital?
  • Dans quelle mesure l’économie dépend-elle du commerce extérieur?
  • Quel rôle joue l'aide extérieure dans l’offre des biens et des services absorbés par l’économie?
  • Quelles sont les quantités relatives de produits issues de divers secteurs industriels, comme l’agriculture, l'industrie manufacturière et le commerce?
  • Comment différents secteurs de l’économie procurent-ils une épargne utilisable pour le développement du capital?

La société et l’économie ont considérablement évolué depuis les années 1950, et c’est également le cas des cadres statistiques. La pandémie actuelle a, cependant, montré qu’il nous manque encore beaucoup de données et que les cadres statistiques officiels doivent évoluer plus rapidement pour s’adapter aux changements fondamentaux survenus dans la société et dans l’économie.

L’émergence de l’économie numérique et intangible en est un exemple probant. Comme cette pandémie le montre, l’influence de l’économie numérique est plus manifeste que jamais, car la distanciation physique touche maintenant tous les aspects de l’interaction humaine. Afin de comprendre les effets de l’économie numérique, nous avons besoin de nouvelles séries de données statistiques pour interpréter l’économie et la société.  Par exemple, est-ce que les entreprises et les pays utilisent des définitions communes (ou même comparables) pour des produits intangibles? Mesurent-ils les diverses composantes des actifs incorporels? L’ampleur de la croissance de l’économie intangible est généralement illustrée par la valeur des actifs incorporels issue des évaluations au niveau des entreprises.

Composants de la valeur du marché de l’indice S&P 500

Now More than Ever, the World Needs Data Stewards_GRAPH_FR.png
Source : Ocean Tomo (2020).

Une nouvelle série de conventions sur ce qui constitue les actifs incorporels et la façon de les mesurer s’impose. Vu la rapidité des changements dans ce domaine, et les répercussions socio-économiques que cela entraîne, il est nécessaire d’accroître la fréquence des sondages et de subdiviser les données statistiques pour les répartir entre leurs principaux éléments socio-économiques. 

L’émergence de ce que l’on appelle les mégadonnées, qui déterminent les systèmes de l’intelligence artificielle et sont elles-mêmes considérées comme un atout commercial, a également montré la nécessité d’élaborer une nouvelle série de conventions sur les  données. L’un des domaines les plus complexes des négociations internationales est la localisation des données, l’exigence portant que les données d’un citoyen d’un pays donné soient conservées sur des serveurs situés à l’intérieur des frontières de ce pays. Au fur et à mesure que les pays assoient leurs positions sur l’importance des données de leurs citoyens, la communauté mondiale risque fort d’exiger une convention qui définisse les classes de données, ce qui facilitera la discussion visant à déterminer quelles données doivent être localisées et lesquelles n’ont pas besoin d’être localisées. Statistique Canada, qui est à l’avant-garde du travail international concernant les enjeux liés aux mesures dans ces domaines, poursuivra son travail novateur de mesure de la valeur des données et des effets de la numérisation sur la société et l’économie canadiennes.

De récents événements ont mis au jour d’importants problèmes sociaux sous-jacents tant au Canada qu’à l’étranger. L’injustice raciale et les inégalités économiques sont devenus des foyers de protestation et de désobéissance civiles. La montée des mouvements qui cherchent à obtenir une équité raciale et sociale en réponse à des injustices historiques a clairement montré qu’il était nécessaire que tous les niveaux de gouvernements reconnaissent ces inégalités et y remédient.  Pour ce faire, il faudra adopter une approche cohérente pour comprendre les obstacles qui empêchent la participation totale et égale des populations marginalisées, comme les autochtones et les communautés racialisées, à la société civile. La pandémie de la COVID-19 a exacerbé ces problèmes : au fur et à mesure qu’elle se propageait et que les gouvernements prenaient des mesures pour protéger leurs citoyens des difficultés économiques et de l’injustice sociale, il est devenu de plus en plus évident que les  communautés marginalisées ne jouissaient pas d’une protection similaire à celle de la population générale. Au Canada, cette inégalité s’est manifestée de différentes et nombreuses façons, dont un accès limité aux soins de santé, aux prestations financières et aux services de garderie, qui a affecté le bien-être mental, physique et financier des populations vulnérables. Cette pandémie a aussi révélé des lacunes substantielles dans la connaissance des expériences des membres de ces communautés et des effets de ces expériences sur leur vie quotidienne. Ces lacunes au niveau de l’information sont directement liées au manque de données de qualité concernant ces communautés. À cause de cette faiblesse, il est très difficile de réagir correctement à ces enjeux. Or, il est nécessaire d’avoir des données fiables et solides pour bien cibler les solutions politiques visant à remédier non seulement aux effets de ces problèmes, mais aussi à leurs causes premières. 

Statistique Canada a toujours accordé une immense importance à la production d’estimations de grande qualité afin de susciter la prise de décisions efficaces et de permettre aux Canadiens d’être toujours bien informés. C’est pourquoi, au fil des ans, ce Ministère a toujours fait en sorte d’attirer, de former et de perfectionner des experts. Il a aussi participé à des activités de recherche-développement visant à assurer que ses activités statistiques s’adaptent au rythme des changements sociétaux. De plus, la coopération internationale a toujours occupé une place prépondérante dans son mandat, afin de permettre aux experts du Canada d’échanger des idées avec des collègues d’autres pays et de se tenir au courant des meilleures méthodes et approches de mesure des activités socio-économiques.

Conclusion

Prises sous l’angle de la statistique, les expériences des sociétés et des économies montrent à parts égales la résilience et la fragilité humaines, tout en soulevant également les problèmes de l’équité et de la justice sociales. Statistique Canada, qui est probablement la meilleure agence statistique du monde, jouit d’un point de vue unique tant au Canada qu’à l’étranger. À titre de bureau membre de la CSNU, de président du Friends of the Chair Group on Economic Statistics de la CSNU, de vice-président de la Commission économique pour l'Europe des Nations unies et de la Conférence des statisticiens européens, de président du High-level Group on the Modernization of Official Statistics et de président du Comité sur les statistiques et la politique statistique de l'OCDE, le Canada influe de façon prépondérante et prédominante sur les concepts, les classifications, les méthodes, les définitions et les aspects techniques et opérationnels des données statistiques dans les domaines social, économique et environnemental. La capacité de Statistique Canada de voir le tableau d’ensemble et le contexte au niveau macroéconomique, ainsi que les relations entre ces trois domaines, constitue un apport précieux pour les données et l’analyse dont les Canadiens ont besoin durant cette période.

L’expertise des statisticiens représente, en effet, un atout primordial dans le contexte actuel. Lorsque les données prolifèrent à un rythme sans précédent, et que les décisions fondées sur ces données deviennent une question de vie ou de mort, la qualité, et non pas la quantité, des données devient le principal facteur de la confiance que l’on peut accorder à une analyse. La rigueur statistique, la transparence et de bonnes pratiques de gestion des données qui assurent la protection des renseignements personnels constituent les fondements de nouvelles applications qui rendent possible la recherche des contacts et le point de départ de stratégies de test qui nous permettent de mieux comprendre le taux de prévalence, de propagation et d’immunité. Grâce à de bonnes techniques d’échantillonnage statistique, bien supérieures aux méthodes de dépistage en masse (souvent biaisées), nous en saurons davantage et nous pourrons prendre des décisions politiques mieux éclairées. 

Bien que les statisticiens ne puissent pas contrôler la COVID-19, ni garantir la prise de bonnes décisions politiques susceptibles de mener à un rétablissement sain, ils peuvent, et doivent, continuer de jouer un rôle de premier plan pour permettre à la société de mieux comprendre les répercussions de la crise actuelle. Ils peuvent le faire en assurant une bonne intendance des données et un appui méthodologique adéquat ainsi qu’en permettant aux décideurs de se concentrer sur la mesure des résultats de leurs décisions et sur la rectification de la voie à suivre, au besoin. Depuis plus d’un siècle, Statistique Canada se tient au côté des Canadiens lors des périodes difficiles, durant lesquelles il a toujours joué un rôle prépondérant et proactif d’intendant des données fiable, indépendant et crédible.

The opinions expressed in this article/multimedia are those of the author(s) and do not necessarily reflect the views of CIGI or its Board of Directors.

About the Authors

Anil Arora is the chief statistician of Canada.

Rohinton P. Medhora is a CIGI distinguished fellow, professor of practice at McGill University, and an expert in international economic relations, innovation policy, development economics and governance.