OPEN SCIENCE
Doutes sur la vision d’une science ouverte à tous
Les données accessibles au grand public promettent un accès plus démocratique à la recherche scientifique. Le potentiel de l’open science reste toutefois largement inexploité.
Avec ses 3 millions de vues mensuelles, le site corona-data.ch illustre bien le pouvoir des données ouvertes. Ses visualisations claires et pertinentes de l’épidémie de Covid-19, réalisées par un doctorant en chimie sur son temps libre, sont un exemple de ce que la science ouverte pourrait apporter. En facilitant la libre circulation des données, ce mouvement veut accélérer les découvertes, encourager l’interdisciplinarité, améliorer la pratique de la recherche, ainsi qu’ouvrir la science à la société. Les résultats de la recherche financée par des fonds publics «appartiennent à la collectivité», souligne d’ailleurs le Fonds national suisse (FNS).
Le libre accès aux données de la recherche – open research data – invite les acteurs hors du monde académique à se réapproprier les données issues des travaux de recherche. «Il offre aux scientifiques et aux citoyens-chercheurs de plus grandes possibilités de donner des impulsions à la science», selon la Royal Society britannique. En Suisse, l’open science prend peu à peu ses marques: depuis 2017, tout projet soumis au FNS doit notamment inclure un plan de gestion des données, dans la perspective de leur future publication. Mais ces données en libre accès suscitent-elles l’intérêt du grand public?
Très rarement, comme l’a révélé l'enquête que nous avons menée en Suisse pour cet article. Prenons l’exemple d’EnviDat, une plateforme lancée en 2016 par le WSL, l’institut fédéral de recherches sur la forêt, la neige et le paysage. Elle référence actuellement plus de 300 jeux de données qui cartographient les forêts suisses, recensent le bois mort, documentent les victimes de catastrophes naturelles ou encore prédisent les effets du changement climatique sur les montagnes. Malgré l’intérêt évident de ces thèmes, cette ressource reste largement ignorée des non-spécialistes. C'est du moins ce que montrent les exemples de Gian-Kasper Plattner, responsable de la plateforme.
Un jeu de données disponible sur EnviDat a permis à Oleg Lavrovsky, un informaticien actif sur la scène de l’open data, de créer une carte des victimes d’avalanches sur les 25 dernières années. «Je n’ai pas de rapport direct avec les sciences de l’environnement, commente-t-il. C’est un projet que j’ai réalisé pour moi, sur un week-end.» La visualisation a été publiée sur le forum spécialisé opendata.ch mais semble n’avoir intéressé ni les médias, ni les stations de ski, ni les guides de haute montagne. Deux autres exemples illustrent l’usage modeste des nombreuses données d’EnviDat: une carte nationale du potentiel des ressources de biomasse – déjà disponible sur le géoportail de la Confédération – est reprise telle quelle sur la plateforme d’information géographique du canton d’Aarau. Un inventaire d’arbres se voit simplement référencé dans un répertoire du Wildnispark Zürich.
Bien entendu, il est possible que d’autres données du WSL aient été reprises ailleurs. «Suivre de manière précise l’utilisation de notre plateforme n’est pas une priorité, note Gian-Kasper Plattner. Et on ne peut tracer facilement les projets qui ne citent pas correctement leurs sources.» Que ces données n’inspirent guère le grand public ne l’inquiète pas: «Selon moi, le but d’EnviDat est avant tout de permettre à des spécialistes travaillant dans la recherche et les administrations d’en profiter, y compris lorsqu’ils viennent d’autres disciplines.»
Plus de 22 000 brevets
Exemple différent dans le domaine des sciences de la vie: plus de 22 000 brevets mentionnent UniProt, une encyclopédie de 180 millions de protéines gérée par l’Institut suisse de bioinformatique (ISB) et deux grandes institutions partenaires en Angleterre et aux Etats-Unis. «Le but d’UniProt n’est pas simplement d’héberger les données, note Alan Bridge de l’ISB. Notre équipe effectue un grand travail de curation et d’annotation, notamment à l’aide d’algorithmes, afin de rendre les informations disponibles et facilement utilisables.»
Certes, on reste encore éloigné de la vision de l’open science dans laquelle les données publiées par chaque laboratoire se voient directement réutilisées par autrui. Et cette science n’est pas vraiment populaire, car les usagers d’UniProt restent des spécialistes de la biotechnologie qui travaillent dans la recherche publique, des entreprises et des start-up.
Données peu exploitées par les médias
A l’autre bout de la chaîne, les médias permettent-ils aux citoyens de s’approprier les données de la science? Pas vraiment, exception faite des nombreux graphiques relayés ce printemps sur la progression du coronavirus. En 2019, un article sur srf.ch thématisait sous forme de questionnaire l’impact du changement climatique sur les localités suisses. L’équipe s’était basée sur des scénarios publiés par le Centre national pour les services climatiques, un réseau coordonné par la Confédération qui implique notamment l’ETH Zurich, le WSL et l’Université de Berne. «Nous avons consolidé les données, mais notre effort a surtout porté sur la mise en forme, explique Julian Schmidli, journaliste data à la SRF. Notre travail est de raconter une histoire à partir de ces données afin d’offrir une lecture simple et proche des gens.»
Les médias travaillent très peu avec des données scientifiques brutes, confirme Mathias Born, journaliste data à Tamedia: «En général, les chercheurs nous approchent lorsqu’ils ont déjà analysé et visualisé leurs résultats. Ils ne nécessitent donc pas de réinterprétation de notre part. En revanche, nous explorons parfois des données publiées par les administrations publiques, comme Météosuisse. »
Pour Julian Schmidli, le problème n’est pas la complexité des données scientifiques – son équipe a les compétences nécessaires pour les analyser – mais plutôt le temps à disposition et l’inspiration: «Il y a certainement de nombreuses sources intéressantes, mais je pense que nous ne les cherchons pas encore assez activement.» Les deux journalistes indiquent parfois collaborer avec des scientifiques sur des questions soulevées par la rédaction – comme la série #MediaToo qui a documenté des cas de harcèlement sexuel vécu par des journalistes. Il s’agit à nouveau d’une collaboration intéressante entre des scientifiques et des gens hors du milieu académique, mais qui serait également possible indépendamment de l’open research data.
«Utopie populiste»
Ces exemples montrent que les données de la science ouverte ne trouvent pour l’instant guère preneur auprès du grand public. La vision d’une science faite par le peuple semble être encore un rêve. «Des institutions telles que l’Union européenne mettent volontiers en avant l’idée d’une science ouverte, citoyenne et participative, commente Luc Henry, ancien conseiller pour l’open science à l’EPFL. Mais dans ce contexte, on peut voir l’open research data comme une utopie populiste, proposée avant tout pour faire approuver les budgets. Les données de la recherche scientifique restent extrêmement spécialisées et le grand public n’a en général pas les outils pour se les approprier.»
Le risque résiderait dans le fait que l’argument de la démocratisation puisse avoir un effet boomerang pour le véritable intérêt de l'open data, selon Luc Henry: «Cet intérêt consiste à améliorer la pratique scientifique en favorisant la transparence, la reproductibilité et le contrôle des résultats par la communauté scientifique. Cependant, de nombreux chercheurs sont réticents à partager leurs données, par crainte d’être critiqués ou dépouillés d’une idée. Ils justifieraient alors cette résistance précisément par l’argument - pas nécessairement erroné - que la population ne saurait de toute manière pas que faire de ces données.»