La biologie et la science des données sont sur une trajectoire de collision. Voici ce que vous devez savoir

  • La collision de la science biologique et de la science des données a d’énormes implications pour les communautés du monde entier.
  • Les décisions et les actions à court terme à cette intersection jetteront les bases de notre avenir biologique.
  • L’attention collective doit se concentrer sur l’accès, le partage des avantages et l’agence pour maximiser la valeur à long terme des données biologiques.

Deux mondes scientifiques s’affrontent : la science biologique et la science des données. Les avancées convergentes dans ces mondes réduisent le coût et le temps nécessaires pour comprendre le fonctionnement des systèmes vivants ; et jeter les bases de nouveaux traitements médicaux, de solutions énergétiques durables et d’aliments plus nutritifs. Les décisions et les actions que les communautés prennent aujourd’hui façonneront les 30 à 40 prochaines années des deux domaines scientifiques et les avantages associés qui émergeront à leur intersection.

Une voie future mène au partage des avantages avec l’amélioration de la santé des communautés, des plantes, des animaux et de l’écosystème mondial de la Terre. Une voie future alternative conduit à ce que les avantages soient détenus par quelques-uns, enfermés derrière des barrières juridiques et numériques restrictives qui empêchent l’accès à des informations qui changent la vie, à de nouvelles thérapies et à des opportunités pour un avenir meilleur. Pour diriger les efforts de l’industrie, du gouvernement et de la vie quotidienne vers la première voie, il faudra un leadership qui couvre tous les secteurs.

Pourquoi les communautés devraient-elles se soucier de la convergence du bio et des données ?

Le coût du séquençage du génome humain a chuté de façon spectaculaire au cours des dernières décennies et continue de baisser. En conséquence, le séquençage du génome a augmenté, mais notre capacité à comprendre les informations qu’il contient n’a pas suivi le rythme. Comment donner du sens à ce volume toujours croissant de données ?

Des progrès impressionnants similaires ont été réalisés dans la science des données, notamment dans les capacités analytiques et l’intelligence artificielle (IA). Un système d’IA qui aurait pris six minutes et 1 000 $ pour s’entraîner en 2018 n’a nécessité que 13 secondes et 5 $ pour s’entraîner trois ans plus tard. En conséquence, le nombre de dépôts de brevets liés à Les innovations en IA en 2021 étaient 30 fois supérieures aux dépôts en 2015.

Ensemble, ces avancées en biologie et en science des données ont un pouvoir de transformation. En 2020, une IA appelée AlphaFold a résolu un problème vieux de 50 ans consistant à traduire les formules chimiques des protéines en formes tridimensionnelles que ces protéines prenaient. En optimisant le temps nécessaire pour atteindre ces solutions, le modèle a ouvert de nouvelles voies pour la découverte et la conception de médicaments, notamment la recherche sur la résistance aux antibiotiques, le cancer et la lutte contre le COVID-19.

De quoi les communautés devraient-elles se soucier dans la convergence de la bio et de la science des données ?

Au cours des prochaines années, nous devrons prendre des décisions importantes concernant les avantages associés à la convergence de la biologie et de la science des données. Deux cadres utiles existent pour nous aider à évaluer et à agir sur la base de valeurs qui soutiennent et protègent toutes les personnes et la planète.

La première est que la valeur des données augmente lorsqu’elles sont partagées, combinées et remodelées. Plusieurs mauvaises métaphores des données se sont imposées au cours de la dernière décennie, allant de « les données sont le nouveau pétrole » à « les données sont l’avantage décisif ». Bien qu’ils aient été utiles pour attirer l’attention sur un nouvel atout puissant au début des années 2000, ils ont induit en erreur de multiples façons. Les ensembles de données sont des ressources réutilisables. Contrairement au pétrole, les données sont réutilisables et non finies. Plus les communautés utilisent les données, plus les données sont affinées et améliorées. Nous devrions vouloir que les communautés utilisent les données et partagent leurs avantages, et non les accumulent.

Le deuxième cadre reconnaît que la biologie est interconnectée. Votre ADN – le schéma directeur du fonctionnement de votre corps – est le produit de vos parents, de leurs parents et des parents de leurs parents et à travers des milliards d’années d’évolution sur Terre. De plus, votre ADN est partagé avec vos frères et sœurs et cousins ​​et sera partagé avec tout enfant que vous ou eux avez.

Vos gènes et les structures protéiques de votre corps sont partagés à la fois pour des fonctions similaires et des fonctions complètement différentes dans d’autres formes de vie végétale et animale sur Terre. Vous êtes fait de blocs de construction que l’évolution a réutilisés et réutilisés de multiples façons depuis que la vie est apparue pour la première fois sur notre planète il y a environ 4 milliards d’années. En résumé, votre ADN et d’autres ensembles de données biologiques ne vous appartiennent pas uniquement. En conséquence, votre décision de partager ou de ne pas partager les ensembles de données affecte non seulement vous-même, mais les autres membres de votre famille, l’ensemble de l’espèce humaine et la planète. Ceci est différent des autres informations personnelles.

La façon dont les entreprises, les gouvernements et le public ont traité les autres avancées de la chimie ou des ordinateurs ne fonctionnera pas pour la nature non finie des données ni la nature interconnectée de la biologie. Les données biologiques brisent le moule en termes de normes, de lois et de modes de fonctionnement mondiaux existants. En tant que tel, il est essentiel de mettre l’accent sur l’accès, l’agence et le partage des avantages.

Comment s’assurer que les décisions se traduisent par des avantages, un accès et des améliorations partagés

Dans ces deux cadres à l’esprit, il devient clair que les intendants des données biologiques détiennent un pouvoir important. L’investissement dans les technologies, les industries et les économies biosourcées augmente rapidement, mais l’activité est concentrée dans quelques régions.

La création d’un bien commun mondial partagé de données biologiques telles que les informations de séquençage génomique améliorera l’accès et accélérera l’innovation. Il sera également essentiel de rendre disponibles les connaissances, les outils et les technologies permettant de tirer parti des données biologiques par le biais de partenariats, de bases de données et de référentiels.

Construire un bien commun mondial des données biologiques pourrait suivre quelques étapes simples :

1. Identifiez un ou plusieurs cas d’utilisation où le partage de données biologiques est associé aux besoins et aux avantages de la communauté.

2. Faites de l’implication des communautés dans ces cas d’utilisation un objectif prioritaire et assurez-vous que tous les composants techniques qui utilisent des données biologiques le font de manière à bénéficier à la fois à une ou plusieurs communautés et à protéger leurs ensembles de données de manière responsable.

3. Impliquer les membres de la communauté dans les activités régulières de gouvernance qui garantissent que l’utilisation des données biologiques protège et profite aux communautés.

Ce processus en trois étapes garantit que les membres de la communauté sont impliqués à chaque étape d’un bien commun mondial des données biologiques. Les cas d’utilisation initiaux pourraient inclure des données biologiques pour aider à traiter et à guérir les maladies rares. Les membres de la communauté peuvent aider à affiner le cas d’utilisation pour qu’il soit pratique et bénéfique pour eux. Les membres de la communauté peuvent également s’assurer que les données biologiques fournissent des avantages et sont protégées de manière appropriée, conformément aux besoins de la communauté, et que leurs processus de gouvernance impliquent régulièrement leurs contributions à mesure que l’indivis mondial mûrit.

En outre, de tels communs de données biologiques devraient adhérer aux principes de données défendus par les peuples autochtones à l’échelle mondiale (y compris les ÉQUITABLE et Principes de données de CARE) pour accroître à la fois l’équité et l’impact positif des données biologiques.

À la Conférence des Nations Unies sur la biodiversité 2022, les nations du monde ont convenu de prendre des mesures juridiques, politiques et de renforcement des capacités pour assurer un partage équitable des avantages découlant des informations de séquençage numérique. Bien qu’il s’agisse d’une étape importante dans la reconnaissance et le respect des ressources locales et des connaissances traditionnelles, cela complique les régimes existants de la science ouverte et du libre accès.

Ce sont les étincelles résultant d’une collision et elles nécessitent la collaboration de toutes les parties prenantes concernées – pas seulement les dirigeants mondiaux et les experts scientifiques – à la fois pour discuter des défis et pour développer des solutions.

La théorie des collisions stipule que lorsque les bonnes particules d’une substance se rencontrent dans la bonne orientation, vous obtenez un changement réussi. Cependant, pour garantir le succès d’une collision, nous devons gérer les entrées avec attention et précaution. Plus important encore, nous avons besoin d’énergie d’activation. En ce qui concerne la collision de la biologie et de la science des données, la participation des communautés façonnera les 30 à 40 prochaines années des deux domaines et les avantages associés qui émergeront à leur intersection.