Éric Cancès, lauréat d'une bourse ERC Synergy

24 octobre 2018

Le projet Extreme-scale Mathematically-based Computational Chemistry (EMC2) porté par Eric Cancès, Laura Grigori, Yvon Maday et Jean-Philip Piquemal a remporté l’appel à projets ERC Synergy Grant 2018 et figure parmi les 27 lauréats, dévoilés mardi 23 octobre 2018, de ces bourses hautement convoitées.

Les quatre porteurs de l’EMC2 nous expliquent les enjeux de ce projet de recherche de très haut niveau. 

 

Vous venez d’obtenir une ERC SyG entre Sorbonne Université, Inria et École des Ponts ParisTech. Qu’est-ce que cela représente pour vous ? 

Cela représente une belle opportunité d'effectuer des recherches novatrices de pointe à l'interface de la chimie, de l’informatique et des mathématiques, qui vont permettre, au travers d'avancées majeures dans chacune de ces disciplines ainsi qu'à leurs interfaces, de découvrir in silico de nouvelles molécules et matériaux. C'est aussi une reconnaissance et une invitation à poursuivre le travail en interaction interdisciplinaire que nos collaborateurs et nous quatre effectuons depuis de nombreuses années.

En quelques mots, pouvez-vous nous dire sur quoi porte votre projet ? 

La simulation moléculaire est l'un des domaines les plus dynamiques du calcul scientifique. Son champ d'application est très large, allant de la chimie théorique et la conception de médicaments jusqu'à la science des matériaux et les nanotechnologies. Son importance dans la science moderne a été reconnue par deux prix Nobel (Kohn & Pople en 1998; Karplus, Levitt & Warshel en 2013). C'est de plus une source inépuisable de problèmes passionnants pour les mathématiciens et les informaticiens.

De façon imagée, la simulation moléculaire peut être utilisée comme un microscope virtuel pour l'étude de molécules plus ou moins complexes avec une résolution spatio-temporelle à l'échelle atomique. Elle peut également servir d'outil pour la conception assistée par ordinateur (CAO) et l'ingénierie de nouvelles molécules, de nouveaux matériaux et de nouveaux nano-dispositifs.

Cependant, la simulation moléculaire rencontre encore de fortes limites. En particulier, la simulation de systèmes moléculaires de très grande taille, ou de systèmes de taille plus modeste mais dans lesquels les électrons interagissent fortement entre eux, restent hors de portée aujourd’hui. Surmonter ces limites est extrêmement difficile. Cela nécessite des percées conjointes dans plusieurs disciplines, et ne peut, à notre avis, être réalisé que dans le cadre d'un effort multidisciplinaire intensif comme ceux rendus possibles par les financements du type ERC-Synergy.

Pouvez vous nous dire quelques mots sur les origines de votre projet ?

Notre projet à l'interface de la chimie, de l’informatique et des mathématiques s'est construit à partir de deux observations. Le travail en interaction entre maths et chimie que trois d'entre nous (Eric Cancès, Yvon Maday et Jean-Philip Piquemal) avons effectué ces dernières années nous a permis d’obtenir des accélérations substantielles sur le code de dynamique moléculaire Tinker-HP. Les réalisations autour de ce code ont d'ailleurs été récemment récompensées par le prix ATOS-Joseph Fourier sur la simulation numérique en partenariat avec le grand équipement national de calcul intensif( GENCI). 
Nous avons pu convaincre que notre projet, qui vise la simulation de systèmes moléculaires encore plus complexes et hors de portée aujourd'hui, nécessitait l’élargissement de l’assise interdisciplinaire en ajoutant les compétences en calcul scientifique haute performance de Laura Grigori. 

L’innovation est au cœur des projets ERC. Quelle est l’originalité du projet récompensé ?

Notre objectif est de surmonter certaines des limites actuelles dans ce domaine et de fournir aux communautés académiques et aux entreprises industrielles des logiciels de simulation moléculaire de nouvelle génération, beaucoup plus rapides et donnant des résultats quantitatifs fiables. Ces logiciels apporteront une aide précieuse aux physiciens, chimistes et biologistes cherchant à relever les grands défis technologiques et sociétaux du XXIesiècle (santé, énergie, environnement...). 

En effet, ces défis nécessitent de comprendre le fonctionnement intime de la matière à l'échelle atomique et de développer des techniques d'ingénierie à cette échelle. Les modèles, algorithmes et logiciels de simulation moléculaire que nous comptons développer dans ce projet permettront de faire de la CAO de nouveaux médicaments, matériaux ou nano-objets.

Un exemple d’avancée sera par exemple de fournir des estimations d’erreur sur les résultats issus des simulations numériques (ce que nous appelons « estimateurs et indicateurs a posteriori »). Celles-ci permettront de compléter ces résultats par des barres d'erreur, comme le sont généralement les résultats expérimentaux. Ces barres d'erreur sont cruciales pour estimer la fiabilité des résultats et leur domaine d'application.

La présence du volet “calcul scientifique haute performance” va nous permettre d’intégrer de nouvelles notions comme les algorithmes qui minimisent le transfert de données entre les processeurs, permettant de passer à l'échelle des supercalculateurs, mais aussi de réduire la consommation énergétique. Ces algorithmes seront développés et utilisés pour accélérer les calculs de dynamique moléculaire sur les nouvelles architectures informatiques de type exascale et post-exascale (c’est-à-dire de dix à mille fois plus rapide qu’à l'heure actuelle). Ils seront aussi dédiés aux méthodes issues de la chimie quantique afin de rendre possible le calcul efficace des structures électroniques de systèmes dont les électrons sont fortement corrélés. 

Ceci nécessite de faire face à la malédiction de la grande dimension (c’est à dire l’augmentation exponentielle de la complexité en fonction de la dimension) inhérente à ces systèmes. Pour cela, des algorithmes et une librairie informatique dédiée utilisant une représentation des données en grande dimension par des objets appelés tenseurs, seront développés afin de permettre leur compression efficace, c’est-à-dire leur représentation par des objets plus simples en petite dimension, tout en préservant l'information. La librairie pourra être utilisée dans d'autres domaines qui traitent des données en grande dimension, comme par exemple l'intelligence artificielle.

L’ERC SyG récompense des projets qui se construisent à plusieurs chercheurs. Quelles sont les collaborations que vous avez mises en place pour ce projet ? 

Notre projet s’est construit autour de la collaboration entre 4 chercheurs en chimie, informatique et mathématiques, mais implique 12 autres membres ayant des positions permanentes dans nos institutions ainsi que 17 collaborateurs internationaux. Ce projet va permettre de consolider et développer la communauté à l’interface de nos trois disciplines, en renforçant des interactions qui se sont construites depuis plus de 15 ans et qui font de Paris un pôle exceptionnel en termes d’échanges interdisciplinaires. 

Comment se traduisent-elles au quotidien ? Comment un chercheur en chimie réussit-il à communiquer avec un chercheur en maths ou en informatique, etc. ?

Le développement du langage commun a nécessité pour chacun d'entre nous un très fort investissement pour acquérir des compétences dans les autres disciplines. Cet investissement a été bien plus important que pour d’autres interactions, comme celles entre mathématiques et mécanique des fluides par exemple, qui ont bénéficié de plusieurs décennies de collaborations fructueuses et ont donné lieu à une culture commune largement partagée dans les deux disciplines. L'effort que nous avons fait pour nous approprier les enjeux et les méthodes des autres disciplines est capitalisé et permettra aux nouveaux collaborateurs du projet d'être rapidement opérationnels.

Un exemple de problème crucial qui fait sens, mais dont le sens n’est pas le même dans chacune des communautés, est la nécessité de décomposer un problème complexe et très coûteux en temps de calcul en un nombre extrêmement élevé de tâches qui peuvent s'exécuter simultanément. Cette stratégie algorithmique vise à exploiter le parallélisme massif et utiliser au mieux les centaines de milliers de processeurs offerts par les architectures actuelles et à venir. En confrontant différentes options de résolutions parallèles issues des diverses disciplines, nous avons pu proposer des approches de rupture permettant de gagner un facteur 1000 en temps de calcul pour la simulation des molécules en solution. 

Un autre enjeu de rupture à considérer est celui de la parallélisation en temps, qui va permettre d’accélérer le déroulement du temps dans les simulations pour obtenir des solutions approchées de phénomènes dépendant du temps beaucoup plus rapidement. Ceci permettra, par exemple, d'étudier les interactions de macromolécules avec des protéines de façon plus pertinente.

En quoi le travail transverse et transdisciplinaire permet de mieux avancer ? 

Les avancées en simulation moléculaire sont remarquables mais butent sur un certain nombre de défis que seul le regard croisé de champs disciplinaires complémentaires permettra de lever. Dans le domaine de la simulation moléculaire, les modèles développés par les chimistes se traduisent par des équations mathématiques extrêmement complexes. La résolution numérique de ces équations doit se faire sur des architectures informatiques massivement parallèles. C’est donc naturellement dans un creuset mêlant les compétences en mathématiques, informatique et chimie que pourront émerger des approches novatrices.

Les projets ERC sont généralement des projets à haut risque. En quoi votre projet est-il particulièrement ambitieux ?

Comme dans tout projet de recherche, il y a un objectif, une vision, des pistes qu’il va falloir explorer, affiner, corriger. Nous l’avons décomposé en 4 parties totalisant 19 tâches, dont certaines très ambitieuses sont à haut risque, mais aussi à forte valeur ajoutée si nous parvenons à les mener à bien. 

Pour prendre l'exemple des applications en biologie moléculaire, nous avions pour objectif, il y a 4 ans, d'être capable de simuler le comportement de systèmes moléculaires d'un million d’atomes sur des échelles de temps de l’ordre de la microseconde et avec des modèles de bonne précision. C’est devenu depuis peu une réalité à travers la simulation d'un ribosome avec le code Tinker-HP que notre collaboration a permis de doper. Notre objectif est maintenant de simuler par exemple le cytoplasme d'une cellule comportant 100 millions d’atomes sur des échelles de temps d’intérêt biologique. 

Même s’il s’agit d’un projet de recherche fondamentale, quelles sont les applications qui seront rendues possibles par vos travaux ? 

Idéalement, nous aimerions modéliser une cellule entière dans toute sa complexité, ce qui ouvrirait la voie à la génomique et à la médecine personnalisée au niveau atomique. Dans un autre domaine nous allons développer des approches innovantes pour simuler des nouveaux matériaux comme par exemple les matériaux 2D multicouches qui ont des propriétés physiques étonnantes dont beaucoup sont encore à découvrir.

Que permettra de financer l’ERC SyG ?

Ce projet est principalement une aventure humaine. Les moyens accordés vont essentiellement permettre de recruter des jeunes chercheurs (plus de 30 thèses ou positions post-doctorales). Plus de 80% du budget est ainsi alloué aux ressources humaines, incluant, et c’est important d’avoir pu l’intégrer, des postes d’ingénieur de recherche pour structurer le développement logiciel.

 

- Éric Cancès : Professeur École des Ponts ParisTech, directeur du CERMICS de l’École des Ponts ParisTech, membre de l'équipe-projet MATHERIALS, équipe commune Inria/École des Ponts ParisTech
- Laura Grigori : Directrice de Recherche Inria et responsable de l’équipe-projet Alpines, équipe commune Inria/Sorbonne Université
- Yvon Maday : Professeur Sorbonne Université, membre de l’Institut Universitaire de France, mathématicien au laboratoire Jacques-Louis Lions (Sorbonne Université/Paris Diderot/CNRS) et directeur de l’Institut Tremplin Carnot Smiles
- Jean-Philip Piquemal : Professeur Sorbonne Université, membre de l’Institut Universitaire de France, chimiste au laboratoire de Chimie Théorique (Sorbonne Université/CNRS) et directeur de l’Institut Parisien de Chimie Physique et Théorique (Sorbonne Université/CNRS)