Quand le calcul intensif s'invite à la maison

Frédéric Cuvelier
23 juillet 2008 à 17h35
0

Deux acteurs du calcul distribué

0078000001483510-photo-corentin-chevalier.jpg
Parmi les différentes personnes impliquées dans le calcul distribué, nous avons choisi deux protagonistes aux rôles bien différents. Le premier d'entre eux, Corentin Chevalier, appartient au projet Grid Talk, projet subventionné par la Communauté Européenne. Il s'occupe de diffuser au plus grand nombre la notion de grid computing, dont fait partie le calcul distribué, via le site GridCafé. Ses bureaux sont basés au CERN (l'organisation européenne pour la recherche nucléaire) à Genève, où le Grand Collisionneur de Hadrons (LHC) est désormais en service et va fournir quelque 10 pétaoctets de données par an. L'analyse de cette monstrueuse banque d'informations va évidemment demander d'énormes moyens et la possibilité de distribuer ces calculs s'impose comme une évidence au CERN.

Clubic : Corentin Chevalier, vous vous occupez de diffuser largement (via votre site et vos déplacements dans des conférences) les nouvelles possibilités offertes par le grid computing. Votre auditoire est-il davantage du domaine public ou du domaine privé ?

Corentin Chevalier : Tout d'abord il faut que je vous parle du grid computing, ou la « Grille ». Comme le Web, la Grille est un service permettant de partager quelque chose sur l'Internet, sauf qu'ici il n'est plus question d'information mais de puissance informatique et de la capacité de mémoire. Mais la Grille fait beaucoup plus qu'établir une simple communication entre les machines. Son objectif ultime est de transformer le réseau mondial des ordinateurs en une ressource immense et unique de capacité de traitement.

0096000001485118-photo-lhc-cern.jpg
Portion du LHC, au CERN
Ensuite, je ne suis pas seul à m'en occuper, heureusement ; à notre niveau nous sommes une équipe, mais il y en existe beaucoup d'autres à travers le monde ! Bref, pour rentrer dans le vif du sujet, il y a trois types de publics pour le grid computing : les scientifiques, les hommes politiques et le grand public. Bien sûr nous cherchons à informer tout le monde et pas seulement les scientifiques ; notre travail n'est pas seulement de réaliser une immense bibliothèque d'informations autour du grid computing. Nous le faisons, et tous les scientifiques du monde entier y ont accès ; ils y trouvent une expérience mondiale et y gagnent une connaissance et un temps précieux. Mais nous informons le grand public pour qu'il sache ce qu'il en est de ce type de recherche ; cela donne parfois lieu à une implication massive dans telle ou telle technologie.

Un exemple concret est le calcul volontaire, ou distribué. Vous connaissez tous Folding@home ? Et bien il y a des dizaines de projets comme celui-ci (voir ce lien). Ces informations servent aussi à informer et impliquer nos politiciens (à un niveau Européen ou mondial) dans ces recherches et ces projets, afin qu'ils sachent pourquoi ils vont voter des budgets.
»

Clubic : Des entreprises ont éventuellement pris contact avec vous pour des formations ou des demandes de renseignement ? Si oui, lesquelles ?

007D000001423236-photo-ibm.jpg
CC : Notre but premier n'est pas de faire du profit ; comme je l'ai indiqué précédemment, nous cherchons à informer. En revanche, il existe des projets permettant de rallier le fruit de toutes ces recherches avec l'industrie (voir ce lien). Pour notre part, nous travaillons plutôt avec des organisations à but non lucratif ou des universités. Néanmoins, nous côtoyons souvent des géants comme Microsoft, Intel, IBM ou HP qui sont impliqués dans quelques projets.

Clubic : Comment jugez-vous l'évolution de l'intérêt des acteurs du calcul intensif dans le domaine du grid computing ?

CC : De notre point de vue, il grandit à vue d'œil ! D'un point de vue plus général, je dirai que ce domaine a été découvert par les médias il y a cinq ans. Aujourd'hui, cette couverture médiatique est moins présente, car le grid computing est moins nouveau. Par contre infiniment plus de monde l'utilise, que l'on parle de scientifiques ou du grand public. Il y a maintenant même des écoles dédiées à ce domaine !

Clubic : Quelles sont les solutions pour arriver au rêve de la Grille absolue comme vous l'évoquez sur votre site ?

0096000001485092-photo-globus-alliance.jpg
CC : Ma première réponse à cette question est : il y a maintenant énormément de techniques différentes utilisées par énormément de scientifiques, pour énormément de solutions, dans énormément de domaines ! Mais vous me direz c'est un peu vague... Pour répondre plus précisément, il y a maintenant plusieurs technologies majeures dans ce domaine : Glite, Unicore, Globus, Condor... Ces technologies vous fournissent un Framework vous permettant d'exploiter le grid computing pour des recherches scientifiques. Concrètement, elles permettent de réaliser des applications pour telle ou telle recherche en utilisant la puissance du grid computing.

Ensuite, et bien il y a les centaines de projets autour du grid computing, dans le monde entier : l'Europe, les USA, l'Amérique en général, l'Asie, mais aussi l'Afrique ! Chacun amène différents projets dans différents domaines, et ils contribuent chaque jour à faire grandir la Grille. Encore une fois, Folding@Home est un projet, et il en existe des centaines !

Enfin, le rêve absolu, comme vous l'indiquez, passe par des étapes très importantes, telles que la standardisation. Sans celle-ci, comment imaginer une coopération mondiale de tous les ordinateurs ?


Clubic : Quels sont les moyens pour arriver à convaincre les particuliers à partager leurs ressources lorsqu'elles ne sont pas utilisées totalement ?

Le tout premier moyen ne peut être que la communication. Ensuite je ne pense pas que nous ayons à convaincre les gens d'utiliser par exemple un programme de calcul volontaire : ils le font d'eux-mêmes, car quoi de plus merveilleux de savoir que vous aidez activement à la recherche contre le cancer, le sida, ou à mieux comprendre notre univers ! Car c'est possible dès aujourd'hui ! Vous savez, je crois que de nos jours, tout le monde se rend compte à son niveau que si nous continuons comme ça, nous allons droit dans un mur... Alors quoi de mieux que de préparer l'Avenir, avec un grand A ?

Clubic : Finalement, y a-t-il des perspectives grand public dans le grid computing, une sorte de mise en commun des ressources mondiales pour le particulier ?

CC : Bien sur ! Mais ces perspectives ne sont plus du domaine du futur, mais une réalité aujourd'hui. Vous avez un exemple : le calcul distribué. C'est un outil formidable qui change complètement la donne scientifique. Quant à dire ce que nous apporteront ces technologies dans le futur, c'est plutôt difficile. Vous savez, c'est à l'endroit où je travaille, c'est à dire au CERN, que l'Internet a été inventé. A l'époque, il était difficile de dire ce qui allait réellement en découler. Mais je pense qu'il y a 15 ans, ils sentaient que c'était quelque chose d'énorme ; et bien je peux d'ores et déjà vous dire que le grid computing est quelque chose d'énorme pour la communauté scientifique.



0064000001483590-photo-richard-lavery.jpg
0064000001484570-photo-cnrs.jpg
Le second intervenant est Richard Lavery, Directeur de Recherche au CNRS (DR1) en poste actuellement à dans le Département de Biostructures Moléculaires de l'Institut de Biologie et Chimie des Protéines (IBCP) de Lyon. Vous l'aurez compris, c'est un scientifique au cœur même des applications que propose le calcul distribué. Ses recherches portent sur la modélisation de macro-molécules d'intérêt biologique et sur la simulation de leurs interactions. Ce type « d'expériences numériques » est particulièrement gourmand en ressources et l'intérêt du calcul distribué est ici aussi évident.

Clubic : Quels sont les sujets de recherche qui ont nécessité le recours à du calcul distribué ? Avez-vous développé vous-même vos applications ?

Richard Lavery : Nous avons exploité le calcul distribué dans deux projets de recherche. Le premier, le projet Decrypthon, concerne la recherche des interactions binaires au sein d'un ensemble de protéines. Ceci implique de tester l'interaction potentielle de chaque paire de protéines avec un logiciel d'amarrage conçu par Sophie Sacquin-Mora dans mon ancien laboratoire à Paris. Ce logiciel tente d'optimiser l'énergie d'interaction en partant de plusieurs centaines de milliers d'agencements des deux partenaires.

0096000001484568-photo-histone.jpg
Le second projet concerne le placement des nucléosomes sur le génome humain, plus précisément le long d'une séquence de bases. Pour cela, nous avons conçu un logiciel pour optimiser la conformation des protéines histones, qui constituent le cœur du nucléosome, et la conformation de l'ADN, qui s'enroule autour de ce cœur. Compte tenu de la taille du nucléosome et du nombre de séquences de bases possibles (environ 1 088 pour les 147 paires de bases sur un seul nucléosome), nous avons simplifié le problème en le sous-divisant en un ensemble de petits fragments. Traiter ces fragments implique environ 250 000 optimisations. Le logiciel correspondant a été conçu dans notre groupe.


Clubic : Vos logiciels sont-ils distribués au grand public ou dans un cadre restreint ?

0069000001484566-photo-decrypthon.jpg
RL : Après le développement sur la grille universitaire IBM, le projet Decrypthon exploite maintenant la grille publique WCG (World Community Grid). Le projet nucléosome utilise la grille EGEE (conçue principalement pour analyser les données du LHC, Large Hadron Collider, au CERN). Elle est constituée d'environ 250 centres informatiques.


Clubic : Que vous apportent les contributions externes face aux ressources internes ?

RL : Les deux projets qui nous concernent ne seraient tout simplement pas réalisables en terme de ressources informatiques sans l'apport du calcul distribué sur des milliers de processeurs.

Clubic : Les résultats ne servent-ils que la recherche publique ?

00C8000001484576-photo-chercheur.jpg
RL : Nos deux projets ciblent des problèmes ayant un intérêt pour la biologie fondamentale, mais également pour la santé humaine. Le projet Decrypthon cherche à comprendre le rôle des protéines impliquées dans la dystrophie musculaire, tandis que le projet Hugorep cible un processus, la réplication du génome, impliquée dans plusieurs pathologies humaines.

Clubic : Quelles évolutions vous semblent possibles sur le principe de la grille en général ?

RL : Les applications dites « embarrassingly parallel » (impliquant des multiples tâches indépendantes) sont parfaitement adaptées aux grilles actuelles. La disponibilité de milliers de processeurs ouvre la voie à de multiples applications en biologie (conception de médicaments, génomique comparatif, biologie systémique, etc.).
Modifié le 01/06/2018 à 15h36
0 réponses
0 utilisateurs
Suivre la discussion

Les actualités récentes les plus commentées

De nouveaux modèles climatiques ont été créés... et la situation est pire que prévue
Stallman quitte la Free Software Fundation après la divulgation d'emails évoquant l'affaire Epstein
La dernière mise à jour de Windows 10 causerait des pannes de carte réseau
La Suisse veut forcer les compagnies aériennes à renseigner les émissions CO2 sur les billets d'avion
Ça y est, le Fold est disponible en France... pour 1,6 SMIC (net).
Un démantèlement des GAFA ?
En Californie, Donald Trump tente d’annuler la loi sur les limites d'émissions de CO2
Le trou noir au centre de notre galaxie semble avoir de plus en plus faim
Des défauts de fabrication découverts sur six réacteurs nucléaires en activité en France
Avec sa Model S, Tesla aurait battu le record de la Porsche Taycan sur le circuit de Nürburgring

Notre charte communautaire

1. Participez aux discussions

Nous encourageons chacun à exprimer ses idées sur les sujets qui l'intéressent, et à faire profiter l'ensemble de la communauté de son expertise sur un sujet particulier.

2. Partagez vos connaissances

Que vous soyez expert ou amateur passionné, partagez vos connaissances aux autres membres de la communauté pour enrichir le niveau d'expertise des articles.

3. Échangez vos idées

Donnez votre opinion en étayant votre propos et soyez ouverts aux idées des autres membres de la communauté, même si elles sont radicalement différentes des vôtres.

4. Faites preuve de tolérance

Qu'il s'agisse de rédacteurs professionnels ou amateurs, de lecteurs experts ou passionnés, vous devez faire preuve de tolérance et vous placer dans une démarche d'entraide.

5. Restez courtois

Particulièrement lorsque vous exprimez votre désaccord, critiquez les idées, pas les personnes. Évitez à tout prix les insultes, les attaques et autres jugements sur la forme des messages.

6. Publiez des messages utiles

Chaque participation a vocation à enrichir la discussion, aussi les partages d'humeurs personnelles ne doivent pas venir gêner le fil des échanges.

7. Soignez votre écriture

Utilisez la ponctuation, prohibez le langage SMS et les majuscules, relisez-vous afin de corriger un peu les fautes de frappe et de français : trop de fautes n’engagent ni à lire le message, ni à répondre à une question.

8. Respectez le cadre légal

Ne publiez pas de contenus irrespectueux, racistes, homophobes, obscènes ou faisant l'apologie de courants radicaux, qu'ils soient politiques ou religieux. N'utilisez pas plusieurs comptes utilisateurs.

9. Ne faites pas de promotion

Ne profitez pas d'une discussion pour faire la publicité d'un produit, d'un service ou même de votre site web personnel.

10. Ne plagiez pas

Exprimez uniquement vos opinions ou partagez des idées en citant vos sources.

scroll top