Skip to main content

Entretien avec Bernard Dujon à l'Institut Pasteur

18 nov. 2019, J-F Picard (source : https://histrecmed.fr/temoignages-et-biographies/temoignages)

 

Dans mon enfance, j’étais attiré par la nature, l'émerveillement de son réveil au printemps, les plantes, les animaux.... Si j’ai pu faire de la biologie c’est donc un mélange de choix personnels et de chance. J'ai commencé mes études supérieures à la Faculté des sciences de Paris. Au bout d'un an, il y avait un concours d’entrée à l’ENS pour les étudiants de propédeutique bien classés en fin d’année.  J'ai postulé et j'ai eu la chance d’entrer à l’ENS un an après mon bac. Normalement la filière vers l’ENS passait par deux années ou trois de ‘prépas’ que je ne voulais pas suivre car je les trouvais ennuyeuses. Je suis donc devenu normalien (1966 -1970).  A l’époque, il n’y avait pas de cours de génétique à l’ENS et c’est à Jussieu que j’ai découvert la discipline en suivant les cours de Piotr SlonimskiMadeleine Gans et Philippe Vigier qui avaient monté un certificat dans ce que l’on appelait alors « licence » (actuel M1). Je m’intéressais aux mécanismes fondamentaux de la vie et je trouvais que la génétique posait des questions plus fondamentales que les autres branches de la biologie et offrait un cadre théorique plus clair pour s’y attaquer. C’était l’année universitaire 1967-68 et les examens de printemps avaient été reportés en septembre. J’avais postulé au DEA de génétique (actuel M2) qui débutait donc quelques jours seulement après l’examen du certificat de génétique. Ayant pas trop mal réussi cet examen (j’étais classé premier et les collègues m’ont raconté plus tard que Piotr Slonimski avait fait circuler ma copie dans son labo, je n’en savais rien), j’ai donc été accepté au DEA de Génétique qui commençait en septembre 1968. La date a son importance pour comprendre l’esprit qui y régnait. 

Le Centre de génétique moléculaire du CNRS

Après cette intense année universitaire, j’ai cherché un labo pour préparer une thèse et c’est comme cela que je me suis retrouvé au ‘Centre de génétique moléculaire’ (CGM) du CNRS en septembre 1969 dans l’équipe de recherche de Piotr Slonimski. Mais, étant en quatrième et dernière année de l'ENS, j’étais supposé préparer l'agrégation. L’Ecole ne rigolait pas avec ça car les élèves étaient censés devenir des enseignants et l’agrégation offrait prestige et sécurité. Choisir de préparer une thèse sans passer d’abord l’agrégation était considéré comme très risqué et il fallait une autorisation spéciale. Piotr Slonimski a du alors promettre au directeur de l'Ecole que je soutiendrai une thèse de 3ème cycle avant ma sortie de l’ENS, c’est-à-dire en un an. Tâche impossible et promesse vite oubliée. En fait, j'ai soutenu directement une thèse d'Etat, mais quelques années plus tard, en 1976. Heureusement, dès ma sortie de l’ENS, en septembre 1970, j’ai eu la chance immense d’être recruté par le CNRS comme stagiaire de recherche, ce qui m’assurait un minimum de revenus réguliers alors que j’étais encore doctorant.

Le CGM venait d'être terminé deux ans auparavant. Le bâtiment était tout neuf et Piotr Slonimski cherchait à constituer une équipe de généticiens. Dans l’air du temps, il a recruté des jeunes ‘soixante huitards’, évidemment assez gauchos. J’ai été recruté en même temps que Monique Bolotin. L’année précédente cela avait été Pierre Netter et Dario Coen, et encore avant Jean Deutsch et Eric Petrochilo. Soit 6 étudiants du DEA de génétique recrutés dans la même équipe en trois ans. L’atmosphère était à la contestation. Cette fine équipe a d’ailleurs été qualifiée récemment de ‘pieds nickelés’ par Pierre Netter.  Jean Deutsch et Eric Petrochilo, les « anciens », menaient la troupe, ils passaient beaucoup de temps à distribuer des tracts à la cantine. Cela semblait amuser un peu Slonimski, mais pas trop quand même. Lorsque je suis arrivé au CGM, il m'a placé dans une pièce où il y avait deux armoires métalliques empilées l'une sur l'autre. Curieux ! "Débarassez-moi de ce merdier..." me dit-il.  En fait, la pièce avait été occupée par un autre normalien plus ancien que moi (Philippe Clertant) encore plus gauchiste que les autres et que Piotr venait de virer. Les armoires métalliques étaient sa façon de se protéger des incursions du « patron » dans le labo.

Dans les années 1950, aux côtés de Boris Ephrussi au ‘Labo de génétique physiologique’, Piotr Slonimski avait découvert que les mutants ‘petite colonie’ de la levure (Saccharomyces cerevisiae) ne respiraient pas car ils étaient déficients pour certains cytochromes. Plus tard, avec Fred Sherman, il avait réussi à isoler les premiers mutants du cytochrome c nécessaire à la chaine respiratoire. Or, chez les mutants ‘petite colonie’ il y avait toujours du cytochrome c, sauf qu'il ne fonctionnait plus car c’étaient d’autres cytochromes qui manquaient. Et pour augmenter le mystère, Slonimski et Sherman avaient trouvé deux gènes différents (ISO 1 et ISO 2) codant pour un même cytochrome.  Ceci ne collait pas avec la génétique. A l'époque, on avait un gène pour un produit (enzyme, protéine). Si ce gène mutait on avait un mutant négatif. Avec deux gènes pour la même chose, rien ne devait se passer. Donc comment persistaient-ils ? Dans ce cas précis, on s’aperçut plus tard qu’il existait des régulations différentes. Mais au sens large, ce problème des gènes dupliqués est resté incompris pendant des années, jusqu'à ce que la génomique fournisse l'explication d'un phénomène très général. Car les génomes ne sont jamais à l’équilibre optimal. Il y a constamment des duplications et des pertes de gènes au cours des générations successives. Mais au cours des années 1970 au CGM, on s’intéressait surtout à autre chose. C’est l'époque ou la génétique des mitochondries naissait lorsque l’on a commencé nos croisements pour essayer de comprendre l'hérédité des gènes mitochondriaux de la levure.

dujon photo

B. Dujon et P. Slonimski lors d'un colloque sur la génétique mitochondriale, Pise (It.) 1973

La génétique mitochondriale

 J'ai eu de la chance d’arriver au laboratoire au moment où venaient d’être isolés les premiers mutants mitochondriaux qui conféraient des résistances aux antibiotiques (érythromycine et chloramphenicol). A l’époque, nous ne savions rien du rôle génétique des mitochondries. On savait qu'elles contenaient de l'ADN qui était altéré chez les mutants ‘petite colonie’  puisque, peu de temps auparavant, Jean-Claude Mounolou avait pu mesurer sa densité grâce à des manips complexes (gradients de chlorure de césium). Mais nous ignorions le rôle de cet ADN dans l'expression génétique mitochondriale. Nous avions seulement ces premiers marqueurs de résistance aux antibiotiques qui nous permettaient de faire des croisements. Et qui, par le plus grand des hasards, devaient nous amener à la découverte des introns mobiles plusieurs années plus tard (les introns sont des segments internes des ARN éliminés par épissage dont les séquences se retrouvent donc au niveau des gènes). L’hérédité de nos marqueurs était affectée par cette présence insoupçonnée d'un intron mobile. Mais on ne comprenait rien à ce phénomène. Dans les nombreuses discussions que nous avions avec Piotr Slonimski, il s’agissait de lui trouver un nom. Nos discussions avaient souvent lieu à l'heure du déjeuner au moment où Piotr (qui n'était pas un lève-tôt) arrivait au CGM alors que les ‘pieds nickelés’ commençaient à avoir faim.  Un jour, je me rappelle que Jean Deutsch a dit : «On a déjà ‘alpha’ pour le type sexuel des levures, on va appeler  ‘omega’ ce phénomène mitochondrial et on va bouffer sinon la cantine va fermer !». C'est comme ça que l'on a baptisé un nouveau locus ‘omega’. Totalement mystérieux et qui a occupé une partie importante de ma thèse. Car j'avais trouvé au cours de ma première année de recherche que, si j'isolais des mutants du locus chloramphénicol (de sensible à résistant ou l’inverse) en partant de souches omega-, la moitié d’entre eux étaient également mutants pour le locus omega. Comme s’il  disparaissait.  Si je partais de souches omega+, cela n'arrivait jamais. En bons généticiens, on pensait avoir deux allèles + et - , mais l'un mutait pour aboutir à l'absence totale d'allèle. Ce n'était pas très lumineux comme affaire. Il s’agissait en réalité de deux idiomorphes (deux formes alternatives au même locus, comme les allèles mais d’origine et de nature distinctes contrairement aux allèles). Dans un labo voisin, François Michel, un autre étudiant normalien, faisait la cartographie de l’ADN mitochondrial en utilisant des techniques compliquées de température de fusion de l’ADN selon sa composition en GC (les régions de l’ADN mitochondrial de levure sont extrêmement hétérogènes en composition). Avec mes mutants, on s’était aperçu de l’existence d’un petit segment supplémentaire d’ADN dans les souches omega+. Mais on avait du mal à l’expliquer car à l'époque, on était nul en biologie moléculaire. 

Pratiquement, c'est moi qui ai introduit les premiers enzymes de restriction au CGM. Je les avais ramenés de Suisse après un stage EMBO à Bâle en 1976. Je me rappelle avoir montré un petit tube plastique à Piotr dans lequel on faisait les réactions en disant que : "ce serait pratique d’utiliser ce truc au CGM ". Sa réponse était en gros, « Ouais, bof! Bon achetez en pour vous si vous voulez, mais je n'en vois pas bien l'intérêt". Il s’agissait des premiers microtubes Eppendorf. En fait, le CGM n'avait pas suivi les progrès techniques de la biologie moléculaire pure et dure tels qu’ils se développaient ailleurs. Pourtant, ayant débuté sa carrière comme biochimiste avant de venir à la génétique sous l'influence de Boris Ephrussi, Piotr Slonimski aurait dû être sensible à l’émergence des techniques de la biologie moléculaire, or cela n'a pas été le cas. 

Harvard

En 1978, je suis parti à Harvard chez Walter Gilbert afin de m’initier aux premières méthodes de séquençage de l'ADN. J’étais persuadé que, sans une approche moléculaire de la génétique on n'arriverait jamais à étudier cet ADN mitochondrial. Là, je me suis trouvé plongé dans l’effervescence intellectuelle et technique des premiers travaux sur le clonage des gènes qui allaient marquer le reste de ma carrière. Me consacrant d’abord à mes mutants omega, je découvris la présence d’un intron chez les souches omega+ mais cet intron était très particulier car il contenait une phase ouverte de lecture. C’était une découverte parfaitement inattendue. A la suite de Walter Gilbert, on définissait les introns comme des segments internes d'ARN éliminés lors des réactions d’épissage.  On ne pensait pas qu’ils puissent coder pour quoi que ce soit. Or, dans mon intron, il y avait une phase de lecture codant pour une magnifique protéine, mais totalement inconnue et de composition bizarre en acides aminés. L'hypothèse qu’il s'agissait d'un enzyme à l'origine du biais de la transmission héréditaire des marqueurs mitochondriaux était tentante. Mais comment la démontrer ? Le produit protéique de l’intron n’avait jamais été visualisé, laissant peu d’espoir de purification. Le code génétique mitochondrial n’est pas universel, interdisant l’expression hétérologue. Et le phénotype n’apparait que dans les croisements, rendant extrêmement difficile l’isolement de mutants.  

J’aurais pu rentrer à Gif pour tenter de résoudre ces problèmes. Mais c’est alors que la situation s’est un peu compliquée. L’équipe de Piotr Slonimski à Gif était arrivé à la conclusion que d'autres gènes mitochondriaux avaient aussi des introns grâce à des tests de complémentation fonctionnelle entre mutants.  Ces gènes apparaissaient comme des mosaïques de régions appartenant à un cistron (un ensemble de complémentation) ou à un autre. Au plan de la génétique, ces résultats étaient spectaculaires car ils montraient que des gènes pouvaient être enchevêtrés fonctionnellement les uns dans les autres. Mais l'explication moléculaire manquait, en particulier en ce qui concernait l’épissage de ces introns. Or, à cette même époque, un jeune doctorant de Walter Gilbert, George Church, venait d’émettre l'hypothèse que l’épissage de ces introns dépendait de protéines que, par analogie avec l’intron omega, ils étaient supposés coder, expliquant les résultats de complémentation entre mutants. Mais les séquences de ces introns n’étaient pas encore disponibles, ce qui n’a pas empêché Piotr Slonimski qui connaissait le détail de mes résultats sur l’intron oméga (que je lui avais envoyé avec mon rapport annuel d’activité au CNRS), de publier alors immédiatement l’idée que l’épissage des introns mitochondriaux dépendait des protéines qu’ils codent. Sur le coup, l'affaire m'a laissé un gout amer et j’ai prolongé mon séjour à Harvard d’une année travaillant, en collaboration avec Hugues Blanc alors à Stanford, sur les mutants ‘petite colonie’ et réfléchissant à comment utiliser la diversité génétique au sein des populations naturelles en complément des méthodes de la génétique moléculaire. Walter Gilbert reçu le prix Nobel de Chimie en octobre 1980. 

Les introns mitochondriaux

Quand je suis revenu à Gif au printemps 1981, j'ai monté une petite équipe avec François Michel, qui bouclait l'écriture de sa thèse sur la fusion thermique de l'ADN, et avec Hugues Blanc qui revenait de Stanford où il avait travaillé sur l’ADN mitochondrial de mammifères. J’ai recruté un premier doctorant, Alain Jacquier (qui m’a ensuite suivi à Pasteur) et d’autres étudiants, stagiaires et visiteurs sont ensuite venus renforcer cette fine équipe dont les relations avec Piotr Slonimski étaient compliquées. C’était un caractère complexe. Faire une thèse avec lui, c'était formidable, on discutait beaucoup et tout allait très bien. Mais à partir du moment où on était docteur, on devenait une sorte de compétiteur susceptible de lui porter ombrage. Je voulais continuer à travailler sur les introns mitochondriaux, en particulier avec l’intron omega qui montrait ce phénomène que l’on appellerait maintenant gene drive, et sur lesquels bien des découvertes restaient à faire. Avec les premières séquences disponibles, François Michel avait commencé à rechercher des structures secondaires possibles pour ces ARN. Je me souviens de sa soutenance de thèse en 1982. Dans sa présentation orale, il a évoqué son modèle des introns codants qui ne figurait pas dans son manuscrit de thèse. Les autres membres du jury, très intéressés, ont demandé à Piotr: "Vous étiez au courant de ce truc là?". Or, il ne l'était pas ! Le lendemain on se fait convoquer dans le bureau directorial pour se faire passer un savon : "On ne peut pas se comporter comme ça ...  On va vous foutre à la porte !" Au CGM, il était interdit de découvrir sans en parler d’abord au « patron » ! 

L’affaire a fini par s’arranger. En ce qui me concerne, j’ai réussi à démontrer que la protéine codée par l’intron omega était une endonucléase d'un type nouveau. Des enzymes un peu bizarres avec une spécificité de reconnaissance de l’ADN d’une vingtaine de nucléotides (deux tours d’hélice) alors que, jusque-là, les sites de reconnaissance des enzymes bactériennes ne dépassaient pas 6 nucléotides (exceptionnellement 8). Cette endonucléase expliquait le mécanisme de gene drive, que j’avais baptisé Intron Homing.  J’avais donc clairement établi le fait qu’un intron mobile codait pour une endonuclease coupant l’ADN, sans action directe sur l’ARN (et donc sur l’épissage de cet intron qui s’est d’ailleurs révèlé ensuite être un excellent ribozyme).  Cette protéine reçue ensuite le nom de ‘I-Sce I’ avec le préfixe ‘I’ pour Intron. Des phenomènes semblables dans d’autres organismes devaient suivre trois ans plus tard. C’est ainsi qu’une nouvelle catégorie d’enzymes est née en 1989, que l’on appelle maintenant homing endonucleases. Pendant ce temps, François Michel avait réussi à modéliser les structures bidimensionnelles de ces introns, montrant l’existence de deux groupes distincts (groupe I et II) qui constituent les machineries catalytiques de l’ARN. Notre petite équipe avait donc un modèle cohérent expliquant l’existence de ces introns par l’apport de nucléases protéiques qui les insèrent dans les gènes récepteurs sans perturber le fonctionnement de ceux-ci grâce à la catalyse de l’épissage par l’ARN.  Mais les choses devaient rapidement changer.  Hugues Blanc décéda tragiquement dans un accident de circulation. Le séquençage des gènes s’accélerait. On commençait à entendre parler de génomes. L’exceptionnel spécificité de clivage de l’ADN par I-Sce I me poussait à imaginer une ingéniérie des génomes (ce qui n'était pas encore dans l'air du temps) mais poursuivre de tels travaux au CGM devenait de plus en plus difficile, surtout que ma charge de travail était devenue énorme (voir ci-dessous). Si je voulais continuer, il fallait partir comme l’ont d’ailleurs fait mes collègues Claude Jacq ou François Caron à peu près à la même époque que moi.

L’université Pierre et Marie Curie  et l’Institut Pasteur

En effet, peu de temps après mon retour en France en 1981 comme chargé de recherche au CNRS, j’avais fait acte de candidature dans l’Enseignement supérieur (incité par Piotr Slonimski). J’ai été nommé professeur à l’Université Pierre et Marie Curie (Paris VI) par un décrêt du président de la République signé le premier avril 1983.  Les railleurs apprécieront !   J’ai donc quitté le CNRS alors que je venais juste de passer DR2.  A cette époque, l’université mettait presque une année avant de payer ses professeurs (les choses se sont beaucoup améliorées ensuite). J'avais deux enfants à charge, un troisième en route et ma femme ne travaillait pas. Heureusement que le CNRS avait oublié d'arrêter mon salaire. J'ai pu vivre comme cela pendant presque un an. Quand l’université m’a enfin payé, j’ai remboursé le CNRS. A l'époque, j'étais un peu fou. J'avais choisi de faire mes cours tard le soir. J'arrivais à Jussieu à 18 h. et finissais à 21 h. De plus, comme j’arrivais difficilement à faire vire ma famille avec mon salaire de jeune Professeur,  j'avais pris un job d’enseignant à temps partiel à l’Ecole Polytechnique en plus de mon emploi principal à l’Université et de mes recherches au laboratoire. Bref, je travaillais comme un malade et je ne voyais même plus grandir mes enfants. Cela devait durer jusqu’en 1987, moment où je suis parti à l’Institut Pasteur pour y établir un nouveau laboratoire tout en conservant mon poste de Professeur à l’Université Pierre et Marie Curie. Dans le système de Pasteur, j’étais un OREX (chercheur détaché d’un organisme extérieur). 

Toujours intéressé par les introns des groupes I et II, leurs origines et leurs mécanismes d’actions, j’avais gardé l’idée que les nouvelles endonucléases introniques allaient nous permettre de découper des génomes de manière spécifique, in vitro et in vivo. J'ai donc lancé un programme d'ingéniérie génétique (synthèse de gènes, essais in vitro puis in vivo) en commençant avec les levures. Puis assez rapidement, j'ai établit une collaboration avec une équipe à l'étage en dessous qui travaillait sur la souris, celle de Jean-François Nicolas. Avec deux thésards, Arnaud Perrin (dans mon labo) et André Choulika (chez Nicolas) on a réussi une ingéniérie génétique dans des cellules de souris avec mon endonucléase de levure bricolée artificiellement. Peu de temps après, la même chose a été réalisée  sur des plantes en collaboration avec un laboratoire suisse (Holger Puchta chez Barbara Hohn). De plus, comme avec ma levure j'étais capable d'insérer dans les chromosomes des sites artificiels de mon endonucléase I-Sce I,  j’avais imaginé une nouvelle méthode pour cartographier ce génome qui allait se révéler utile pour le séquençage intégral de la levure. 

Quand je suis arrivé à l’Institut Pasteur, à la fin des années 1980, l’Institut était à peu près la moitié de ce qu'il est devenu au cours de sa forte expansion des années 1990 (environ 2500 personnes sur le campus aujourd’hui). Au fil du temps, les relations Pasteur - Paris VI se sont un peu effilochées.  Aujourd’hui, il n’y a plus d’enseignants de Paris VI dans les laboratoires de Pasteur (mais encore beaucoup de doctorants), alors qu'il y en a beaucoup de Paris VII (Denis Diderot). J’étais le dernier Professeur de Paris VI à travailler sur le campus de Pasteur. 

A mon arrivée à l’Institut Pasteur, j’ai rejoint le ‘Département de biologie moléculaire’ qu’avaient fondé François Jacob et Jacques Monod. Toujours actif, François Jacob animait l'esprit du département, le seul organisé sous cette forme au sein de l’Institut à cette époque. Les autres ‘unités de recherche’ (UR), chacune dirigée par un chef, étaient directement rattachées au directeur général de l'Institut, Maxime Schwartz qui venait de succéder à Raymond Dedonder. L'intérêt d’une organisation en départements est de permettre des discussions entre équipes voisines, de savoir ce que chacun fait, de susciter des collaborations comme je l’avais fait avec JF. Nicolas. Au sein du département de biologie moléculaire, les moyens étaient distribués de manière ouverte et équitable (ce qui me changeait un peu du CGM).  

Quand il a pris la direction de l’Institut Pasteur, Maxime Schwartz a organisé le fonctionnement interne en départements de recherche qui correspondaient essentiellement chacun à un bâtiment (au moins pour les plus récents) ce qui facilitait beaucoup la gestion (coincidence entre les locaux et le fonctionnement des laboratoires) mais aboutissait souvent à une hétérogénéité scientifique interne. Vers la fin de son mandat, il a souhaité réorganiser les départements de recherche sur des bases thématiques en ignorant largement les localisations des laboratoires et c’est Philippe Kourilsky qui a réalisé ce changement. Il a alors créé une douzaine de départements thématiques. L’intitulé ‘biologie moléculaire’ a disparu puisqu’on y trouvait des gens qui faisaient de la microbiologie, de la biologie structurale, des neurosciences, de la biologie du développement animal qui se sont séparés en différents départements. Avec Antoine Danchin, nous avons obtenu l’ouverture d’un département intitulé 'Structure et dynamique des génomes' en 2000.  Il a très bien marché et s’est vite agrandi. Philippe Kourilsky lui-même avait d’ailleurs créé le ‘Département d'immunologie’ auparavant (il travaillait sur le complexe majeur d'histocompatibilité, MHC). Maxime Schwartz et lui-même faisaient partie de la petite troupe de polytechniciens que Jacques Monod avait recruté à Pasteur, considérant les autres étudiants comme trop médiocres. Philippe Kourilsky retenait surtout de la génétique sa dimension d’outil. Son aspect proprement scientifique ne l’intéressait guère mais il a quand même créé notre Département. Quelques années plus tard, quand j’ai été nommé à la direction scientifique de l'Institut Pasteur en 2006, Alice Dautry m’a demandé de moderniser les départements thématiques en les rationalisant sur des bases un peu plus scientifiques. Pour des raisons historiques il y avait plusieurs départements où l’on faisait de la microbiologie. Pareil pour la virologie. J'ai passé pas mal de temps à fouiller les organigrammes, discuter avec les collègues pour savoir qui faisait réellement quoi et quels étaient leurs désirs. Bref, j’ai changé certains contours et appellations des départements de recherche. Notre département est devenu 'Génome et génétique'. L’opposition était entre ceux qui voulaient maintenir l'esprit d'origine de l’Institut, essentiellement la microbiologie, l’immunologie et les maladies infectieuses, et ceux qui contribuaient à l’émergence de nouvelles disciplines, biologie du développement, génétique, génomique, biologie cellulaire, neuroscience, informatique, utiles à un grand Institut de recherche biologique modernes. Finalement, je crois avoir assez bien réussi cette réorganisation. A quelques détails près, ces départements existent toujours aujourd’hui. 

Le séquençage de la levure

J’en reviens à mes débuts de pasteurien. Peu après mon arrivée à l’Institut (1988), j’ai reçu un appel d’André Goffeau, Professeur à l’Université de Louvain-la-Neuve en Belgique, qui avait obtenu de la Commission européenne la responsabilité de démarrer le séquençage du génome de la levure Saccharomyces cerevisiae. Il me demandait si je voulais participer. André Goffeau était un fantastique manager, il a organisé les choses de manière très simple. La première tâche consistait à séquencer le chromosome 3 de la levure. Pour mon laboratoire, cela représentait 10 kilobases. On avait deux ans pour le faire. On a terminé en un mois. En fait, pour moi au début séquençer un morceau du ch¬romosome 3 était une activité un peu marginale. Mon principal intérêt était d’explorer les possibilités offertes par les capacités exceptionnelles de I-Sce I pour cartographier les génomes¬. Une trentaine de labos étaient impliqués dans le séquençage du chromosome 3. Au bout d’un an, seulement trois avaient fait leur job de séquençage. Les autres découvraient un peu l’ADN !  Le CGM a participé à cette phase, mais Piotr Slonimski s’intéressait surtout à l’analyse fonctionnelle des quelques 150 gènes du chromosome 3. A l’issue de cette première année, André Goffeau nous a demandé qui voulait continuer. J'ai répondu présent et j'ai proposé de faire le chromosome 11. Les gens se sont demandé pourquoi Dujon prenait le 11. Connaissait-il un secret sur ce chromosome ? En fait la raison était très simple, avec ma méthode de cartographie, c'était le plus facile d'accès. Sur les électrophorèses en champ pulsé,  il était au milieu des gels, bien séparé des autres chromosomes. A cette époqie, on ne faisait pas du séquençage ‘shotgun’ comme maintenant. On faisait les cartes des chromosomes pour y placer les clones correspondant aux différents segments. On distribuait ensuite ces clones entre les laboratoires participants qui faisaient les séquences, puis on assemblait les séquences. Incidemment, je signale que Craig Venter est celui qui a inventé la stratégie ‘shotgun’ avec laquelle il a assemblé sa version du génome humain. Il avait commencé sur une bactérie, avant de passer à la Drosophile, puis à l'homme. Il faut dire aussi que l'informatique a beaucoup progressé avec les années, ce qui a permis ces assemblages de nombre considérables de petites séquences. Nous au labo, nous avions utilisé une stratégie ‘shotgun’ pour nos premiers 10 kb de la levure, mais on n'aurait jamais eu les outils informatiques adéquats pour passer à l’ensemble d’un génome. Donc on avait besoin d'une carte physique à haute résolution, la carte génétique ne suffisait pas. J’ai publié la séquence du chromosome 11 de levure dans Nature dès 1994. C’était le deuxième chromosome européen après le chromosome 3 publié aussi dans Nature en 1992. Les Américains commençaient à rire jaune. Le chromosome 2 a été publié à la fin de cette même année par H. Feldmann qui travaillait en parallele avec moi et est devenu un très bon copain. Indépendemment, Mark Johnston, un jeune Américain de Saint Louis, MO, publiait la séquence du chromosome 8. Fin 1994, on avait donc les séquences de quatre chromosomes de levure sur les 16. André Goffeau voulait mener le programme européen rapidement à son terme. C’est comme ça que j'ai récupéré la coordination du chromosome 15. Francis Galibert, qui avait travaillé avec Fred Sanger, celle du chromosome 10. Claude Jacq qui venait du CGM et était parti à l’ENS, coordonnait le chromosome  4, Hervé Tettelin, un étudiant de Goffeau en stage dans mon laboratoire, le chromosome 7, Peter Philippsen du Biozentrum de Bâle, le chromosome 14, tandis que les autres chromosomes étaient coordonnés par des laboratoires Canadien, Japonnais, Anglais ou Américains ou étaient répartis entre plusieurs participants.  Certains  laboratoires allemands se sont montrés très efficaces pour le séquençage. D’autres aussi. Avec ce programme, j’avais noué un réseau de connaissances et de collaborations dans toute l'Europe. C’étaient les grandes heures de la Commission européenne sous la présidence de Jacques Delors. La séquence complète de la levure Saccharomyces cerevisiae a été terminée dès 1996. C’était le premier organisme eucaryote séquencé (A. Goffeau, B.G. Barrell, H. Bussey, R.W. Davis, B. Dujon, H. Feldmann, F. Galibert, J.D. Hoheisel, C. Jacq, M. Johnston, E.J. Louis, H.W. Mewes, Y. Murakami, P. Philippsen, H. Tettelin et S.G. Oliver, « Life with 6000 genes », Science, vol. 274,‎ 1996, p. 563-567). A cette époque, on n’imaginait pas encore clairement le développement qu’allait prendre la génomique. On avait un génome de référence, celui d’une souche de laboratoire, et personne n’imaginait le besoin de séquencer d’autres levures avant longtemps. 

Les vertus de la génomique comparative

Suite au séquençage de la levure, la DG XII avait décidé de lancer un programme général d'analyse fonctionnelle des gènes de levures. La majorité des levuristes n’étaient intéressés que par les séquences codantes, beaucoup moins par les approches destinées à appréhender le génome dans son ensemble. Le programme européen ne pouvait évidemment pas englober toutes les questions posées par la biologie moléculaire dans une durée limitée. Or, les gens s’intéressaient aux fonctions qu’ils étudiaient, transport des protéines, transcription de l'ARN, etc .., et très peu s'intéressaient réellement à la génomique. En plus, le séquençage de la levure avait représenté un gros boulot et beaucoup de gens le voyaient comme un aboutissement. Or une séquence est un début, pas une fin en soi. Ils ne comprenaient pas l'intérêt de faire du comparatif. Un premier génome seul n'apporte rien, sauf qu’il en faut nécessairement un. Mais on ne commence à comprendre les choses que lorqu’il y en a un deuxième. La génétique ne commence que lorsqu’il y a variation. Aux débuts du séquençage de la levure S. cerevisiae, on n'avait aucune hypothèse. A partir du moment où on en a eu deux, les choses changent. On a trop d’hypothèses.  La deuxième levure séquencée (six ans plus tard) fut Schizosaccharomyces pombe, autre bête de laboratoire. Malheureusement, les deux levures sont tellement éloignées évolutivement que la comparaison de leurs génomes est peu informative. En fait, la génomique comparative des levures n'a commencé à se développer qu'au milieu des années 2000.

C’est la même chose pour le génome humain. Lors de l'annonce de son aboutissement en 2001, il avait été fait deux fois puisque ‘Celera’ était en compétition contre le consortium international. Mais il restait environ 300 000 trous dans la séquence. Il fallut trois ans de plus pour que le consortium international termine le boulot.  Mais il ne s’agissait encore que d’une référence arbitraire et il fallut attendre plusieurs années avant que des génomes individuels soient séquencés, permettant les premières comparaisons. Aujourd’hui, on en a des centaines de milliers.  A Pasteur, il n’y avait pas beaucoup d’intérêt pour la génomique à ses débuts. Beaucoup me disaient que ce n'était pas un truc intéressant. D'abord le séquençage lui-même était perçu comme une tâche répétitive, bête sur le plan expérimental (ce qui était faux, il était en pleine évolution). Mais plus fondamentalement, on disait que le séquençage des génomes n’était pas de la recherche fondée sur des hypothèses, méthode privilégiée des biologistes et considérée par certains comme la seule possible. Etablir des hypothèses, faire des déductions qui doivent être vérifiées expérimentalement afin de nourrir de nouvelles hypothèses, et ainsi de suite ... L 'influence intellectuelle des débuts de la biologie moléculaire se faisait sentir.  Jacques Monod disait : « tout ce qui est vrai pour les bactéries, l'est pour les éléphants» car il cherchait à travailler sur les mécanismes universels. Cela ne servait à rien de regarder la biodiversité. La biologie moléculaire est née comme ça, elle a vécu comme ça et a perdu ensuite de son influence suite à cette erreur. Sans perdre de vue l’intérêt de l’universel, la biodiversité étant là, il faut l'exploiter pour bâtir des hypothèses comme le montre le formidable développement de la génomique actuelle. 

A ce sujet, le monde politique ne s’est pas révélé très brillant en privilégiant les recherches finalisées à la simple curiosité scientifique, celle qui est à l'origine des découvertes inattendues et des changements majeurs. Prenez l'exemple des enzymes de restrictions, c'est en explorant des phénomènes incompréhensibles de restriction d’hôtes chez les bactériophages que Werner Arber a ouvert la voie à la découverte des endonucléases qui ont bouleversé la génétique moléculaire. C’est en observant la nature, que l’on a le plus de chances de tomber sur des phénomènes inattendus dont l’interprétation est source de découvertes fondamentales. Or les financements actuels favorisent la recherche de ce que l'on connait déjà. Surtout avec l’activité de tous ces comités théodules chargés de faire l'évaluation de la recherche.  En 1986, avec mon endonucléase I-Sce I , j'avais fait une demande de soutien à l'INSERM pour me lancer (déjà !) dans de l'ingéniérie génétique. Bien ambitieux. Refus immédiat. Pourquoi pas. Mais le motif était extraordinaire: on ne peut pas faire ce que personne n’a fait avant vous ! C'est le syndrome du type qui cherche ses clés sous le réverbère parce que c’est là qu’il y a de la lumière. La tendance actuelle est aussi un peu la faute de beaucoup de scientifiques toujours prompts à dire "... oui mais ça va servir pour telle maladie". Ce qui évidemment ne se produit pas (au moins dans les délais prévus) et use l’argument. Les services de communications sont d'ailleurs également fautifs de ce travers, celui de Pasteur mais c'est pareil à l'Académie ou ailleurs. La biologie souffre de sa proximité évidente avec la médecine. Il est facile à la partie médicale d’expliquer qu'elle est indispensable, ce qui n’est pas faux. Mais de là à lui réserver l’essentiel des moyens, il y a une marge. Au début de la génomique vers la fin des années 1990, si les médecins avaient obtenu tout ce qu’ils voulaient, ils n'auraient évidemment par séquencé le génome humain. D’autant qu’il faut se souvenir que le séquençage coutait trés cher à l'époque. 

Espèces et génotypes

Comme je l’ai déjà dit, le génome humain de référence obtenu en 2001 par le Human genome program, ne permettait pas à lui seul de poser les questions qui nécessitent de voir des différences. La génétique n'existe que par l’existence de variations. Sans variation, pas de génétique. De la même façon, le programme de séquençage de la levure terminé, beaucoup de gens voulaient passer à ce qu’ils appelaient la « post-génomique » qui consistait en réalité à appliquer des méthodes anciennes sur une séquence nouvelle pour espérer trouver les fonctions des gènes. A cette époque, Jean Weissenbach au Génoscope avait un point de vue différent. Il avait compris l’intérêt heuristique de la génomique comparative (qui n’avait pas encore commencé). Ainsi, il avait entrepris le séquençage du Tetraodon, un poisson, dans le but de faciliter l’interprétation du génome humain (dont il a séquence le chromosome 14 avec très peu de trous car il a utilisé des 'BAC', des clones bactériens avec des inserts de 50 à 100 kb, correctement cartographiés). Lors d’une rencontre à Bruxelles, où je lui demandais ce qu’il penserait de l’exploration génomique d’autres espèces de levure que ‘S. cerevisiae’,  il me répondit avec sa manière directe : « qu’est-ce qu’une espèce de levures ? ». Question pertinente.  Personne ne le savait (et on le sait encore moins aujourd’hui). En fait, j’avais posé cette question parce qu’un séquençage très partiel de ‘Kluyveromyces lactis’ fait dans mon laboratoire montrait des différences suffisantes avec ‘S. cerevisiae’ pour que l’on tente ce genre d’investigation à plus grande échelle. Le Génoscope pouvait m’offrir 50 000 séquences de levures obtenues par la méthode Sanger. Nous étions encore très loin du séquençage à haut débit mais ceci nous  permettait d’explorer différents génomes de levures. C’est un autre point sur lequel il convient d’insister, l'évolution des technologies change la nature des questions que l’on peut aborder. C’est vrai pour la génétique comme pour toute la biologie (pour ne pas parler de la médecine). C’est ainsi que grâce au Génoscope, nous avons pu commencer à comparer des levures au niveau de leurs génomes, ce qui impliquait naturellement leur évolution. Ensuite, avec des séquences intégrales de quelques espèces choisies pour représenter différentes branches évolutives déduites de nos résultats préliminaires, nous avons cherché à savoir comment avaient évolué les génomes de levures, autrement dit à reconstruire leur histoire. Nous avons exploré des levures de la famille ‘Saccharomycetaceae’ qui, contrairement à S. cerevisiae, n’avaient pas hérité de duplication du génome.  On les a qualifié espèces ‘protoploïdes’. Indépendemment, le séquençage de ‘Millerozyma sorbitophila’ nous a révélé un phénomène d’hybridations entre espèces différentes, en cours  d’évolution. Avec d’autres résultats du même type obtenu plus tard, on peut en conclure que les incompatibilités génétiques entre espèces postulées par Bateson, Dobzhanski et Müller pour expliquer la spéciation demeurent un phénomène exceptionnel. A l’inverse, on constate que les acquisitions génétiques horizontales sont une source importante d’innovations phénotypiques pouvant engendrer de nouvelles lignées. La barrière entre espèces semble donc perméable et, à la limite, on pourrait en conclure qu’il n'existe pas d'espèces. Dans le cas des levures, on voit maintenant des échanges génétiques dans tous les sens. Evidemment, il reste des groupes d'organismes marqués par leur ressemblance phénotypique. Mais en élargissant la recherche à des ensembles plus large, il n’est pas rare de trouver  des intermédiaires. ‘Homo sapiens’ est un modèle du genre. Notre génome est issu de plusieurs populations ancestrales distinctes. De même, dans un très beau papier récent comparant les génomes de jaguars, léopards et lions, trois espèces apparemment bien distinguables de félins, on s'aperçoit que chaque génome porte des gènes provenant des autres génomes. Conclusion, ces bestioles réussissent à maintenir un flux génétique entre elles alors que leur  reproduction est uniquement sexuée. En plus de la transmission verticale des gènes, chaque organisme est soumis à une sorte de flux génétique horizontal permanent. Les introns mobiles de mes mitochondries et leurs endonucléases en sont des exemples. Avec des confrères de l’Académie, nous sommes en train de préparer un colloque sur le génome humain où ce sujet d’échanges génétiques entre populations sera abordé. Loin des ruptures nettes entre races humaines distinctes comme beaucoup de gens l’imaginent, la génétique nous montre des gradients alléliques entremêlés de manière très complexe entre populations. 

Comment naissent les gènes ?

Au delà de ces échanges, la deuxième chose qui m'intéresse actuellement concerne la manière dont les gènes naissent. Selon l’idée  (déjà  un peu ancienne) de Susomo Ohno la duplication des gènes offre un mécansisme principal de formation de nouveaux gènes. Un gène se duplique en  deux copies qui, chacune, vivent leur vie en subissant des modifications divergentes. Ainsi de suite. Depuis longtemps, je pensais qu'il y avait quelque chose en plus et je me demandais si l’on pouvait faire des gènes à partir de rien. C’est-à-dire à partir de séquences préexistantes qui ne sont pas des gènes actifs. On connait la réponse de Jacques Monod et des débuts de la biologie moléculaire: on ne peut pas, la probabilité est trop faible. Or aujourd'hui, on sait que c’est faux. La nature nous montre une dynamique de formation de nouveaux gènes, assez intense en réalité.  Avec énormément de ratés certes, mais on constate que pas mal de gènes n'existaient pas chez les ancêtres se sont formés avec le temps. D’autre part, on sait aujourd’hui synthétiser des gènes même si la chimie que nous employons ne ressemble pas à celle que la nature a utilisé. A l'origine des gènes, il y avait très vraisemblablement l'ARN. Mais dans les organismes modernes, les gènes transmis à la génération suivante sont de l'ADN. Le second est une copie du premier, mais les propriétés physico-chimiques de l’ADN sont complètement différentes de celles de l’ARN (simplement par élimination d’un atome d’oxygène sur le carbone 2’ du ribose). De là, naquit la possibilité de former de longs polymères stables (millions de nucléotides) et donc des chromosomes, ce que les ARN ne peuvent pas faire. L'avantage est tel que tous les organismes cellulaires actuels (virus mis à part) ont hérité de cette capacité de transmettre de manière fiable de longs segments d'information génétique à leur descendance sous forme d’ADN. Mais depuis les débuts de la vie, les ARN ont eux aussi un peu évolué (je prépare une étude à ce sujet). Les premiers polymères capables de véhiculer une information génétique restent mystérieux. Le ribose est un sucre simple, présent dans l’univers. Fabriquer des nucléotides à partir du ribose n'est peut-être pas très compliqué. Evidemment, il faut du phosphate. Mais il peut sortir des volcans. Et à partir du moment où le ribose peut-être abondamment phosphorylé, on peut imaginer qu’il commence à réagir avec des bases azotées. Pour démarrer un premier code génétique, il fallait une macromolécule qui puisse faire suffisamment de combinaisons de séquences pour permettre le décodage de quelques acides aminés. Pas forcément beaucoup. Actuellement, je suis en train d’examiner comment on pourrait démarrer un code génétique avec seulement trois bases azotées permettant deux types d’appariements: une liaison  forte et une faible. Les propriétés de ce proto-code par rapport au code actuel sont assez remarquables. On trouve les acides aminés qui devaient exister avant l'oxygénation de l’atmosphère terrestre. Les autres acides aminés auraient été recrutés ensuite pour leur capacité à former des peptides plus résistants à l’oxydation. En effet, les géologues s’accordent pour considérer qu'il y a un peu plus de deux milliards d'années, la teneur en oxygène atmosphérique a commencé à monter. Or, avant ce premier pic  on a trouvé des fossiles datant de 2,1 milliards d'années de grande taille comme s’il s’agissait d’organismes pluricellulaires. L’arrivée de l'oxygène gazeux, résultant probablement de la photosynthèse, n'a pas dû se passer dans le calme. Je n'aurais pas aimé être là ! C’est un gaz très toxique. Toute la biochimie de la vie d’alors a dû s'adapter (probablement relativement rapidement) au passage d'un milieu réducteur à un milieu oxydant. Bien pire que le changement climatique dont on parle aujourd'hui !  Probablement que peu d’organismes ont survécu. Peut-être que les rares cellules qui avaient des proto-mitochondries ont été avantagées car les mitochondries consomment l'oxygène en produisant de l’eau et en permettant à la cellule de relacher du gaz carbonique (CO2). Ça explique peut-être l’origine des cellules eucaryotes ? On est dans un domaine de pures spéculations sans être certain de pouvoir le faire progresser un jour de manière significative. Mais c’est fascinant pour un biologiste en fin de carrière. J’ai la chance de pouvoir m’amuser avec ces élucubrations.