Connexion    
S'INSCRIRE - Mot de passe oublié?

ESPRITS LIBRES

VOTRE MAGAZINE D'INFORMATION
Moteur
Recommandations



Compteur
Depuis 24h : 4686 Lectures

Depuis 1 semaine : 23267 Lectures

Depuis 1 an: 36010025 Lect.
» IDEOZ GUIDE VOYAGE EUROPE: Préparez vos vacances et découvrez plus de 100 destinations!


[ SCIENCES et SAVOIRS ] : Les technologies de séquençage du génome humain - 3
Posté par Olivier Ezratty le 13/8/2012 13:20:00 (373 lectures) Articles du même auteur

Dans l’épisode pré­cé­dent de notre série esti­vale, nous avons décor­ti­qué le pro­ces­sus qui pré­cède le séquen­çage de l’ADN et toutes les étapes de pré­pa­ra­tion. Avec la sélec­tion des cel­lules, leur pré­pa­ra­tion pour en extraire les longues molé­cules d’ADN, leur pré-découpage pour sim­pli­fier le pro­ces­sus du séquen­çage et leur mul­ti­pli­ca­tion avec la PCR pour aug­men­ter la taille de l’échantillon dis­po­nible pour le séquen­çage.




Dans l’épisode pré­cé­dent de notre série esti­vale, nous avons décor­ti­qué le pro­ces­sus qui pré­cède le séquen­çage de l’ADN et toutes les étapes de pré­pa­ra­tion. Avec la sélec­tion des cel­lules, leur pré­pa­ra­tion pour en extraire les longues molé­cules d’ADN, leur pré-découpage pour sim­pli­fier le pro­ces­sus du séquen­çage et leur mul­ti­pli­ca­tion avec la PCR pour aug­men­ter la taille de l’échantillon dis­po­nible pour le séquen­çage. La plu­part de ces étapes pré­cèdent le séquen­çage mais nous ver­rons que cer­taines méthodes per­mettent de sim­pli­fier le pro­ces­sus en évitant notam­ment la PCR.

Nous pas­sons main­te­nant au cœur du sujet, le séquen­çage, sachant que nous allons à la fois expli­quer les basiques du séquen­çage avec les prin­ci­pales méthodes uti­li­sées et aussi nous attar­der sur les der­nières géné­ra­tions de séquen­ceurs mas­si­ve­ment parallèles.

Les tech­no­lo­gies de séquen­çage ont été créées au milieu des années 1970 et ont été conti­nuel­le­ment amé­lio­rées depuis. Au départ, le pro­ces­sus de séquen­çage, popu­la­risé par la méthode de San­ger que nous allons décrire était lent et géné­ra­teur d’erreurs. Les tech­niques et machines qui sont appa­rues depuis ont à la fois auto­ma­tisé le pro­ces­sus, apporté des variantes, paral­lé­lisé le séquen­çage et réduit les erreurs. Résul­tat, alors qu’il a fallu plu­sieurs années et des cen­taines de mil­lions de dol­lars pour pro­cé­der au pre­mier séquen­çage géné­rique du génome humain en 2000, on peut obte­nir le même résul­tat en moins d’une jour­née et pour quelques mil­liers de dol­lars, l’objectif étant de des­cendre rapi­de­ment en des­sous de $100 par génome.

Cout sequencage ADN

Un concours a ainsi été lancé qui rap­pelle les belles heures de l’aviation, le Archon Geno­mics Xprize. $10m récom­pen­se­ront l’équipe qui créera un appa­reil per­met­tant de séquen­cer 100 génomes humains de cen­te­naires en moins de dix jours et pour moins de $1000 par per­sonne. L’idée est de décou­vrir les gènes qui pro­tè­ge­raient de cer­taines mala­dies et assu­re­raient la lon­gé­vité humaine. Ce prix est lancé par la XPrize Foun­da­tion, une asso­cia­tion non lucra­tive amé­ri­caine qui a dans son board des per­son­na­li­tés aussi diverses que Larry Page (Google), Ray Kurz­weil (entre autres, confon­da­teur de la Sin­gu­la­rity Uni­ver­sity), Ariana Huf­fing­ton, le réa­li­sa­teur James Came­ron, le bio­lo­giste Craig Ven­ter, l’astronaute d’origine ira­nienne Anou­sheh Ansari, Ratan Tata (du groupe indien Tata) et Will Wright, le chief desi­gner offi­cer d’Electronics Arts. Le prix est spon­so­risé par Express Scripts, une société de ser­vices dans la santé aux USA. L’une des socié­tés à par­ti­ci­per à ce concours est Ion Tor­rent dont nous décri­rons plus loin la machine, celle-là même qui avait attiré mon atten­tion lors du CES 2012 !

Mais avant d’en venir là, il faut remon­ter aux sources et notam­ment à l’une des pre­mières méthodes de séquençage…

Méthode de Sanger

La méthode de séquen­çage de l’ADN déve­lop­pée par Fre­de­rick San­ger au milieu des années 1970 a été la plus répan­due pen­dant près d’une ving­taine d’année. Elle concur­ren­çait au départ celle de Maxam et Gibert créée en 1976-1977. Cette der­nière s’est rapi­de­ment éclip­sée car elle s’appuyait sur des pro­duits toxiques et sur la meure de radio­ac­ti­vité. Mais les prin­cipes étaient voi­sins d’un point de vue concep­tuel et on les retrouve jusqu’à aujourd’hui dans cer­taines tech­no­lo­gies de séquen­çage mas­si­ve­ment parallèles.

San­ger est l’un des quatre scien­ti­fiques a avoir gagné deux prix Nobel dans l’histoire. Ici, il s’agissait du prix Nobel de chi­mie : l’un en 1958 pour la décou­verte en 1951 de la séquence d’acides ami­nés qui consti­tue la molé­cule d’insuline (bovine) et l’autre en 1980 pour le pro­cédé de séquen­çage qui porte son nom, inventé en 1977.

Amor­çage

Le séquen­çage s’applique à un brin d’ADN de taille moyenne, de quelques cen­taines de bases, qui a été obtenu par dif­fé­rentes méthodes. On uti­lise cou­ram­ment la PCR que nous avons décrite dans l’article pré­cé­dent de cette série, qui est la méthode la plus récente et qui per­met de démul­ti­plier plu­sieurs dizaines de mil­lions de fois un petit échan­tillon de brin d’ADN, lui-même généré par une extrac­tion d’un ADN com­plet avec une enzyme de res­tric­tion. Mais on peut aussi uti­li­ser d’autres méthodes comme le clo­nage de brins d’ADN avec des vec­teurs de clo­nage divers comme l’ADN du bac­té­rio­phage M13.

Comme pour la PCR, on com­mence par déna­tu­rer par la cha­leur (sépa­rer les deux brins) d’un échan­tillon d’ADN en solu­tion. L’autre brin d’ADN résul­tant de la déna­tu­ra­tion n’est pas uti­lisé. Le brin d’ADN doit être en quan­tité suf­fi­sante, à savoir que l’on en dis­pose de plu­sieurs dizaines de mil­lions. La quan­tité est ren­due néces­saire par le moyen de détec­tion des séquences de base uti­lisé dans la méthode. On ajoute au brin une amorce de 18 bases et quelques qui ne fonc­tionne que dans un sens (dit “mon­tant”) en s’accrochant au bout des brins d’ADN à répli­quer et qui ser­vira de point de départ pour la copie du reste du brin. L’amorce est le “néga­tif” au niveau des bases du début du brin d’ADN à répli­quer. Dans la PCR, on uti­lise des amorces “mon­tantes” et “des­cen­dantes” pour répli­quer les deux brins d’ADN dénaturé.

Methode Sanger Amorcage

Poly­mé­ri­sa­tion

C’est la réac­tion chi­mique la plus impor­tante du pro­ces­sus : elle per­met le clo­nage par­tiel du brin d’ADN à qui on a ajouté son amorce.

La poly­mé­ri­sa­tion s’appuie sur l’emploi d’une ADN poly­mé­rase qui assemble des nucléo­tides au brin à com­plé­ter. Ces nucléo­tides sont des molé­cules dNTP ou désoxy­ri­bo­nu­cléo­tides qui asso­cient une des quatre bases de l’ADN (d’où les appel­la­tions dATP, dTTP, dCTP et dGTP), un sucre (pen­tose) et un tri­phos­phate. Ces dNTP s’associent aux nucléo­tides com­plé­men­taires du brin d’ADN à séquen­cer sous l’effet de l’ADN poly­mé­rase. On appelle cette phase du pro­ces­sus la SBS, “Sequen­cing by Syn­the­sis”. Elle uti­li­sée dans tout un tas de méthodes dif­fé­rentes de séquençage.

Methode Sanger Polymerisation

Fin de polymérisation

La méthode consiste à arrê­ter cette réac­tion de poly­mé­ri­sa­tion à chaque posi­tion de nucléo­tide dans le brin. On uti­lise pour cela des molé­cules ddNTP ou didé­soxy­ri­bo­nu­cléo­tides (ddATP, ddTTP, ddCTP, ddGTP). Ces nucléo­tides bloquent la poly­mé­ri­sa­tion de l’ADN du fait d’une liai­son OH qui est rem­pla­cée par une liai­son H par rap­port aux nucléo­tides équi­va­lentes. La liai­son OH s’associe au pre­mier P (phos­phore) du dNTP sui­vant lors de la poly­mé­ri­sa­tion. Dans le O, pas de poly­mé­ri­sa­tion. On met beau­coup moins de ddNTP que de dNTP pour que la poly­mé­ri­sa­tion se pour­suivre tant que faire ce peut. On contrôle aussi sa vitesse avec la température.

Methode de Sanger dNTP et ddNTP

Les ddNTP sont mar­qués par “fluo­res­cence” pour que l’on puisse les détec­ter plus loin dans le pro­ces­sus. Le label fluo­res­cent est du S-35 thio­phos­phate, ou 35S-dATP, qui s’associe aux ddNTP du côté des phos­phates sans empê­cher la liai­son OH-P d’opérer avec le dNTP pré­cé­dant dans le pro­ces­sus de poly­mé­ri­sa­tion. La pro­por­tion ddNTP sur dNTP est géné­ra­le­ment de 1%.

Dans ce pro­ces­sus, la poly­mé­ri­sa­tion dure une quin­zaine de minutes.

Déna­tu­ra­tion

Une fois encore, on va pro­cé­der par chauf­fage pour sépa­rer les brins d’ADN répli­qués et les répli­cats par­tiels obte­nus par poly­mé­ri­sa­tion que l’on sou­haite conser­ver. Il reste dans la solu­tion une soupe avec : nos brins d’ADN néga­tifs non répli­qués, les brins entiers répli­qués, le reli­cat de dNTP et de ddNTP ainsi que l’ADN poly­mé­rase sans comp­ter les reli­quats de phos­phores issus de la poly­mé­ri­sa­tion (les dNTP libèrent un pyro­phos­phate lors de la poly­mé­ri­sa­tion, cf le schéma pré­cé­dent, ce pyro­phos­phate ne sert à rien ici, mais on l’utilise dans le pyro­sé­quen­çage dont nous par­le­rons plus loin).

On se retrouve avec une soupe dont des brins d’ADN syn­thé­ti­sés avec une extré­mité fluo­res­cente qu’il va fal­loir trier par taille pour recons­ti­tuer leur séquence de bases (A, T, C, G). Mais aupa­ra­vant, on aura éliminé par trai­te­ment chi­miques divers les rési­dus cités ci-dessus.

Methode Sanger Denaturation

Tri sur gel

Dans la méthode de San­ger, on pro­cède géné­ra­le­ment au tri avec une élec­tro­pho­rèse sur une solu­tion conte­nant 1% de gel d’agarose (extrait de l’agar-agar, déjà évoqué dans cet article…). Il se trouve que les molé­cules d’ADN sont char­gées néga­ti­ve­ment et en fonc­tion de leur lon­gueur. On applique une ten­sion élec­trique conti­nue dans une solu­tion conte­nant ce gel d’agarose et à plat sur un filtre en nylon. La ten­sion va faire migrer les molé­cules d’ADN vers le + au niveau des phos­phates et en fonc­tion de leur taille, le tout  à 50°C. Les petites vont aller le plus loin. Le gel d’agarose est une sorte d’amortisseur ou de régu­la­teur de ce pro­ces­sus de migration.

Les molé­cules les plus courtes cor­res­pon­dront aux bases qui étaient proches de l’amorce (pri­mer) du pro­ces­sus. Le gel d’agarose est asso­cié à dif­fé­rentes autres molé­cules dont de l’urée qui évite que les molé­cules d’ADN se replient sur elles-mêmes. Une fois la migra­tion ter­mi­née, on va fixer l’ensemble par ultraviolet.

Les molé­cules fluo­res­centes de ddNTP ne sont pas visibles à l’œil nu. On va les révé­ler à l’aide d’un laser qui va les exci­ter et les faire émettre de la lumière dans une cou­leur dif­fé­rente. Une caméra enre­gistre alors l’ensemble du gel.

Un gel fait quelques dizaines de cen­ti­mètres de lon­gueur et per­met d’identifier quelques cen­taines de bases. C’est lié à la réso­lu­tion du papier ! D’où le fait que la méthode de San­ger est assez lente. Cette phase d’électrophorèse sur gel dure plu­sieurs heures ! Elle a bien été uti­li­sée pour séquen­cer dif­fé­rents bac­té­ries et cel­lules ainsi que l’ADN humain dans le Human Genome Pro­ject, mais a alors néces­sité beau­coup de temps et de machines. Il a aussi fallu auto­ma­ti­ser au maxi­mum toutes les étapes de ce processus.

Methode de Sanger Lecture

Dans les années 1980/90, on uti­li­sait quatre pré­pa­ra­tions, une avec chaque type de ddNTP car si on savait les mar­quer par radio­ac­ti­vité ou par fluo­res­cence, on ne savait pas les dis­tin­guer. Le tri des brins d’ADN syn­thé­ti­sés se fai­sait donc en quatre par­ties, une par base. Depuis, on uti­lise des mar­queurs fluo­res­cents dis­tincts pour cha­cun des quatre ddNTP et ils sont acti­vés par laser. Ce qui per­met de ne faire la poly­mé­ri­sa­tion que dans un seul « bain » avec l’ensemble des ddNTP mélan­gés. La lec­ture sur gel se fait sur une seule colonne “en cou­leur” et en géné­ral avec une caméra moto­ri­sée qui se déplace le long du gel.

Lecture gel fluorescent sequencage ADN

Dans la pra­tique, on obtient en fait une courbe qui asso­cie le conti­nuum de lumi­no­sité sur les quatre cou­leurs ana­ly­sées dans la fluo­res­cence. On en déduit la suc­ces­sion de bases. Mais le pro­ces­sus est enta­ché d’erreurs et on les élimine en fai­sant plu­sieurs mesures redon­dantes et avec une ana­lyse sta­tis­tique (la base la plus fré­quente gagne en cas de doute).

DNA sequence

Dans les séquen­ceurs auto­ma­tiques de seconde géné­ra­tion, on a rem­placé l’électrophorèse sur gel par une chro­ma­to­gra­phie en phase liquide, qui est bien plus rapide et qui per­met de lire jusqu’à un mil­lier de séquences de bases. Ce pro­cédé appelé HPLC (high-performance liquid chro­ma­to­gra­phy, ou high-pressure lc) uti­lise en lieu et place du filtre plat de gel d’agarose un tube très fin de 4 mm de dia­mètre qui met sous pres­sion le liquide à analyser.

HPLC process

Le liquide sort à l’autre extré­mité du tube et est ana­lysé par un chro­ma­to­graphe uti­li­sant des LED. le pro­cédé est amé­lioré avec la UHPLC (Ultra-High Per­for­mance Liquid Chro­ma­to­gra­phy). Voici quelques exemples de sys­tèmes de HPLC et UHPLC, sachant que leur usage dépasse de loin le séquen­çage d’ADN. La spec­tro­gra­phie en phase liquide a plein d’applications dans la santé et la chi­mie. On peut l’utiliser pour iden­ti­fier les com­po­sants chi­miques d’un ali­ment indus­triel, mesu­rer divers niveaux de toxi­cité, etc.

HPLC systems

Voilà pour la méthode de San­ger et ses évolutions.

Pas­sons main­te­nant aux autres méthodes et tech­no­lo­gies de séquen­çage appa­rues ces dix der­nières années, dans un rythme d’innovation qui s’est sans cesse accé­léré au point d’aller plus vite que la fameuse loi de Moore en termes de capa­cité de traitement.

Où sont les variantes ? De plu­sieurs ordres :

  • La syn­thèse ana­ly­sée en temps réel : au lieu de blo­quer la syn­thèse aléa­toi­re­ment à la hau­teur de n’importe quelle base comme dans la méthode de San­ger, un grand nombre de nou­velles méthodes vont gérer la syn­thèse base par base de manière contrô­lée et ana­ly­ser le résul­tat au fur et à mesure, d’où l’appellation “temps réel”. On retrouve notam­ment ce prin­cipe dans le pyro­sé­quen­çage et le séquen­çage par ter­mi­na­teur réver­sible On iden­ti­fie les bases inté­grées par fluo­res­cence ou des rési­dus de cette inté­gra­tion, les pyro­phos­phates (avec la méthode 454, par fluo­res­cence) ou les ions hydro­gène (avec la méthode de Ion Torrent).
  • La syn­thèse réa­li­sée en temps réel : variante des méthodes pré­cé­dentes, il s’agit de syn­thèse réa­li­sée à la même vitesse que dans le vivant et obser­vée au fur et à mesure par dif­fé­rents moyens (fluo­res­cence ou cap­ta­tion élec­trique). On trouve des méthodes de ce genre chez Paci­fic Bios­ciences et Bio­Nano Genomics.
  • Le besoin d’amplification ou pas : cer­taines méthodes impliquent l’amplification des brins d’ADN avant le séquen­çage, d’autres non, comme le SMRT de Paci­fic Bios­cience. D’où un gain de temps.
  • Le séquen­çage paral­lèle : au lieu de séquen­cer un brin unique d’ADN, on va en créer un grand nombre sous la forme d’une “biblio­thèque” (DNA library)  généré par “shot­gun” (frag­men­ta­tion aléa­toire d’ADN en petits brins de quelques cen­taines de bases) et les ana­ly­ser en paral­lèle. Le tout s’appuie sur des matrices avec des nano-cuves ou des plaques de verre dans ou sur les­quelles on isole cha­cune des réac­tions de trans­crip­tion contrôlée.
  • Les domaines d’applications : tous les sys­tèmes de séquen­çage ne sont pas dédiés au séquen­çage com­plet du génome humain. Ce domaine d’application est d’ailleurs rela­ti­ve­ment mar­gi­nal. Cer­taines appli­ca­tions visent à détec­ter le poly­mor­phisme dans l’ADN, à savoir les varia­tions par rap­port à une car­to­gra­phie de réfé­rence. On cherche à mesu­rer les varia­tions dans les gènes liées aux dif­fé­rents allèles (zones codantes des gènes qui varient d’un indi­vidu à l’autre) tout comme le pro­ces­sus d’expression des gènes qui contrôle la manière dont les gènes génèrent les pro­téines via tout le pro­ces­sus de trans­for­ma­tion qui com­prend notam­ment l’ARN mes­sa­ger, l’ARN de trans­fert ainsi que les ribosomes.

Côté per­for­mances, les don­nées clés sont le nombre de bases séquen­cées par heure, la taille moyenne des brins d’ADN séquen­cés d’une seule traite et le pour­cen­tage d’erreurs de séquen­çage. Mais on peut y inté­grer égale­ment le nombre d’agents et de sol­vants néces­saires dans le pro­ces­sus. Et in-fine, le cout d’ensemble des opé­ra­tions, de la machine aux consom­mables. Sachant que tout cela pro­gresse plus vite que la loi de Moore, il est assez dif­fi­cile de com­pa­rer clai­re­ment les tech­no­lo­gies en présence.

Séquen­çage par ter­mi­na­teur réver­sible (Illu­mina, Helicos)

Le séquen­çage par ter­mi­na­teur réver­sible (ou CRT pour Cyclic Rever­sible Ter­mi­na­tion) est com­mer­cia­lisé par Illu­mina sous l’appellation Tru­Seq dans ses machines HiSeq et aussi dans une autre variante chez Helicos.

Dans cette méthode, on séquence l’ADN par poly­mé­ri­sa­tion avec des dNTPs mar­qués par fluo­res­cence en mode quatre cou­leurs (une par type de base) et un ter­mi­na­teur qui arrête la poly­mé­ri­sa­tion. Après chaque ajout d’une base, on détecte laquelle a été ajou­tée par un cap­teur d’image cou­leur de plu­sieurs mil­lions de pixels (Illu­mina, où on ajoute toutes les bases d’un coup) ou noir et blanc (Heli­cos BioS­ciences, où l’on ajoute les bases une par une).

On enlève ensuite aux ultra-violets le ter­mi­na­teur de la der­nière base ajou­tée, du nitro­phé­nyl, qui bloque la liai­son OH qui per­met l’enchainement des bases (cf le schéma plus haut dans cet article qui explique com­ment fonc­tionne cette liai­son OH). On peut alors pro­cé­der à l’ajout de la base sui­vante. C’est donc un séquen­çage dit temps-réel comme ceux que nous ver­rons plus loin. Le temps de séquen­çage pour une base est envi­ron de 2 minutes.

Ces étapes sont réa­li­sées sur une plaque de verre et de manière paral­lèle avec des mil­lions de brins d’ADN étalés des­sus (pour faire simple) dont la pré­pa­ra­tion à par­tir d’un échan­tillon d’ADN dure envi­ron trois heures. La tech­no­lo­gie per­met de séquen­cer 10 mil­lions de brins d’ADN par cen­ti­mètre carré. La machine la plus récente, la HiSeq 2500 (ci-dessous) peut ana­ly­ser 120 giga­bases en 27 heures, aux­quelles il faut ajou­ter 20h de trai­te­ment infor­ma­tique. Le taux d’erreurs de lec­ture semble rela­ti­ve­ment élevé, de plu­sieurs %, mais il est com­pensé par la redon­dance de celles-ci. Ainsi, un run de 120 Gbases correspond-il à 40 fois le nombre de base d’un ADN humain.

hiseqs-2500-1500-banner

On trouve aussi cette tech­no­lo­gie de ter­mi­na­teur réver­sible (CRT :  Cyclic Rever­sible Ter­mi­na­tor) chez Laser­Gen (Hous­ton, $5m levés). La star­tup planche avec Natio­nal Ins­tru­ments sur un sys­tème qui exploite un autre type de ter­mi­na­teur réver­sible. Ils visent le séquen­çage d’une giga­base par jour ce qui n’a rien d’extraordinaire sauf si le pro­ces­sus est lui-même hau­te­ment parallélisé.

Pyro­sé­quen­çage (Roche/454, Qiagen, …)

Le pyro­sé­quen­çage uti­lise une méthode de séquen­çage créée en 1988 par Hyman et per­fec­tion­née ensuite entre 1996 et 1998 par l’intégration de la PCR dans le pro­ces­sus. Elle est dif­fé­rente du séquen­çage sauce San­ger. Nous l’examinons ici même si son domaine d’application concerne plu­tôt les courtes séquences d’ADN ou d’ARN et n’est pas spé­cia­le­ment adapté au séquen­çage com­plet du génome humain. Mais cer­taines tech­niques de séquen­çage mas­si­ve­ment paral­lèles s’appuient sur le prin­cipe du pyroséquençage.

Comme dans la méthode de San­ger ou la PCR, on part aussi d’un brin d’ADN préa­la­ble­ment sélec­tionné et com­plété par une amorce et on lance une poly­mé­ri­sa­tion avec de l’ADN poly­mé­rase et des nucléo­tides dNTP. Par contre, on ne va pas arrê­ter cette poly­mé­ri­sa­tion avec l’emploi de ddNTP mar­qués par fluo­res­cence qui la stoppent de manière aléa­toire dans la méthode de Sanger.

On va au contraire en pro­vo­quer une seule en ali­men­tant suc­ces­si­ve­ment le “bain” avec les quatre nucléo­tides et on va détec­ter celle qui va s’accrocher au brin d’ADN en cours de poly­mé­ri­sa­tion. Pour cela, on va uti­li­ser un résidu de cette poly­mé­ri­sa­tion : le pyro­phos­phate (PPi, molé­cule à deux phos­phates) qui se détache des dNTP lorsque le reste (1 base, 1 ribose et 1 phos­phate) s’intègre au brin d’ADN en cours de construc­tion. Le pyro­phos­phate a donné son nom à la tech­nique… du pyro­sé­quen­çage. Pour­quoi pyro ? Parce que les pyro­pho­states sont pré­pa­rés indus­triel­le­ment  en chauf­fant des phosphates.

Pour chaque base syn­thé­ti­sée, il y aura donc un déga­ge­ment de PPi. On va alors  le conver­tir en déga­ge­ment de lumière après une triple réac­tion chi­mique contrô­lée qui passe par les étapes suivantes :

Principe pyrosequencage

  • Un ATP sul­fu­ry­lase trans­forme la molé­cule de PPi en ATP en géné­rant un résidu de SO2 (sul­fure). L’ATP ou adé­no­sise tri­phos­phate sert sinon au trans­port de l’énergie dans les cel­lules. C’est une molé­cule qui se dif­fé­ren­tie de la dATP (l’une des quatre dNTP qui sert à la syn­thèse de l’ADN) par un atome d’oxygène en moins à l’extrémité du tri­phos­phate et par un grou­pe­ment OH en plus sur le ribose.

ATP et dATP

  • La molé­cule d’ATP géné­rée va elle-même conver­tir de la luci­fé­rine en oxy­lu­ci­fé­rine à l’aide d’une luci­fé­rase ce qui va géné­rer de la lumière que l’on va détec­ter avec une caméra CCD.
  • Une apy­rase va dégra­der les dNTP qui n’ont pas été uti­li­sés tout comme les rési­dus d’ATP. Et on peut recom­men­cer le cycle. Sachant que l’on pour­rait en prin­cipe pas­ser à la base sui­vante de la poly­mé­ri­sa­tion sans pas­ser par toutes les bases une fois qu’on a détecté la bonne et avoir en moyenne 2,5 dNTP à tes­ter par base à séquen­cer. Mais il ne semble pas que ce soit le cas, his­toire d’être plus rigou­reux d’un point de vue sta­tis­tique. Le pyro­sé­quen­çage pré­sente en l’effet de géné­rer beau­coup moins d’erreurs pour le séquen­çage que la méthode de Sanger.

A la fin de ce pro­ces­sus, un autre dNTP est ajouté pour pas­ser à la base sui­vante dans la syn­thèse. Sachant que la réac­tion n’a donc lieu sta­tis­ti­que­ment qu’une fois sur quatre, lorsque l’on a injecté la base qui cor­res­pond à celle qui man­quait dans la chaine d’ADN en cours de poly­mé­ri­sa­tion (ou copie). Si il y a plu­sieurs bases du même type qui se suivent dans l’ADN à poly­mé­ri­ser, plu­sieurs dNTP du même type seront inté­grés par l’ADN à poly­mé­ri­ser et l’émission de lumière sera mul­ti­pliée d’autant.

Voici un exemple de pyro­sé­quen­ceur : le Pyro­Mark Q96 MD Auto­ma­ted du japo­nais Qua­gen (ci-dessus) qui auto­ma­tise comme son nom l’indique toutes les étapes de ce pro­ces­sus répé­ti­tif. Il peut trai­ter en paral­lèle 10 échan­tillons iden­ti­fiés par un code barre.

PyroMArk Q96MD

Mais c’est tech­no­lo­gie “454”, datant de 2005, qui est la plus avan­cée dans l’usage du pyro­sé­quen­çage. Elle a été créée par la société amé­ri­caine 454 Life Science qui a été acquise par le groupe suisse Roche en 2007. Elle per­met de séquen­cer envi­ron un demi-milliard de base en 23 heures grâce à du pyro­sé­quen­çage paral­lèle. Le séquen­ceur asso­cié le plus élaboré est le GS FLX Tita­nium XL+ (ci-dessous).

gs-flx-diagram

Le pro­cédé 454 fonc­tionne en trois étapes clés :

  • L’ADN à séquen­cer est d’abord déna­turé et puis frag­menté aléa­toi­re­ment en petits brins de quelques cen­taines de bases aux­quels on adjoint des liga­teurs aux deux extré­mi­tés sur les­quels vont s’accrocher les amorces du séquen­çage. Cette opé­ra­tion est réa­li­sée par “nébu­li­sa­tion”, un pro­cédé consis­tant à souf­fler un cou­rant d’air sur un petit flux de liquide un peu com­ment on vapo­rise l’essence dans l’injecteur du pis­ton d’un moteur à explo­sion. On obtient des brins d’ADN dont la taille moyenne est de 500 à 700 bases. Mais avec une répar­ti­tion qui va de 100 à 1000. Comme d’habitude, ceci ne s’effectue pas sans pré­pa­ra­tion. L’échantillon d’ADN à nébu­li­ser doit être pré­paré : avec un mélange d’eau, de gly­cé­rol, de gel d’agarose (encore lui), du gly­co­gène, de l’éthanol et d’isopropanol. Le résul­tat : des cen­taines de mil­liers de brins d’ADN simples qui vont main­te­nant jusqu’à 1000 bases, le tout à basse tem­pé­ra­ture. Cette par­tie du pro­ces­sus dure plus de 4 heures.
  • Les frag­ments sont atta­chés un par un à une micro­bille de poly­sty­rène entou­rée de strep­ta­vi­din, une pro­téine com­plexe qui résiste bien aux divers sol­vants uti­li­sés dans la suite des opé­ra­tion. L’association est réa­li­sée dans une émul­sion eau-lipide qui est ensuite fixée dans une “micro-cuve” de 44 microns de large sur un sup­port appelé Pico­Ti­ter­Plate. Ce sup­port contient 1000000 micro-cuves. On en déduit que c’est un carré de 4,4 cm de côté, ce qui est com­pa­tible avec l’illustration ci-dessus.
  • Le frag­ment d’ADN est alors ampli­fié par emPCR (vue dans l’épisode pré­cé­dent) autour de la bille. Ce pro­ces­sus dure 8 heures à 23 heures selon la machine uti­li­sée et la taille moyenne des brins d’ADN séquencés.

MicroTiterPlate

  • Enfin, le pyro­sé­quen­çage base par base est lancé en paral­lèle dans cha­cune des micro­cuves du sys­tème à par­tir d’un sys­tème de micro­flui­dique qui ali­mente le Micro­Ti­ter­Plate avec les quatre nucléo­tides (sépa­ré­ment) et les dif­fé­rents agents de l’opération. La micro-cuve est cou­plée à un grand cap­teur CCD qui per­met la lec­ture des résul­tats. C’est la taille du cap­teur qui semble limi­ter le nombre de bases qui peuvent être lues en paral­lèle dans cette machine. En consul­tant le site de Dalsa, l’un des fabri­cants des plus grands cap­teurs CCD et CMOS, on constate que leur plus grand cap­teur fait 50mmx50mm, donc peut cou­vrir la sur­face en appa­rence rec­tan­gu­laire du Micro­Ti­ter­Plate. Les pixels de ce CCD font 24 microns de côté, ce qui cor­res­pond à peu près à la moi­tié de l’espacement entre les micro­cuves. Ces cap­teurs sont mono­chromes car on n’a besoin de détec­ter qu’une émis­sion de lumière et pas sa cou­leur. Ces cap­teurs sont d’ailleurs aussi uti­li­sés en radio­gra­phie, elle aussi noir et blanc. Cela veut donc dire que si c’est le cap­teur ou le type de cap­teur que la machine uti­lise, quatre pixels du CCD suf­fisent à détec­ter la réac­tion lumi­neuse du pyro­sé­quen­çage. A moins que le cap­teur ne soit plus petit et qu’une simple optique ne réduise l’image des deux plaques du pyro­sé­quen­çage. Ceci étant, on trouve de plus grands cap­teurs, comme chez Agilent dont le Titan fait 165 mm de côté, mais 2Kx2K pixels !

Le pro­ces­sus de pyro­sé­quen­çage dure 23 heures ce qui veut dire que pour une moyenne affi­chée de 700 bases par séquen­çage, la machine est capable de géné­rer un cycle com­plet de détec­tion d’une base en envi­ron 2 minutes, ce qui cor­res­pond aux 2 minutes habi­tuelles du pyro­sé­quen­çage clas­sique. Une bonne règle de trois per­met tou­jours de faire quelques vérifications !

Alors, on lit 700 mil­lions de bases en une passe, donc on peut séquen­cer le génome humain en 5 passes sachant que celui-ci com­prend 3 mil­liards de bases dans sa forme haploide, c’est-à-dire non dupli­quée ? Non, pas si simple ! Un bon séquen­çage de génome néces­site d’avoir beau­coup de redon­dance. On génère habi­tuel­le­ment 20 à 30 fois plus de séquences que n’en contient un génome. Après, un logi­ciel recons­truit le génome par recou­pe­ment entre les séquences obte­nues. La redon­dance per­met à la fois le recou­pe­ment et de détec­ter et sup­pri­mer les erreurs de séquen­çage qui sub­sistent dans tous les pro­cé­dés. Dans le pro­cédé 545, il y a 1% d’erreurs dans le séquençage !

La suite…

Ce petit tour est loin d’être ter­miné. Dans l’article sui­vant de cette série, nous abor­de­rons d’autres tech­no­lo­gies de séquen­çage dites de seconde et troi­sième géné­ra­tion, et dont cer­taines sont vrai­ment fascinantes.




Note: 0.00 (0 votes) - Merci de NOTER : Intéressant / Sans intérêt? -


Les commentaires appartiennent à leurs auteurs. Nous ne sommes pas responsables de leur contenu.
Auteur Conversation



Autres articles
18/5/2013 23:10:00 - L’atome vert : le thorium
18/5/2013 23:02:11 - L'Ecume des jours de Michel Gondry ; un film pour ne pas dire grand chose!
18/5/2013 21:39:45 - Welcome to the Punch de Eran Creevy ; un film mineur
18/5/2013 21:32:19 - Le Magasin des suicides de Patrice Leconte
18/5/2013 17:50:00 - Du bleu Facebook au marketing couleur
18/5/2013 17:40:00 - Le fact checking du fact checking du Soir
18/5/2013 16:55:49 - Ivan Paduart: deux nouveaux albums pour le même plaisir !
18/5/2013 16:20:00 - François Hollande prêt à remettre l'Union européenne à plat
18/5/2013 14:11:15 - Le PCF à CALAIS
18/5/2013 12:11:00 - A Voir - Grand Central... Cannes 2013... Sortie 28 août 2013...
18/5/2013 10:00:00 - Assiette gourmande facile à la purée de fraises Andros
18/5/2013 9:30:38 - Flashback Design 179
18/5/2013 9:00:35 - Marions les, ou la fin d’un psychodrame
18/5/2013 8:51:13 - Il faut
18/5/2013 8:40:00 - (Douce) France : quand François Hollande imite Charles Trénet
18/5/2013 8:00:00 - Brioche tressée à 4 brins
18/5/2013 5:51:00 - Paula Jacques
18/5/2013 5:50:00 - Le mal bleu de Thorgal 25 ; une mise en scène captivante
18/5/2013 2:04:00 - Petits carrés salés à l’origan et fromage
18/5/2013 1:21:00 - 2000 morts au Bangladesh pour satisfaire nos envies de vètements.....