Recherche des séquences de la cassette d'expression du transgène cp4epsps

dans le génome du Soja transgénique 40-3-2

Le Soja (Glycin max) OGM 40-3-2 a intégré, dans son génome, la cassette d'expression fonctionnelle du gène qui code la protéine CP4EPSPS, sous le contrôle du promoteur constitutif P-E35S. La protéine peut théoriquement être exprimée dans tous les tissus, elle est présente à des concentrations élevées dans les feuilles et les graines.L'insertion est stable et son héritabilité a été vérifiée.Les études de biologie moléculaire montrent que l'insert présente en plus de cete cassette, un fragment du gène de 250 pb, identifié comme une partie du gène cp4epsps, en continuité avec le terminateur NOS3'. Un autre insert de 72 pb est également présent dans le génome des plantes transgéniques. Les fragments de 250 pb et de 72 pb ne sont pas exprimés et il ne semble pas qu'ils soient à l'origine de la synthèse de protéines de fusion.
Le gène rapporteur GUS et le gène de sélection de résistance à la kanamycine ne sont plus présents dans le génome de la lignée transgénique.
La séquence de la cassette du transgène cp4epsps présente dans le génome du Soja 40-3-2 a été déposée dans certaines banques de données. On peut proposer aux élèves de retrouver, dans cette séquence, le promoteur, la partie codante et le terminateur.

La cassette d'expression du gène cp4epsps intégrée au génome du Soja transgénique

- P-E35S : promoteur constitutif (tronqué mais fonctionnel) du gène 35S du virus du chou-fleur (CaMV)
- CTP4 : Chloroplast Transit Peptide, séquence codant un peptide d'adressage au chloroplaste venant du gène de Petunia hybrida qui code l'enzyme EPSPS
- CP4EPSPS : séquence codant la protéine CP4EPSPS(tolérance au glyphosate) de la souche CP4 d'Agrobacterium tumefaciens
- NOS3' : terminateur, signal de polyadénylation du gène de la napaline synthase d'Agrobacterium tumefaciens

L'ensemble CTP4-CP4EPSPS est transcrit dans le noyau des cellules végétales puis l'ARNm correspondant se retrouve dans le cytoplasme où il est traduit en une séquence protéique unique qui comprend le peptide d'adressage au chloroplaste et la protéine d'intérêt. Cet ensemble protéique entre dans le chloroplaste par l'intermédiaire du marqueur d'adressage qui est ensuite séparé du reste de l'édifice, ce qui permet à l'enzyme CP4EPSPS d'adopter sa conformation caractéristique dans l'espace et de pouvoir assurer sa fonction, dans le chloroplaste.
Les promoteur et les terminateurs, séquences non traduites, sont caractérisés par la présence de signaux fortement impliqués dans le contrôle de l'expression des gènes eucaryotes. Nous n'en retiendrons q'un pour pour le promoteur et un pour le terminateur.
- Promoteur : boîte TATA dont la séquence consensus est 5' TATAA(T)AA(T) 3', transcrite en UAUA(U)AA(U) dans l'ARNm où elle constitue un signal indispensable pour l'initiation de la transcription car à son niveau se fixent des facteurs de transcription dont la présence conditionne le positionnement de l'ARN polymérase.
- Terminateur : signal de clivage 5' AATAAA 3' transcrit en AAUAAA dans l'ARNm où il joue un rôle déterminant de marqueur pour l'intervention du complexe clivade/polyadénylation.

Les séquences de la cassette du transgène cp4epsps identifiées dans le génome du Soja OGM
Une séquence du génome du Soja 40-3-2 de 2453 pb contenant l'ensemble de la cassette d'expression du transgène cp4epsps est accessible dans la banque de données Genbank (NCBI). Toutes les informations nécessaires à l'identification des composants de la cassette sont fournies (voir ci-dessous)
Le document peut être exploité en ligne pour visualiser le promoteur, les parties qui codent respectivement le peptide d'adressage et la protéine d'intérêt, le terminateur. On peut demander de faire apparaître, sur une copie, les signaux caractéristiques des différentes parties (boîte TATA, codon initiateur, codon stop, signal de clivage pour polyadénylation...).

Rq/ La séquence 266...297 ne fait pas partie initialement du promoteur et elle n'est pas traduite.

Il est également possible d'obtenir une repésentation graphique

Par l'intermédiaire de la séquence ADN qui code l'ensemble peptide d'adressage + protéine CP4EPSPS on accède à la séquence peptidique codée.

1...71 : peptide d'adressage au chloroplaste
72...527 : protéine CP4EPSPS

A : correspond à Ala 100 dans le modèle moléculaire 2gga, résidu impliqué dans l'aptitude qu'à la molécule à tolérer le glyphosate