12. Expressievectoren en eiwitproductie in E. coli

Download Report

Transcript 12. Expressievectoren en eiwitproductie in E. coli

o.a. Primrose & Twyman, 7e editie, pp.81-93
Primrose, Twyman & Old, 6e editie, pp.70-83
Expressievectoren en proteïneproductiesystemen
Expressie verwijst naar het gen, productie verwijst naar het proteïne, hoewel
in het jargon 'expressie' ook vaak verkeerdelijk voor proteïnen wordt misbruikt.
Aangezien productie van een gekloneerd proteïne in hoge hoeveelheden gebeurt,
is detectie en analyse van het rendement meestal relatief eenvoudig, en kan dit
makkelijk door rechtstreekse visualisering (door kleuring) op een SDS-PAGE.
Hierbij kan expressie "voor" en "na" inductie in de cel vergeleken worden, evenals
het celcompartiment of de toestand waarin het eiwitproduct zich bevindt :
cytoplasmatisch versus periplasmatisch versus extracellulair, en oplosbaar of
onoplosbaar. (Bijgaande figuur op volgende slide vergelijkt “met of zonder” inductie.)
*
Expressie van de
constructen achter
een lac promoter,
controle door LacI
en inductie met
IPTG.)
IPTG-geïnduceerde productie van RP4 proteïnen : (A) DNA primase (118 en 80 kDa proteinen) ; (B) 16.5 en
8.6 kDA proteinen. Waardcelstam : E. coli HB101. Analyse door SDS-polyacrylamidegel electroforese.
(A) insert in directe (c, d) of omgekeerde (e,f) orientatie ; geïnduceerd (c, e) of niet-geïnduceerd (d,f) met IPTG.
(a) referentie proteïnen ; (b) gezuiverd RP4 DNA primase (118 en 80 kDa). (Lange electroforesetijd)
(B) insert in directe (b, c) or of omgekeerde (d,e) orientatie ; geïnduceerd (b, d) of niet-geïnduceerd (c,e) met IPTG.
(f) referentie proteïnen ; (a) gezuiverd 16.5 kDa proteïne. (Korte electroforesetijd)
*
uit : J. Sambrook & D.W. Russell : Molecular cloning, a laboratory manual.
3rd edition, 2001
1. Basisaspecten
2. Belangrijke expressievectoren (3 vb.)
3. Productiestrategieën
4. Zuivering en verwerking (6 vb.)
5. Optimalisatiestrategieën
Addendum : genoomstrategie
Hoe coderende gebieden (ORF’s) opsporen?
1. Basisaspecten
regulatie
- hoge expressiewaarden kunnen
- toxisch zijn (door het eiwitproduct) voor de cel
- "metabolic drain" veroorzaken : dus verstoring van het metabolisme
=> iedere verandering die het expressieniveau verlaagt
(bvb. door mutaties, verlies van plasmide, ...) zal de
betrokken cel een selectief groeivoordeel geven
- vermijden van toxiciteit : groei de celpopulatie tot het geschikte niveau
(d.w.z. aantal cellen) vooraleer de synthese van het gekloneerde eiwit
aanvangt, m.a.w. induceer de expressie (en tot dan, hou het gen onder repressie)
- induceer expressie in de laat-logaritmische fase (terwijl de cellen nog
voldoende metabolisch actief zijn) maar nog niet in de stationaire fase
- regulatie is in hoofdzaak een zaak van transcriptiecontrole
- andere factoren: translatie, stabiliteit (van vector, transcript en product)
transcriptie :
- E.coli RNA polymerase : a2, b, b'
algemene promotorstructuur (‘consensus’ sequenties)
s70 promotor : TTGACA (16-19 nt) TATAAT (5-8 nt) start (+1)
(zones / optimale afstanden)
-35
(17)
-10
(7)
UP-elementen (upstream) kunnen een extra invloed op efficientie hebben
- initiatie : vaak gebruikte efficiente promotoren en hun regulatie
lacUV5 is een mutant
die veel minder
gevoelig is aan de
concentratie cAMP
in de cel. Het niveau
van cAMP neemt toe
met de celdensiteit
(concentratie glucose
daalt). Met toevoeging
van 1% glucose aan
het medium wordt de
afhankelijkheid aan
CAP-cAMP nog extra
onderdrukt. .
- lacUV5 : IPTG, LacI (lacI en lacIq), uittitratie, 'leakiness'
- trp : tryptofaan + aporepressor (TrpR), IAA inductie
- Ptac : upstream -20 Plac + downstream -20 Ptrp
(ook PtacI, PtacII, Ptrc, en andere varianten)
inductie door IPTG mogelijk
- PL, PR : repressor CIts857 : inductie door temperatuurshift
of : CIwt + inductie door mitomycine C
(nb. CIts857 is minder efficient als regulator (repressor) dan wild-type CI)
- araBAD : arabinose + AraC : positieve en negatieve regulatie
vervolgt
E. coli
Pribnow box (-10)
T89 A99 T50 A65 A65 T100
s70 bindingsplaats (-35)
(in feite de lacUV5 promoter ; wild-type lac promoter heeft TATGTT als -10 gebied)
E. coli promoters, en hybride promoters tacI en II
E. coli transcriptieterminatie (r-onafhankelijk)
T85 T83 G81 A61 C69 A52
vervolg
T7 als expressiepromoter : vereist toelevering van T7 RNA polymerase
- gekodeerd op een ander (compatibel) plasmide
- gekodeerd door een l profaag (cIts) (bvb. in een E.coli lysogen)
- door infectie met een M13mp-recombinant kloon van het
polymerasegen (het T7 gen1) (zie verder)
=> PL en PBAD worden zeer efficient geblokkeerd, Plac (en zijn derivaten)
zijn ‘leaky’; met de faag T7 promotor (en andere specifieke faagpromotoren),
wordt alle interferentie met het E.coli polymerase vermeden.
- terminatie kan zijn :
- factor-afhankelijk (Rho (r), Tau (t), NusA (van faag l))
- factor-onafhankelijk (GC-rijke stam-lusstructuur + oligoT-reeks)
=> meest gebruikt in expressievectoren zijn :
- de fd terminator (in Ff fagen tussen gIII en gVIII, zie figuur in deel 6)
- de rrnB operon terminatoren T1 en T2
- faag T7 terminator Tf
translatie
- initiatie: RBS (ribosome binding site), AUG (of GUG, 91 vs 8% in E.coli)
- sequentie motief : Shine-Dalgarno sequentie
RBS > < Shine-Dalgarno (SD) motief
RBS = ongeveer 55 nt tussen posities –35 en + 22
(versus AUG)
SD : 16S rRNA
5'….GUACACCUCCUA
OH
3'
(E.coli)
basispatroon : 5'….AGGA… +/- 7nt … AUG(start)… 3'
efficientie is vrij onvoorspelbaar
variaties : GAGG, GGAG, GGAGG
- secundaire structuur
- het AUG (GUG) initiatietriplet moet goed toegankelijk
zijn, bvb. gelegen op de top van een stam-lusstructuur
(en dus niet in baseparing betrokken)
- triplets die volgen achter AUG beïnvloeden de efficientie
(zoals ook de nucleotiden die het AUG voorafgaan, en uiteraard ook
de secundaire structuur van dit gebied)
vervolgt
vervolg
- codongebruik
- het effect van codongebruik is zeer complex
- zelfde aminozuur => multipele codons
- zelfde codons => multipele tRNA's
- verschillende codons => zelfde tRNA
- codon-anticodon bindingssterkte
*
- vergelijking van frequentie (in E. coli) van codongebruik tussen
genen met hoog expressieniveau en deze met laag
expressieniveau, toont het effect van sommige triplets
(ongeacht of deze vaak gebruikt worden of niet) (zie Tabel)
- met synthetische genen : kan men bewust systematisch kiezen
voor telkens het 'optimale' triplet : dit garandeert (meestal) een goed
productierendement (hetgeen echter daarom niet het hoogst mogelijke is)
- gendosiseffect
- toename van aantal kopijen van de vector heeft
- geen effect
- een positief effect
- een negatief effect (vb. expressie van het trypsinegen )
=> niet voorspelbaar, geen algemene regel, kan alleen empirisch bepaald worden
Kodewoordgebruik in E. coli van sterk en zwak tot expressie komende genen
*
"sterk" : 24 genen (5253 triplets), o.a. 12 voor ribosomale proteïnen, 7 voor "outer membrane" proteïnen,
en voor sommige RNA polymerase subeenheden en translatie-initiatie- en terminatiefactoren.
"weak" : 18 genen (5231 triplets), o.a. voor verschillende repressorproteïnen, lac-permease, enz.
kleine kadertjes : een enkel tRNA voor synonieme codons ; dus voor deze is interactiesterkte anticodon-codon bepalend
stabiliteit
- een transcriptieterminatiesignaal achter het doelwitgen is nodig voor
stabiliteit van het plasmide
- par locus (of loci) helpt voor plasmidestabiliteit
(belangrijk op moment van inductie)
- transcript stabiliteit : mRNA degradatie is een complex proces
- zowel 5' als 3' UTR spelen een rol (bvb. een stam-lusstructuur
in het 5' UTR geeft stabilisatie)
- er is geen omgekeerde correlatie tussen grootte en halfwaardetijd
van een mRNA
bijgevolg: degradatie is niet afhankelijk van a-specifieke
endonucleolytische splitsing
- proteïne stabiliteit : degradatie is sterk gereguleerd in E.coli : er is een
groot aantal proteasen in het cytoplasma, periplasma
en aan de binnenste en buitenste membranen.
=> degron : is een element van degradatie : o.a. N-regel van Varshavsky
vervolgt
Kenmerken die oorzaak zijn van instabiliteit van eiwitten
in het metabolisme, noemt men “degradatiesignalen” of
‘degrons’.
De essentiële component van het eerst-ontdekte degron is
een destabiliserend N-terminaal aminozuur van het eiwit
(N-degron). De set van N-degrons geeft een “regel”, de
“N-end rule” genoemd (A. Varshavsky, 1997), die de relatie
geeft tussen N-degron en de halfwaardetijd (“half-life”)
van een eiwit in de cel. Dergelijke N-end regel komt
voor bij alle organismen (waaronder E.coli, gist en
zoogdiercellen). Bij eukaryoten is fusie met ubiquitine
hierbij essentieel, maar niet bij prokaryoten (hoe het daar
juist verloopt is nog niet gans duidelijk) .
N-regel van Varshavsky :
maakte een reeks recombinante b-galactosidasen met als
N-terminaal aminozuur telkens een ander achter het Metf :
- varianten met R, K, L, F, Y, W
=> halfwaardetijd (T1/2) van 2 min
- varianten van andere aminozuren (behalve P)
=> T1/2 = 10 uur
*
De E. coli N-end rule pathway. Primair destabiliserende
N-terminale residus L, F, W en Y staan in rood aangeduid,
secundaire R en K in blauw. De gele geven de rest van het
proteinesubstraat weer. Conjugatie van het primair
destabiliserende residu L aan de secundair destabiliserende
residus R en K wordt gemediëerd door Leu, Phe-tRNAproteine-transferase (L/F-transferase), gecodeerd door aat.
In vivo blijkt L/F-transferase vooral (of zelfs exclusief) aan
L te conjugeren. De degradatie van een substraat dat een
primair destabiliserend N-terminaal residu heeft, gebeurt
door het ATP-afhankelijke protease ClpAP, gecodeerd door
clpA en clpP. Het vraagteken geeft de onduidelijkheid
weer omtrent de natuur van het N-recognine in E. coli.
Open cirkels : stabiliserend N-end
aminozuur
Andere : destabiliserend ;
verschillende types
Voor proline speelt blijkbaar ook
het tweede aminozuur een rol.
Wat met het initiërende methionine ? :
- meestal wordt het Metformyl (als eerste aminozuur van een celeigen eiwit) afgesplitst
- hoe makkelijk kan dit met 'cel-vreemde' eiwitten ? => niet meteen voorspelbaar
- gebeurt blijkbaar makkelijkst als het 2de aminozuur een korte zijketen heeft
(vergemakkelijkt de splitsing door het methionine aminopeptidase)
Stresscondities veroorzaken inductie van genen voor bepaalde proteasen,
o.a. het protease La (lon gen)
deze staan onder controle van s32 promotoren :
- het gen voor de s32 subeenheid van dit RNA polymerase is rpoH
- mutanten in rpoH kunnen een dramatische toename van
expressierendement geven (en van productstabiliteit)
(E.coli heeft 7 s-factoren. De “house-keeping” factor is s70 (gen rpoD). Er zijn ook
anti-sigma factoren, die de functie van een sigma-factor inhiberen, en anti-anti-sigma
factoren die de activiteit weer herstellen. s32 is de factor bij heat-shock stress.)
Er zijn nog heel wat meer specifieke observaties gemaakt waarmee kan of
moet rekening gehouden worden.
2. Belangrijke expressiesystemen (inductie en regulatorische circuits) enkele voorbeelden
Het pET vectorsysteem voor proteïneproductie
- met T7 RNA polymerase
- extra regulatie (repressie) door LacI (inductie door IPTG)
- toelevering van T7 RNA polymerase vanuit een aparte expressieëenheid op
een l (DE3) profaag met PlacUV5 als promoter (ook onder LacI controle : lacO)
- additionele controle door lysozyme van T7 LysS (of E)
(gekodeerd op een (pACYC184-afgeleid) compatibel plasmide)
=> het lysozyme bindt aan en inhibeert (residueel) T7 RNA polymerase
E. coli
waardcel
pLysS of E wijst op de orientatie
in de BamHI van pACYC184 :
E is in de expressie-orientatie van
het tet gen ; S (silent) in de
omgekeerde orientatie. Met pLysE
worden grotere hoeveelheden
T7 lysozyme aangemaakt, hetgeen
niet steeds een voordeel is.
lac verwijst naar de lacUV5 promoter
...vervolg...
2. Belangrijke expressiesystemen (inductie en regulatorische circuits)
Het binaire trp-cI systeem : expressiecontrole op de Ptrp promoter door de l CI repressor
-
dubbel systeem met compatibele plasmiden
doelwitgen stroomafwaarts van de PL promotor
synthese van CI (gekodeerd door cI repressorgen) wordt gereguleerd door Ptrp
toevoeging van tryptofaan activateert expressie van het doelwitgen door afsluiten
van de CI synthese : vroeger reeds gezien : regulatie door CIts857 kan ook op basis van
temperatuur, maar : die regulatie is minder strict (wt-CI bindt efficienter) én toevoeging
van een inductor in grote fermentoren is eenvoudiger dan het verhogen van de temperatuur ;
bovendien kan een temperatuurshift stressmechanismen (heat-shock) induceren.
(Po) O = operator van de
overeenkomstige promoter
lac operon : inductief systeem : activatie door (allo)lactose (en analogen)
“negative inducible operon”
trp operon ; repressief systeem : inhibitie door tryptofaan (met aporepressor)
”negative repressible operon” (co-repressor model)
in aanwezigheid van tryptofaan wordt actieve repressor gevormd, door binding van tryptofaan
aan zijn (inactieve) aporepressor. In afwezigheid van tryptofaan in het cultuurmedium is er
dus constitutieve expressie van het operon (trpE : trpD : trpC : trpB : trpA).
(er is dus geen expliciete “activator”, zoals in het ara operon)
*
ara operon : araC : araO : araI : araB : araA : araD
Afbraak van L-arabinose tot D-xylulose-5-fosfaat, dat verder gemetaboliseerd wordt via de
pentosefosfaatweg.
Operon voor synthese van de AraA, AraB en AraD enzymen. AraC is een activator eiwit.
araI promoter (induceerplaats).
AraA : L-arabinose : isomerase => L-ribulose (reversibel)
AraB : L-ribulose : ribuloskinase => L-ribulose-fosfaat (niet-reversibel)
AraD : L-ribulose-fosfaat : epimerase => D-xylulose-fosfaat (reversibel)
Negatieve en positieve regulatie : AraC is activator of repressor naargelang
zijn bindingplaats, in aanwezigheid of afwezigheid van arabinose.
...vervolg...
2. Belangrijke expressiesystemen (inductie en regulatorische circuits)
Het pBAD systeem : vooral goed voor expressie van zeer toxische eiwitten
(op basis van keuze van expressieniveau)
Regulatie van de PBAD promoter en expressie in pBAD vectoren
1) repressie : het dimeer AraC bindt aan I1 en O2 operatorplaatsen
(de DNA lus blokkeert transcriptie)
2) activatie : het dimeer AraC + arabinose : bindt aan de I1 en I2 plaatsen
3) de activatie is bovendien gevoelig aan catabolietrepressie : CAP + cAMP
(cAMP = is laag als glucose concentratie hoog is)
=> het samenspel van arabinose- en glucose-concentraties
kan gebruikt worden als fijnregeling van het expressieniveau
(nb. CAP-regulatie is ook aanwezig in het lac operon,
maar tac promotoren zijn niet CAP-afhankelijk)
Goed controleerbaar met % arabinose
(dosis-afhankelijke regulatie)
N en C wijzen
op de N- en Cuiteinden van
AraC (dus C is
dus niet het
ganse AraC).
Lusvorming (210 bp) door interactie
van een AraC dimeer tussen I1 en O2 :
negatieve regulatie.
Positieve regulatie : arabinose bindt
op AraC waardoor het O2 verlaat en
maakt een complex met AraC op I1
en I2 en transcriptie start.
Glucose verlaagt cAMP, en aldus de
efficïentie van binding aan I1-I2 en
dus transcriptie (extra regulatie).
Autoregulatie van AraC op zijn
eigen promoter (pC, waarvoor O1)
Detectie met antilichamen
O1
Regulation of the ara-operon
*
The three structural genes are arranged in an operon that is regulated by the araC gene product. There are four
important regulatory sites as shown in the following survey (figures on next slides) :
araO1 is an operator site. AraC binds to this site and represses its own transcription from the PC
promoter. In the presence of arabinose, however, AraC bound at this site helps to activate expression of the PBAD
promoter.
araO2 is also an operator site. AraC bound at this site can simultaneously bind to the araI site to
repress transcription from the PBAD promoter
araI is also the inducer site. AraC bound at this site can simultaneously bind to the araO2 site to
repress transcription from the PBAD promoter. In the presence of arabinose, however, AraC bound at this site
helps to activate expression of the PBAD promoter.
CRP binds to the CRP binding site. It does not directly assist RNA polymerase to bind to the
promoter in this case. Instead, in the presence of arabinose, it promotes the rearrangement of AraC when
arabinose is present from a state in which it represses transcription of the PBAD promoter to one in which it
activates transcription of the PBAD promoter.
Regulation of the arabinose operon is, clearly, much more complex than the lactose operon.
When arabinose is absent, there is no need to express the structural genes. AraC does this by binding
simultaneously to araI and araO2. As a result the intervening DNA is looped. These two events block access to
the PBAD promoter which is, in any case, a very weak promoter (unlike the lac promoter):
AraC also prevents its own expression. Thus, it is an autoregulator of its own expression. This makes sense;
there is no need to over-express AraC. If the concentration falls too low then transcription of araC resumes until
the amount of AraC is sufficient to prevent more transcription again.
When arabinose is present, it binds to AraC and allosterically induces it to bind to araI instead of araO2. If
glucose is also absent, then the presence of CRP bound to its site between araO1 and araI helps to break the
DNA loop and also helps AraC to bind to araI:
The ara operon demonstrates both negative and positive control. It shows a different function for CRP. It also
shows how a protein can act as a switch with its activity being radically altered upon binding of a small molecule.
*
Light switch mechanism of AraC protein action.
*
In the absence of arabinose, the N-terminal arm
interacts with the DNA-binding domains and
holds the latter such that the protein loops
between araO2 and araI1. This represses both
pC and pBAD.
In the presence of arabinose, interactions
between arabinose and the N-terminal arms hold
the latter over the arabinose, thus freeing the
DNA-binding domains. These domains are then
free to bind to I1 and I2, which then leads to
induction of the pBAD promoter. The binding
of AraC to O1L and O1R, left and right, directly
represses the pC.
3. Productiestrategieën
E. coli : is het majeure "eerstelijns" organisme voor expressie
=> nadelen (beperkingen)
- geen (of zeer weinig) post-translationele modificaties
- nagenoeg geen efficiënte secretiewegen naar het medium
(secretie brengt het proteïne in de periplasmatische ruimte)
- extensieve S-S bruggen zijn moeilijk te vormen
Waarom dan recombinante expressie/productie ?
=> opdrijven van het productierendement
=> zuivering vergemakkelijken
=> nieuwe eiwitvarianten creëren (mutaties, inserties, fusies, enz.)
Het expressieproduct is :
- oplosbaar of onoplosbaar
- als matuur proteïne of als fusieproduct
- accumuleert in cytoplasma of wordt gesecreteerd naar periplasma
(type II secretie)
(met E. coli is mogelijke extracellulaire secretie (excretie) zeer beperkt ;
één voorbeeld : type I secretie van haemolysine)
vervolgt
vervolg
Expressieproduct :
- als matuur proteïne
- kan aggregeren en precipiteren als 'inclusion bodies'
- dit maakt zuivering gemakkelijk
- het beschermt tegen afbraak
- maar het vereist achteraf solubilisatie en hervouwing
=> denatureer (in bvb. guanidinium hydrochloride) en (tracht te) renatureren
- vertraging van synthesesnelheid kan dit aggregatieproces (deels)
inperken (bvb. door verlaging van de incubatietemperatuur)
- het expressieconstruct vereist kritische manipulatie van het RBS gebied
om efficiente (op hoog niveau) translatie-initiatie te verzekeren
- het MET-probleem : wordt de initiator (formyl-)methionine verwijderd ?
vervolgt
"Inclusion bodies" in E. coli
(Scanning electronmicrograph)
(Thin section through the cells)
Hoe de vorming van inclusion bodies vermijden (of verminderen) ?
(verbetering van de kans op eiwitvouwing)
- cellen groeien bij lagere temperatuur (vertraagt het expressieproces)
(of gebruik andere groeivertragende condities, bvb. samenstelling van media & pH waarden)
- co-expressie van chaperonen : DnaK, GroES, GroEL
- verwijdering van kritische aminozuurposities (bvb. in interferon-b)
- fusie aan thioredoxine, of sommige andere eiwitten (zoals MalE)
vervolg
- als fusieproteïne (bvb. random inserties in ScaI van cat : AGT'ACT)
- N-terminale en C-terminale fusies zijn mogelijk (of multipele partners)
- voordeel van C-terminale fusies : (d.i. aan C-terminus van fusiepartner)
translatie-initiatieëfficiëntie wordt grotendeels behouden
- fusiepartner kan doelwit zijn voor zuivering (etiket)
- fusiepartner kan een activiteit hebben waarmee het productieniveau
gevolgd kan worden
- fusiepartner kan verankering in de membraan bewerkstellingen
- een epitoop herkend door aan specifiek antilichaam kan voorzien worden
(voor detectie of kwantificering of zuivering)
- fusie aan een signaalpeptidesequentie kan secretie geven
=> secretie laat vorming van (minstens sommige) S-S bruggen toe
- secretie = keuze tussen cytoplasmatische of periplasmische productie
vervolgt
Verschillende mogelijkheden van translatiefusieconstructen
S : signaalsequentie ; I : membraanintegratiedomein ; A, B : fusiepeptiden, o.a. affiniteitsetiketten
Het gebruik van membraanintegratiedomeinen laat toe het proteïne te verankeren in één van de membraansystemen of in de celwand.
Constitutieve expressie van het cat gen (baan 2), en (peptide)fusies door random klonering
in de ScaI plaats (die dicht bij het C-terminus coderend gebied ligt) (banen 1, 6, 7, 9-15).
Banen 4 en 5 zijn plasmide-vrije cellen ; banen 3 en 8 zijn proteïne-lengtemerkers.
*
vervolg
Secretie : is een bijzondere vorm van fusie
- de fusiepartner (signaalpeptide) wordt verwijderd tijdens secretie
- er is dus geen (extra) methionine aan de N-terminus
- (de voorspelde) positie van splitsing is niet altijd gegarandeerd
=> meestal moet men verschillende secretiesignalen testen : van OmpA,
OmpT, PelB, b-lactamase, alkalische fosfatase, enz. Sommige hiervan
geven bij voldoende overexpressie ook lekkage naar het groeimedium.
- !!! maar : niet alle proteinen zijn ‘secreteerbaar’ (zelfs al is er een signaalpeptide)
Over het algemeen :
1) kleine peptiden : vaak stabiliteitsprobleem (afbraak van het peptide)
=> fusiebenadering te verkiezen : bvb. LacZ fusies
2) intermediaire grootte:
weinig S-S : intracellulaire aanmaak
meer S-S : periplasmische aanmaak (secretie)
3) grote proteïnen : problematischer
4. Zuivering en verwerking
Fusies die makkelijke zuivering mogelijk maken:
o.a. aan glutathion-S-transferase, MalE (MBP : maltose bindingsproteïne),
oligo-His (hexa-His), enz. : partners of etiketten. Zuivering door
affiniteitschromatografie of door immobilisatie gevolgd door elutie.
Vrijzetting van het etiket/de partner door splitsing met specifieke proteasen
zoals factor Xa, enterokinase, enz., of gebruik van ‘intein processing’.
Voorbeelden van
affiniteitsetiketten ("tags")
Voorbeelden van expressie-fusie systemen :
1. C-terminale fusie in pBAD/His vectoren
- zes Histidine triplets
- insertie in het juiste leesraam : BglII knipplaats
- binding aan een kolom met geïmmobilizeerd Ni2+
- splitsingsplaats voor enterokinase (D-D-D-D-K* ) (* = splitsingsplaats)
(nb. enkele resterende aminozuren blijven aan de N-terminus na verwerking)
2. C-terminale fusie aan een biotine-afhankelijke carboxylase
(biotine is een essentiële cofactor voor een aantal carboxylasen)
- biotine covalent aangehecht aan een lysine door biotine ligase (BirA)
(E. coli heeft één gebiotinyleerd eiwit maar dit bindt in zijn natieve vorm niet aan streptavidine)
het “doelwit”
(voor biotine ligase) is
aan de N-zijde als “tag” voorzien
- immobilisatie aan streptavidine (batchgewijs of door affiniteitschromatografie)
- factor Xa splitsingsplaats : I-E-G-R* of I-D-G-R* (niet gevolgd door P of R)
(* = splitsingsplaats)
(secundaire plaatsen meestal op G-R*)
Proteïneproductie en
verwerking met
pBAD/His vectoren
C-terminale fusie
6 His-resten voor affiniteitszuivering
splitsing door enterokinase
(D-D-D-D-K-*)
na verwerking blijven nog
een paar extra
aminozuren aan
de N-terminus
C-terminale fusie aan biotine carboxylase
Binding op streptavidinekolommen voor zuivering.
Verwerking met factor Xa protease
(I-E-G-R-* of I-D-G-R-* (niet gevolgd door P of R))
Zie ook verder “pinpoint vectoren”
De tag hier is een biotine-afhankelijk carboxylasegen.
Na splitsing met factor Xa protease blijven ook hier
meestal een aantal extra aminozuren aan het Nuiteinde over.
3. N-terminale fusie aan en verwerking door inteïne
(i.t.t. meeste andere systemen die C-terminaal zijn)
(vermijdt het toevoegen van een protease bij de verwerkingsstappen)
- N-terminale fusie aan (aangepast) inteïne + chitine bindingsdomein (CBD)
=> zelf-splitsing aan de N-terminus van het inteïne door een thiol
- expressie vanaf de T7 promotor, in fusie met lacO
=> inductie door IPTG
- bind het fusieproduct aan de chitinekolom
- was de kolom, en equilibreer de kolom met een DTT-oplossing
=> in situ splitsing bij 4°C gedurende een nacht
- elueer het doelwitproteïne
- verwijder de fusiepartner (inteïne-CBD) van de kolom met SDS
Splicing van het inteïne
Inteine :
- universeel voorkomend
- 200-800 lang
- diverse types met of zonder
homing endonuclease
- splitst autokatalytisch, geen
cofactoren, ATP of andere
elementen vereist
~100 aminozuren
~50 aminozuren
Verwerking van een N-terminale fusies aan inteïne, met immobilisatie op een chitinekolom
4. MalE-fusies : vectoren pMAL-c2 en pMAL-p2
(met (c) of zonder (p) de signaalpeptidesequentie van het malE gen: cytoplasmische of periplasmatische expressie)
- expressie-eenheid tussen de Ptac promotor en rrnB terminatoren, met lacIq
op de vector om voldoende Lac-repressor te voorzien.
- fusie tussen de malE partner en lacZa, gescheiden door 10xD en een MCS
voor insertie van het doelwitgen.
De in-frame constructie produceert blauwe kolonies op BCIG-media.
Het polaire 10xD peptide scheidt de twee proteïnedelen (eigen vouwing).
Klonering in de MCS geeft witte (kleurloze) kolonies.
- affiniteitszuivering op een amylosekolom : na elutie met maltose en splitsing door
factor Xa, wordt fusiepartner MalE verwijderd door een 2e chromatografie op amylose.
- MCS bevat (aan de linkerzijde) een XmnI, die overlapt met de factor Xa
knipplaats en een exacte fusie aan het doelwitgen mogelijk maakt : andere
insertieplaatsen laten enkele extra aminozuren aan het N-terminale uiteinde na factor Xa
splitsing.
- de EcoRI kloneerplaats ligt in hetzelfde leesraam als de EcoRI plaats in
lacZ : dit vergemakkelijkt de uitwisseling van een gen dat als een
expressiefusie gekloneerd is in (ondermeer) de vector lgt11.
pMAL expressievectoren
malE : kodeert voor maltosebindend proteïne (MBP)
lacZa
Karakteristieken van pMAL vectoren :
ColE1 ori ; M13 ori ; Ptac ; rrnB terminators ; lacIq ; bla
Fusieconstruct : malE - DDDDDDDDDD - IEGR - MCS(polylinker) - lacZa
(bij doorlezing in het leesraam : blauwkleuring met IPTG + BCIG)
pMAL-c2 : malE signaalpeptidesequentie is gedeleteerd
pMAL-p2 : met malE signaalpeptidesequentie : secretie naar het periplasma
 fusie in XmnI : exacte koppeling van het doelwitproteïne aan de factor Xa sequentie
 10 Asp eenheden (D) scheiden de twee fusiegedeelten
 insertie in EcoRI is identisch (qua leesraam) als in lgt11 (lacZ)
 de vector is een fasmide : snelle enkelstreng bereiding mogelijk
Splitsingsplaats van factor Xa
XmnI
I - E - G - R *
nnn nnn nGA Ann nnT TCn nnn
ATC-GAG-GGA-AGG-ATT-TCA-GAA-TTCEcoRI
"Multiple cloning site" in (één van) de pMAL vectoren
Perfecte fusie met XmnI.
Met EcoRI blijft alleen Ile-Ser- over (+ Glu-Phe vanop de EcoRI plaats)
Andere mogelijkheid (in sommige vectoren)
Pro-Gly-Ala-Ala-His-Tyr : splitsing door Genenase I (een geëngineerde vorm van subtilisine)
splitst achter His-Tyr (afhankelijke van het volgende aminozuur)
(splitst His-Tyr-Glu en His-Tyr-Asp traag, en His-Tyr-Pro en His-Tyr-Ile niet)
Verwerking van expressieproducten uit fusieconstructen in pMAL vectoren
5. Pinpoint vectoren
- gelijkaardige elementen als in vorige voorbeelden (o.a. vb.2):
tac (en T7) promoter, insertieplaatsen, etiket, factor Xa doelwit, enz.
hier tevens SP6 (naast T7 vanop andere streng) promoter voor synthese van RNA
- N-terminaal is een etiket waarin een lysine gebiotinyleerd wordt door het
E. coli biotin ligase holoenzyme
Het lysine is toegankelijk voor (strept)avidine : => etiket voor detectie en zuivering
E. coli produceert slechts één enkel endogeen gebiotinyleerd proteïne dat, in zijn natieve
conformatie, niet bindt aan (strept)avidine : => zeer specifiek zuiveringssysteem voor het
recombinante fusieproteïne.
Ook, detectie van het fusieproteïne mogelijk met streptavidine-alkalische fosfatase.
- het fusieproteïne bindt aan (strept)avidine, en kan geëlueerd worden door
toevoeging van 5mM biotine : => geen denaturerende condities vereist.
(Commerciële)
Pinpoint vectoren
twee promoters : T7 en tac
factor Xa knipplaats
N-terminale biotinylering (tag)
polylinker (MCS)
in vitro RNA sondes met de
SP6 (of T7) promoter
secretiesignaal (sommige vectoren)
Detectie door
streptavidine-alkalische
fosfatase
Elutie van fusieproteïne met
5 mM biotine
(dus : geen denaturatie vereist)
6. Een recentere pET vector (zie hoger) voor LIC klonering en eiwitverwerking
22 aminozuren N-terminale fusie, waarin hexa-His en protease TEV knipplaats
M-H-H-H-H-H-H-S-S-G-V-D-L-G-T-E-N-L-Y-F-Q*S-M- (* is de TEV knipplaats)
LIC klonering (LIC-5 en LIC-3 plaatsen)
sacB als (negatieve) selectiemerker
(nl. als stuffer) op 5% sucrose
De waardcel moet T7 RNA polymerase
tot expressie brengen
(zie pET systeem)
Fasmide vector.
TEV (van Tobacco etch virus) protease :
herkent E-X-X-Y-X-Q-G/S en splitst
tussen Q en G of S. Tolereert dus heel
wat aminozuursequentievariatie maar
de splitsingsefficientie varieert sterk.
Meestal wordt E-N-L-Y-F-Q-S gebruikt
dat het meest efficiënte substraat lijkt.
N
Zijn structuur is similair aan serineproteasen
maar met C i.p.v. S in de katalytische triade
Ser-Asp-His, hetgeen allicht zijn resistentie
tegen veel protease-inhibitoren verklaart.
*N
Ander, analoog aan het
vorige, voorbeeld. Hier op
basis van een vector voor
TOPO-klonering, zie
practicum, maar in deze
vector ook alle elementen
voorzien voor expressie en
verdere verwerking van het
eiwitproduct.
5. Optimalisatiestrategieën
bvb. C-terminale fusie aan een reportergen om expressierendement te testen
in functie van (kleine) wijzigingen. Ondermeer door regio-specifieke
willekeurige mutaties (o.a. in het gebied van ribosoombinding en initiatie) kan de
beste producer geïdentificeerd worden.
*
Op analoge wijze kan een N-terminale fusie aan een reportergen voorzien
worden, en dusdanig dat na optimalisatie (regio-mutagenese) kan het
reportergen geëxciseerd kan worden. Er wordt dan op gespeculeerd
dat het C-terminale deel van de fusie geen invloed heeft op de
expressieëfficientie.
GFP (green fluorescent protein) is een efficiënte, meer recente, reporter ; het oorspronkelijk geïsoleerde
was een eiwit van 238 aminozuren (26,9 kDa) dat een groene fluorescentie (emissie bij 509 nm) geeft
bij belichting met blauw licht (excitatie bij 395 nm en ook, in mindere mate, bij 475 nm). Het vereist
Ca2+ ionen. Het werd geïsoleerd uit Aequorea victoria, maar heel wat andere mariene organismen
bleken similaire eiwitten te bevatten. Er werden tevens tal van mutanten gemaakt (van het eerste en van
latere) waarmee de eerste nadelen (2 excitatiegolflengtes en afhankelijkheid van cofactoren) konden
uitgeschakeld worden. Expressies in nagenoeg alle organismen voor genmanipulatie werden bekomen.
Addendum : Genoomstrategie : lokaliseren van coderende gebieden (ORFs) in een genoomsequentie
*N
*
N
(in de DNA
sequentie)
Toegepast op een genomische DNAsequentie met hoog G+C gehalte (75%)
posities in
codon