Mechanizm działania CRISPR-Cas9: szczegóły molekularne i strukturalne
🧬 Seria artykułów o CRISPR:
- Część 1: Historia i podstawy CRISPR
- Część 2: Mechanizm działania CRISPR-Cas9
- Część 3: Enhancery i promotory w edycji genomu
- Część 4: Sekwencjonowanie i kodowanie genomu
- Część 5: Programowanie CRISPR - bioinformatyka
- Część 6: Zastosowania i dostępność technologii
🏗️ Architektura molekularna białka Cas9
Białko Cas9 z Streptococcus pyogenes (SpCas9) – najczęściej wykorzystywany wariant w badaniach – posiada złożoną strukturę składającą się z dwóch głównych lob (części):
Strukturalna organizacja Cas9
Masa: ~60 kDa | Aminokwasy: 1-713
Składa się z trzech domen helikalnych:
- REC1 (aa 94-179, 308-713): Największa domena, tworzy kanał wiążący sgRNA
- REC2 (aa 180-307): Most łączący REC1 z domeną nukleazową
- REC3 (domena helical, aa 1093-1368): Oddziałuje z kompleksem RNA:DNA
Funkcja: Wiązanie sgRNA, rozpoznawanie RNA-DNA heteroduplex, zmiany konformacyjne podczas aktywacji
Masa: ~100 kDa | Aminokwasy: 714-1092 + inserje
Zawiera dwie niezależne domeny nukleazowe:
- Domena HNH (aa 775-908): Metaloenzym zależny od Mg2+, przecina nić komplementarną (target strand)
- Domena RuvC (aa 1-59, 718-769, 909-1098): Nukleaza typu RNaza H, przecina nić niekomplementarną (non-target strand)
- Domena PAM-interacting (PI domain, aa 1099-1368): Rozpoznaje sekwencję PAM (5'-NGG-3')
Funkcja: Kataliza cięcia obu nici DNA, rozpoznawanie PAM
🔬 Kluczowe struktury krystaliczne
Przełomowe badania strukturalne:
1. Struktura apo-Cas9 (2014): Pierwszy obraz Cas9 bez RNA pokazał, że białko przyjmuje "zamkniętą" konformację, w której centra aktywne nukleaz są oddalone o ~50 Å od siebie – zbyt daleko, aby efektywnie ciąć DNA.
Jinek et al. (2014) Science, 343(6176): 1247997
2. Kompleks Cas9:sgRNA:DNA (2014): Struktura kompleksu z docelowym DNA ujawniła dramatyczną zmianę konformacyjną – lob REC obraca się o ~30°, zbliżając domeny nukleazowe do DNA. Dodatkowo pokazała, jak sgRNA tworzy scaffold stabilizujący kompleks.
Nishimasu et al. (2014) Cell, 156(5): 935-949
3. Wysokorozdzielcze struktury (2019-2023): Struktury uzyskane metodą kriopikosekundowej mikroskopii elektronowej (cryo-EM) z rozdzielczością 2.6-3.2 Å ujawniły szczegóły na poziomie atomowym, w tym pozycje jonów Mg2+ w centrach aktywnych.
🧩 Komponenty układu CRISPR-Cas9
Single guide RNA (sgRNA)
sgRNA to syntetyczna fuzja dwóch naturalnych RNA bakteryjnych, zaprojektowana przez Doudnę i Charpentier w 2012 roku. Składa się z:
Kluczowe elementy strukturalne sgRNA:
- Spacer (20 nukleotydów): Programowalna sekwencja komplementarna do DNA docelowego. Można ją dowolnie modyfikować, aby celować w różne miejsca genomu.
- Powtórzenie crRNA (repeat, ~25 nt): Tworzy hybrydę z tracrRNA
- Scaffold tracrRNA (~80 nt): Zawiera trzy struktury stem-loop niezbędne do wiązania Cas9. Każda pętla oddziałuje z różnymi domenami Cas9.
- Zawartości GC w spacerze (optymalne: 40-60%)
- Struktury drugorzędowej spacera (unikać silnych struktur hairpin)
- Nukleotydu na pozycji bezpośrednio przed PAM (najlepsza skuteczność: G)
- Dostępności chromatyny w miejscu docelowym
- Modyfikacji chemicznych zwiększających stabilność (2'-O-metylacja, fosforotioat)
⚙️ Mechanizm działania krok po kroku
Proces rozpoznawania i cięcia DNA przez CRISPR-Cas9 można podzielić na osiem precyzyjnie zdefiniowanych etapów:
1 Formowanie kompleksu Cas9:sgRNA
Białko Cas9 wiąże sgRNA z wysokim powinowactwem (Kd ~ 1-10 nM). Wiązanie RNA indukuje znaczące zmiany konformacyjne:
- Lob REC otwiera się, tworząc kanał dla sgRNA
- Domena PI ulega reorientacji, przygotowując miejsce wiązania PAM
- Centra aktywne nukleaz pozostają w stanie nieaktywnym
Czas formowania: ~100 ms w warunkach in vitro
2 Skanowanie DNA w poszukiwaniu PAM
Kompleks Cas9:sgRNA przeszukuje DNA w poszukiwaniu motywu PAM (5'-NGG-3'). Proces ten zachodzi poprzez:
- Dyfuzję 1D: Cas9 ślizga się wzdłuż DNA (1D sliding)
- Przeskoki 3D: Dysocjacja i ponowne wiązanie w innym miejscu
- Próbkowanie PAM: Domena PI oddziałuje z małym rowkiem DNA, testując kolejne trójnukleotydy
Kluczowe aminokwasy rozpoznające PAM w SpCas9:
Arg1333, Arg1335 – wiązanie wodorowe z G na pozycji +2 i +3 PAM
Szybkość skanowania: Cas9 testuje ~1000 sekwencji PAM na sekundę
3 Rozpoznanie PAM i destabilizacja DNA
Po znalezieniu odpowiedniej sekwencji PAM (5'-NGG-3'):
- Domena PI Cas9 wiąże się z PAM, indukując lokalne rozplecenie DNA (melting)
- Powstaje krótki bąbel denaturacyjny (~3 pz) bezpośrednio przed PAM
- Ten proces jest niezależny od komplementarności spacera do DNA!
4 Formowanie heterodupleksu RNA:DNA (R-loop)
Najbardziej krytyczny etap rozpoznawania:
- Spacer w sgRNA (20 nt) rozpoczyna parowanie z nićią target DNA od strony PAM (pozycja +1)
- Parowanie postępuje w kierunku 5'→3' względem sgRNA (pozycje +1 do +20)
- Tworzy się struktura R-loop: hybryda RNA:DNA (target strand) + wypartą nić DNA (non-target strand)
- Nić non-target jest wyparta i biegnie przez oddzielny kanał w Cas9
Seed sequence – kluczowy region rozpoznawania:
10-12 nukleotydów najbliższych PAM (pozycje +1 do +12) stanowi "seed region" – region o najwyższych wymaganiach komplementarności. Nawet pojedyncze niedopasowanie w seed region może całkowicie zablokować cięcie.
🔄 Kaskada zmian konformacyjnych
Pełne formowanie R-loop indukuje dramatyczne reorganizacje strukturalne:
- Rotacja lobu REC: Obrót o ~30° względem lobu NUC
- Reorientacja domeny HNH: Przemieszczenie o ~40 Å w kierunku nici target
- Aktywacja katalityczna: Centrum aktywne HNH i RuvC zajmują pozycje kompetentne katalitycznie
- Wiązanie jonów Mg2+: Koordynacja 2-3 jonów Mg2+ w każdym centrum aktywnym
5 Aktywacja centrum aktywnego HNH
Domena HNH przecina nić target (komplementarną do sgRNA). Mechanizm katalityczny:
Katalityczna triada HNH:
- Asp839 – wiązanie Mg2+ i aktywacja nukleofilowej cząsteczki wody
- His840 – kwas ogólny/zasada ogólna
- Asn863 – stabilizacja stanu przejściowego
Miejsce cięcia: 3 pz przed PAM (między pozycjami +3 i +4 protospacera)
Mechanizm: Hydroliza wiązania fosfodiestrowego poprzez atak nukleofilu (H2O lub OH-) na atom fosforu, katalizowana przez jony Mg2+
6 Aktywacja centrum aktywnego RuvC
Domena RuvC przecina nić non-target (wypartą). Mechanizm typu RNazy H:
Katalityczna triada RuvC:
- Asp10 – koordynacja Mg2+
- Glu762 – kwas ogólny
- Asp986 – koordynacja drugiego Mg2+
Miejsce cięcia: 3-8 pz przed PAM (między pozycjami +3 i +8), typowo ~3-4 pz
Koordynacja czasowa: Cięcie przez RuvC może następować nieco później niż przez HNH (opóźnienie ~0.5-5 sekund), co prowadzi do przejściowego powstania nacięć pojedynczej nici (SSB, single-strand breaks) przed ostatecznym podwójnym pęknięciem (DSB, double-strand break)
7 Powstanie podwójnego pęknięcia DNA (DSB)
Skoordynowana aktywność HNH i RuvC prowadzi do powstania DSB z charakterystyką:
- Typ końców: Tępe końce (blunt ends) z 5'-fosforan i 3'-hydroksyl
- Lokalizacja: 3 pz przed PAM (głównie od strony +3)
- Precyzja: >90% cięć w dokładnie tym samym miejscu
8 Dysocjacja kompleksu i recykling Cas9
Po przecięciu DNA:
- Cas9 pozostaje związany z przeciętym DNA przez 5-60 minut (w zależności od warunków)
- Dysocjacja jest wolna (koff ~ 0.001-0.01 s-1), co może ograniczać efektywność wielokrotnego użycia
- Po dysocjacji Cas9:sgRNA może uczestniczyć w kolejnym cyklu cięcia
- Pojedyncza cząsteczka Cas9 może przeciąć wiele cząsteczek DNA in vitro (katalityczny turnover)
🎯 Specyficzność i efekty off-target
Jednym z największych wyzwań w zastosowaniu CRISPR-Cas9 jest zjawisko efektów off-target – cięcia DNA w miejscach podobnych, ale nie identycznych do sekwencji docelowej.
📊 Determinanty specyficzności Cas9
1. Reguły niedopasowań (mismatch tolerance):
- Seed region (pozycje +1 do +12): bardzo niska tolerancja – nawet 1 niedopasowanie drastycznie redukuje cięcie
- Region dystalny (pozycje +13 do +20): wyższa tolerancja – 2-3 niedopasowania mogą być tolerowane
- Pozycja PAM: absolutnie krytyczna – żadne cięcie bez prawidłowego PAM
2. Typ niedopasowań:
- rG:dT i rG:dG (rybonukleotyd : deoksyrybonukleotyd) są lepiej tolerowane niż inne niedopasowania
- Ciągłe niedopasowania (consecutive mismatches) bardziej redukują aktywność niż rozproszone
3. Efekt Cas9 pozostającego na DNA:
Nawet jeśli Cas9 zwiąże się off-target bez cięcia, może blokować DNA binding proteins, wpływając na ekspresję genów (CRISPRi effect)
Warianty Cas9 o zwiększonej specyficzności
Inżynieria białkowa pozwoliła na rozwój wariantów Cas9 z drastycznie zredukowanymi efektami off-target:
| Wariant Cas9 | Modyfikacje | Redukcja off-target | On-target activity |
|---|---|---|---|
| SpCas9 (WT) | Typ dziki | Baseline | 100% |
| eSpCas9(1.1) | 3 mutacje zmniejszające niespecyficzne wiązanie DNA (K810A, K1003A, R1060A) |
10-100x mniej | 70-100% |
| SpCas9-HF1 | 4 mutacje redukujące wiązanie do non-target strand (N497A, R661A, Q695A, Q926A) |
10-1000x mniej | 50-100% |
| HypaCas9 | Kombinacja mutacji eSpCas9 i HF1 | 100-1000x mniej | 50-80% |
| xCas9 | Rozszerzona rozpoznawanie PAM (NG, GAA, GAT) + zwiększona specyficzność |
10-50x mniej | 60-100% |
| Cas9-NG | PAM: NG (najbardziej elastyczny) | Porównywalna do WT | 40-80% |
🧪 Kinetyka i termodynamika reakcji
- Kd (Cas9:sgRNA): 1-10 nM (bardzo silne wiązanie)
- kon (wiązanie do DNA z PAM): ~105 M-1s-1
- koff (dysocjacja od przeciętego DNA): 0.001-0.01 s-1 (bardzo wolna)
- kcat (kataliza cięcia): 0.01-0.1 s-1 (cięcie w ciągu 10-100 sekund po związaniu)
- Temperatura optymalna: 37°C (dla SpCas9)
- pH optymalny: 7.5-8.0
- Wymaganie Mg2+: 5-10 mM (kofaktor niezbędny)
Uwaga dotycząca warunków in vivo: W komórce kinetyka jest bardziej złożona ze względu na:
- Kompaktyzację chromatyny (histony ograniczają dostęp do DNA)
- Konkurencję z innymi białkami wiążącymi DNA
- Niższą koncentrację Mg2+ w jądrze (~1 mM)
- Procesy naprawy DNA aktywne natychmiast po cięciu
🔬 Metody badania mechanizmu CRISPR-Cas9
Nasze rozumienie mechanizmu molekularnego CRISPR-Cas9 pochodzi z różnorodnych technik biofizycznych i biochemicznych:
Kluczowe techniki badawcze:
1. Krystalografia rentgenowska (X-ray crystallography):
Pierwsze struktury atomowe Cas9 (rozdzielczość 2.2-2.6 Å). Wymaga krystalizacji białka, co może stabilizować nienatywne konformacje.
2. Kriopikosekundowa mikroskopia elektronowa (Cryo-EM):
Obrazowanie kompleksów Cas9:RNA:DNA w roztworze bez krystalizacji. Najwyższa osiągnięta rozdzielczość: 2.6 Å. Pozwala obserwować różne konformacje w heterogennej populacji.
3. Fluorescencja pojedynczej cząsteczki (smFRET - single-molecule FRET):
Obserwacja dynamiki konformacyjnej Cas9 w czasie rzeczywistym. Ujawniła, że formowanie R-loop zachodzi stopniowo i może być odwrócone przy niedopasowaniach.
4. Testy aktywności in vitro:
Analiza kinetyki cięcia plazmidowego lub linearnego DNA. Identyfikacja produktów reakcji przez elektroforezę.
5. Sekwencjonowanie nowej generacji (NGS) dla wykrywania off-target:
Techniki takie jak GUIDE-seq, CIRCLE-seq, DISCOVER-seq pozwalają na identyfikację wszystkich miejsc cięcia genomu przez CRISPR-Cas9 w komórkach.
🎓 Podsumowanie
Mechanizm działania CRISPR-Cas9 to fascynujący przykład precyzji molekularnej biologii. Od formowania kompleksu Cas9:sgRNA, przez skanowanie genomu w poszukiwaniu PAM, rozpoznawanie sekwencji docelowej poprzez parowanie zasad RNA:DNA, aż po skoordynowaną aktywność dwóch niezależnych nukleaz – każdy etap został ewolucyjnie zoptymalizowany przez bakterie do obrony przed fagami.
Zrozumienie tych mechanizmów na poziomie atomowym pozwoliło naukowcom na dalszą inżynierię systemu – tworzenie wariantów o zwiększonej specyficzności, rozszerzonym zakresie PAM, oraz całkowicie nowych funkcjach poza cięciem DNA.
W kolejnym artykule zagłębimy się w rolę elementów regulatorowych genomu – enhancerów i promotorów – oraz ich znaczenie w kontekście edycji genomu przez CRISPR.