banner
Hogar / Noticias / Estructura de la OMEGA nickasa IsrB en complejo con ωRNA y ADN diana
Noticias

Estructura de la OMEGA nickasa IsrB en complejo con ωRNA y ADN diana

May 06, 2023May 06, 2023

Nature volumen 610, páginas 575–581 (2022)Citar este artículo

17k Accesos

2 citas

107 Altmetric

Detalles de métricas

Los sistemas guiados por ARN, como CRISPR-Cas, combinan el reconocimiento de sustrato programable con la función enzimática, una combinación que se ha utilizado ventajosamente para desarrollar potentes tecnologías moleculares1,2. Los estudios estructurales de estos sistemas han revelado cómo el ARN y la proteína reconocen y escinden sus sustratos de manera conjunta, lo que guía la ingeniería racional para un mayor desarrollo tecnológico3. Un trabajo reciente identificó una nueva clase de sistemas guiados por ARN, denominados OMEGA, que incluyen IscB, el probable ancestro de Cas9, y la nickasa IsrB, un homólogo de IscB que carece del dominio de nucleasa HNH4. IsrB consta de solo alrededor de 350 aminoácidos, pero su pequeño tamaño se ve contrarrestado por una guía de ARN relativamente grande (aproximadamente 300 nt ωRNA). Aquí, informamos la estructura de microscopía electrónica criogénica de Desulfovirgula thermocuniculi IsrB (DtIsrB) en complejo con su ωRNA afín y un ADN objetivo. Encontramos que la estructura general de la proteína IsrB comparte un andamio común con Cas9. Sin embargo, a diferencia de Cas9, que utiliza un lóbulo de reconocimiento (REC) para facilitar la selección de objetivos, IsrB se basa en su ωRNA, parte del cual forma una estructura ternaria intrincada posicionada de manera análoga a REC. Los análisis estructurales de IsrB y su ωRNA, así como las comparaciones con otros sistemas guiados por ARN, resaltan la interacción funcional entre la proteína y el ARN, lo que mejora nuestra comprensión de la biología y la evolución de estos diversos sistemas.

La proteína IsrB guiada por ARN es un miembro de la familia OMEGA codificado en la superfamilia de transposones IS200/IS605. IsrB es el antecedente probable de IscB, otro miembro de la familia OMEGA que es el ancestro aparente de Cas9, como lo indica tanto el análisis filogenético como la arquitectura de dominio único compartido4,5. Al igual que IscB y Cas9, IsrB contiene un dominio de nucleasa similar a RuvC que se interrumpe por la inserción de una hélice puente (BH) (Fig. 1a). Sin embargo, a diferencia de IscB y Cas9, IsrB carece del dominio de nucleasa HNH, el lóbulo REC y grandes porciones del dominio de interacción con el motivo adyacente al protoespaciador (PAM) y, en consecuencia, es mucho más pequeño (aproximadamente 350 aminoácidos) que Cas9. . IsrB además contiene un dominio PLMP N-terminal (llamado así por su motivo de aminoácido conservado) y un dominio C-terminal no caracterizado (Fig. 1b). El trabajo anterior ha demostrado que IsrB se asocia con un ωRNA de aproximadamente 300 nt, lo que guía a IsrB a cortar la cadena no objetivo de ADN de doble cadena (ds) que contiene un motivo adyacente al objetivo 5′-NTGA-3′ (TAM)4 .

a, Arquitectura de locus y ARN guía para IsrB (izquierda) y Cas9 (derecha). b, Arquitectura de dominio de Streptococcus pyogenes SpCas9 (arriba) y D. thermocuniculi IsrB (DtIsrB) (abajo). c, Esquema de IsrB en complejo con el ωRNA y el ADN diana. El dúplex de ADN parcial que contiene el TAM y las secuencias diana utilizadas para el estudio estructural se muestran en letras de secuencia. d, e, mapa de densidad Cryo-EM ( d ) y modelo estructural ( e ) del complejo de ADN diana IsrB – ωRNA. Las líneas discontinuas representan regiones pobremente resueltas de ωRNA. TE, extremo del transposón; DR, repetición directa; NUC, nucleasa; PI, interactuando con PAM; PLL, bucle de bloqueo de fosfato; TI, interacción con TAM; TS, hebra diana; NTS, hebra no diana.

Para caracterizar el mecanismo molecular de la orientación del ADN guiada por ωRNA por IsrB, analizamos un complejo ternario que comprende Desulfovirgula thermocuniculi IsrB (DtIsrB), un ωRNA de 284 nt que contiene un segmento guía de 20 nt, una hebra de ADN objetivo de 31 nt y una cadena de 10 nt. -nt cadena de ADN no diana utilizando crio-EM de una sola partícula (Fig. 1c). Obtuvimos una reconstrucción tridimensional (3D) del complejo ternario con una resolución general de 3.1 Å (Fig. 1d, Datos extendidos Fig. 1a-c y Tabla de datos extendidos 1). Sin embargo, algunas regiones del mapa correspondientes al ωRNA se resolvieron a una resolución más baja. Para refinar el modelado de las coordenadas de ARN, utilizamos una herramienta de modelado específica de ARN, auto-DRRAFTER, junto con un modelo de estructura secundaria basado en covarianza para construir un modelo de ARNω inicial. Sobre la base de este modelo de ωRNA y un modelo IsrB inicial generado por la predicción de la estructura de la proteína, determinamos la estructura IsrB–ωRNA–DNA (Fig. 1e y Extended Data Figs. 1d,e y 2)6,7,8.

La estructura reveló que IsrB se une ampliamente al ADN diana a través de un dúplex de 20 nt entre el ωRNA y el ADN diana (Fig. 1e). El dominio RuvC (residuos 60–253) abarca los tres motivos catalíticos (RuvC I–III) y tres inserciones (BH (residuos 92–112), A (residuos 113–129) y B (residuos 161–179)) (Fig. .1b). La inserción A es un enlazador de "atajo" entre BH y RuvC II; este enlazador se reemplaza con el lóbulo REC en Cas9. Por lo tanto, denotamos esta inserción como el enlazador REC (RECL). La inserción B, entre RuvC II y III, es un enlazador simple que consta de un bucle y una hélice α que en la estructura IsrB ocupa una posición correspondiente a la del dominio HNH en Cas9. Por lo tanto, lo denotamos el enlazador HNH (HNHL). El dominio C-terminal (residuos 287–351) adopta un pliegue central que comprende dos láminas β distorsionadas (β1/2/6 y β3/4/5) y se une al dúplex de ADN que contiene TAM (Fig. 1e y Datos extendidos Fig. 3a). Denotamos este dominio como el dominio de interacción con TAM (TI) debido a las similitudes estructurales y funcionales con el dominio de Cas9 que interactúa con PAM (datos extendidos Fig. 3b). La hebra β adicional (β7) interactúa ampliamente con el pliegue central del dominio TI y comparte una hoja β común con el núcleo RuvC que adopta el pliegue RNaseH (Datos extendidos Fig. 3a). Esta disposición sugiere que los dominios TI y RuvC cooperan para definir la distancia entre el sitio activo de RuvC y el sitio de unión a TAM (Fig. 1e). Las regiones intermedias A (residuos 254–267) y B (268–286) entre los dominios RuvC y TI parecen ser funcionalmente análogas al bucle de bloqueo de fosfato y al dominio WED de Cas9, respectivamente, y por lo tanto adoptamos esos términos para IsrB (Figura 1e). El dominio PLMP (residuos 1–59) presenta una lámina β antiparalela de cuatro hebras (β1–4) y una hélice α, y es estructuralmente similar al dominio N-terminal del factor de iniciación de la traducción 3 (Fig. 1e y datos extendidos). Figuras 3a y 4). En este dominio, la cadena que contiene el motivo PLMP (β2) está abombada debido a que dos prolinas (Pro17 y Pro20) interrumpen uno de los enlaces de hidrógeno, pero parece mantener la integridad de una cadena coherente (β1). El dominio PLMP interactúa ampliamente con los dominios RuvC y TI, lo que sugiere un papel en el soporte de sus funciones.

El ωRNA consiste en el segmento guía de 20 nt, que se empareja con el ADN objetivo, y el andamiaje de ωRNA de 262 nt. Este andamio consta de 12 hélices (cuatro tallos (S1–4) y ocho bucles de tallo (SL1–8)), que se ubican en tres capas (capa 1, S1/3 y SL1/2/5/6; capa 2, S2/4 y SL3/4, capa 3, SL7/8) (Fig. 2a,b). Todas las hélices de ARN están empaquetadas por diversas interacciones de ARN. Las combinaciones S1-SL1, S2-SL3 y S3-SL6 se apilan directamente en cada combinación. S4 y SL4 están apilados coaxialmente debido al apilamiento directo entre A152 y U154 y la formación de base triple entre A152, U179 y U183. SL2 y SL5 forman un pseudonudo (que denominamos pseudonudo adaptador), que está rematado por una base triple formada por G81, A192 y U197 (Fig. 2c). Algunas hélices de ARN conectan capas dentro de la estructura globular de ARNω. S2, C107, A108, G245 y A246 forman la región del nexo, que está ampliamente conservada en el tracrRNA de Cas9s (ref. 9) (Fig. 2a). Esta región de nexo y S4 están directamente conectadas a S1 y SL5, respectivamente, entre las capas 1 y 2. SL4 forma un pseudonudo (que denominamos pseudonudo de nexo) con la región entre S2 y SL7, lo que permite interacciones entre las capas 2 y 3 ( Figura 2a,b). Las mutaciones que interrumpieron los pares de bases en los pseudonudos abolieron la actividad de corte del ADN, y las mutaciones posteriores que restauraron los pares de bases en el pseudonudo del adaptador restauraron parcialmente esta actividad, lo que destaca la importancia de los pseudonudos para la función del ωRNA (Fig. 2d). Estos datos estructurales y bioquímicos muestran que el ωRNA forma una estructura globular compacta lograda por varias interacciones de RNA. Tal estructura puede ser beneficiosa para los sistemas OMEGA: si el ωRNA forma de forma autónoma su estructura globular y funciona como un andamio (en contraste con el tracrRNA), la proteína efectora no necesita motivos/dominios auxiliares para respaldar el plegamiento y la función del RNA. Además, si la forma globular proporciona cierta resistencia a la degradación del ARN endógeno, podría facilitar el funcionamiento del ARNω en trans con una proteína efectora. Esta última posibilidad está respaldada por el hallazgo de ωRNA independientes que pueden funcionar con el efector OMEGA IscB4 relacionado.

a,b, Esquema (a) y modelo estructural (b) del andamio de ωRNA (residuos 21–282). S1–4, raíz 1–4; SL1–8, bucle de tallo 1–8; PK, pseudonudo. En a, los pares de bases canónicas y no canónicas se representan mediante líneas negras continuas. Las regiones mal resueltas están encerradas en un cuadro discontinuo. En b, el segmento de guía se omite por claridad. c, Una formación de triple base en el pseudonudo del adaptador. Los enlaces de hidrógeno se muestran como líneas discontinuas. d, corte de DtIsrB-ωRNA RNP reconstituido in vitro de sustratos de dsDNA (con TTGA TAM) con ωRNA de longitud completa o ωRNA truncado. n = 3 réplicas técnicas independientes. Δ34–67, ωRNA en el que los nucleótidos 34–67 se reemplazaron con GAAA; 165-AGCG-168, ωRNA en el que los nucleótidos 165–168 se reemplazaron con AGCG; 194-GCGG-197, ωRNA en el que los nucleótidos 194–197 se reemplazaron con GCGG; 194-GCGG-197/81-CCGC-84, ωRNA en el que los nucleótidos 81–84 y 194–197 se reemplazaron con CCGC y GCGG, respectivamente.

La región del tallo 5′ del ωRNA (S1, SL1 y SL2) se designa como la región del adaptador guía. Parece que durante la transición evolutiva del sistema OMEGA a CRISPR-Cas, SL2 y las hebras descendentes de S1/SL1 del ωRNA se adaptaron para formar la matriz CRISPR para permitir la formación del funcional Cas9-CRISPR RNA (crRNA)-tracrRNA complejo (Fig. 1a). La secuencia genómica que codifica la región del adaptador guía es importante para la actividad del transposón IS200/IS605 en los genomas bacterianos10 (Fig. 2a). Truncamos parte de esta región, SL1 (ΔSL1 ωRNA), y descubrimos que el ARN resultante aún admitía una sólida actividad de corte de ADN por parte de IsrB (Fig. 2d). Además, reconstituimos ΔSL1 ωRNA con la proteína IsrB y el ADN objetivo y realizamos un análisis de una sola partícula, generando un mapa de resolución de 6.9 Å (Datos extendidos Fig. 6a-e). La comparación de este mapa con el del ARN de longitud completa validó la posición de SL1 determinada a partir de nuestro modelo de ARN y reveló una similitud conformacional entre los ARN de longitud completa y ΔSL1 (datos extendidos Fig. 6a, b). Estos resultados indican que no se requiere SL1 en la región del adaptador de guía para el corte del ADN objetivo por parte de IsrB y, en cambio, puede contribuir a otras funciones involucradas en la movilidad de los transposones que codifican IsrB. El andamio de ωRNA interactúa ampliamente con todas las partes de IsrB excepto con la región HNHL (Fig. 1e). En particular, el dominio PLMP interactúa con las horquillas en tándem (SL7 y SL8) cerca del extremo 3 'del ωRNA. El truncamiento de SL7/8, pero no de SL8, redujo la actividad de corte de IsrB (Fig. 2d). Dado que la horquilla terminal (SL7) del ωRNA contiene la secuencia Shine-Dalgarno ubicada inmediatamente aguas arriba de la región de codificación de IsrB, estos resultados indican que la interacción IsrB-ωRNA es importante para la función de IsrB y podría contribuir a la regulación de la expresión de IsrB. en su contexto nativo.

A continuación, buscamos aprovechar la información estructural para descifrar el mecanismo de IsrB dirigido al ADN. El heterodúplex gRNA-Dana DNA está rodeado por S2/S3/S4/SL2/SL4/SL5 del ωRNA, así como por el dominio RuvC y las regiones BH/RECL/HNHL de IsrB (Figs. 1e y 2b). SL2, SL4 y SL5 contactan directamente con el esqueleto heterodúplex a través de enlaces de hidrógeno e interacciones de van der Waals (Fig. 3a,b). S2, S3 y S4 reconocen indirectamente el esqueleto del heterodúplex mediante un conector peptídico corto, RECL, en el que se induce que los residuos 113-124 encajen en las ranuras de S2/S3/S4 y el heterodúplex (Fig. 3b)11. La mutación de F119 y R124 a alanina redujo la actividad de mella en el ADN de IsrB, lo que destaca la importancia funcional de estos residuos en RECL (Fig. 3c). Además del ωRNA, la proteína IsrB se une ampliamente al heterodúplex (Fig. 1e). El HNHL reconoce el surco menor del heterodúplex a través de interacciones con los restos de ribosa de la columna vertebral (Fig. 3d). Confirmamos la importancia de esta interacción al eliminar los residuos V161–F174 en el HNHL, lo que eliminó la actividad de corte del ADN (Fig. 3c y Extended Data Fig. 5b). Varios residuos de arginina en el BH entran en contacto con el esqueleto de fosfato del segmento guía del ARNω de manera similar al complejo Cas9-ARN guía, en el que las interacciones ARN guía-BH preordenan la región guía para el reconocimiento y desenrollado del ADN12 (Fig. 3f ). La mutación de R104, pero no de R100, a alanina redujo la actividad de mella en el ADN de IsrB, lo que destaca la importancia funcional de R104 en el BH (Fig. 3c). Aguas abajo de la región objetivo (dG1–dC20), la cadena de ADN complementaria de ωRNA (es decir, la cadena objetivo) se invirtió y se apareó con la cadena de ADN no objetivo para formar un dúplex que contiene TAM (dA[−1] -dA[−10]–dT1*-dT10*) (Fig. 1c,e). El grupo fosfato de la columna vertebral entre dC20 y dA(-1) en la hebra objetivo es reconocido por Asn265 en el bucle de bloqueo de fosfato, lo que facilita la formación de heterodúplex (Fig. 3e). La mutación de N265 a alanina redujo la actividad de corte, lo que sugiere la importancia de este residuo para el desenrollado del ADN (Fig. 3c). El dominio PLMP y el motivo β7 en el dominio TI son las unidades fundamentales en el andamio RuvC-TI-PLMP (Datos extendidos Fig. 3a). El truncamiento de estos dominios/motivos eliminó la actividad de mella en el ADN de IsrB, lo que indica la importancia del andamio rígido de RuvC-TI-PLMP (Fig. 3c y Datos extendidos Fig. 5b). Estos hallazgos muestran que tanto IsrB como el andamio de ωRNA contribuyen sustancialmente al reconocimiento del heterodúplex guía-objetivo para la orientación del ADN.

El recuadro muestra la ubicación de los paneles ampliados. a, Reconocimiento heterodúplex por el pseudonudo adaptador. b, Reconocimiento heterodúplex por SL4, S4 y RECL. Los volúmenes de ARN y ADN se generan a partir de coordenadas atómicas, utilizando Chimera X. c, DtIsrB-ωRNA RNP reconstituido in vitro, corte de sustratos de dsDNA (con TTGA TAM) con DtIsrB de tipo salvaje (WT) o mutante. n = 3 réplicas técnicas independientes. ΔHNHL, mutante de IsrB en el que los residuos 161–174 se reemplazaron con un conector GSG. Δβ7, mutante de IsrB en el que se eliminaron los residuos 341–353. ΔPLMP, mutante de IsrB en el que se eliminaron los residuos 1–52. Para confirmar la estabilidad de la proteína de los mutantes de eliminación, verificamos la expresión de la proteína en el lisado bacteriano que sobreexpresa los mutantes de eliminación (Datos extendidos, Fig. 5b). d, Reconocimiento heterodúplex por HNHL. e, Reconocimiento del fosfato +1 (enlace fosfodiéster entre los nucleótidos dG1 y dA(-1) del ADN de la hebra diana) por el bucle de bloqueo de fosfato. f, Reconocimiento del tramo guía por parte de BH. g, reconocimiento de TAM por el dominio TI. h, especificidad TAM de DtIsrB. DtIsrB-ωRNA RNP reconstituido in vitro de sustratos de dsDNA (con TTGA/ATGA/TTGG/ATGG TAM) con WT o DtIsrB mutante. n = 3 réplicas técnicas independientes.

Anteriormente descubrimos que DtIsrB muestra una preferencia NTGA TAM4, pero dado que DtIsrB es una enzima termófila, repetimos el ensayo de identificación de TAM a 60 °C. A esta temperatura, observamos una preferencia TTGA TAM (Fig. 4b). Luego buscamos caracterizar esta preferencia estructuralmente. El dúplex que contiene TAM se une en la hendidura entre los dominios WED y TI, en la que los residuos en el dominio TI leen las nucleobases TAM en la cadena no objetivo (Figs. 1e y 3g). Aunque la nucleobase dT1* no contacta directamente con la proteína, el C5 de la nucleobase dT2* forma interacciones de van der Waals con el de dT1* y la porción alifática de la cadena lateral Arg323, consistente con la preferencia por la primera y la segunda T en el TAM. El O6 y N7 de dG3* interactúan con R323, en línea con la preferencia por la tercera G del TAM. El mutante R323A carecía de actividad de escisión, lo que respalda el papel de R323 en el reconocimiento de TAM (Fig. 3c). N6 y N7 de dA4* interactúan con Gln326, de acuerdo con la preferencia por la cuarta A en TAM. Para probar si Q326 reconoce el cuarto nucleótido TAM, mutamos este residuo a alanina y descubrimos que esta mutación abolió la escisión del objetivo (Fig. 3c). El IsrB de tipo salvaje mostró actividad de escisión en objetivos con TAM TTGA/ATGA, pero no con TAM TTGG/ATGG (Fig. 3h). Sin embargo, el mutante Q326R estaba activo con estos cuatro TAM. Estos resultados indican que Q326 reconoce el cuarto nucleótido en el TAM. En SpCas9, la preferencia de PAM se puede modificar a través de la alteración de las interacciones de enlace de hidrógeno entre el aminoácido en la posición 1335 (Arg en SpCas9 de tipo salvaje o Gln en SpCas9 variante VQR) y el tercer nucleótido de PAM (G o A, respectivamente)13,14. Análogamente, en IsrB, la preferencia de TAM puede modificarse mediante la alteración de las interacciones de enlaces de hidrógeno entre el aminoácido en la posición 326 y el cuarto nucleótido de TAM. Juntos, estos resultados indican que DtIsrB reconoce el TTGA TAM en la hebra no objetivo mediante una combinación de enlaces de hidrógeno e interacciones de van der Waals, e indican que la alteración de estas interacciones podría expandir la preferencia de TAM.

a, Árbol filogenético de ortólogos IsrB seleccionados. Se indican los tamaños de las proteínas, con los dominios resaltados en cuadros de colores y las secuencias conservadas en negro. Se indican los tamaños y grupos de ARN afines (Fig. 4d). b, secuencias de TAM para seis ortólogos de IsrB utilizando la escisión in vitro de una biblioteca de plásmidos que contiene TAM aleatorios y la secuencia objetivo. c, corte de IsrB-ωRNA RNP reconstituido in vitro de sustratos de dsDNA con cinco ortólogos de IsrB. Para CwIsrB, CsIsrB y K2IsrB, el ADN diana contenía un TTGA TAM. Para DsIsrB y BbIsrB, el ADN diana contenía un ATGG TAM. n = 3 réplicas técnicas independientes. d, Modelos estructurales de los andamios de ωRNA para seis ortólogos de IsrB basados ​​en predicciones de estructuras secundarias. Los andamios de ωRNA previstos se clasifican en grupos A (subgrupo A1, CsIsrB y K2IsrB; subgrupo A2, BbIsrB) y B (subgrupo B1, DtIsrB; subgrupo B2, CwIsrB y DsIsrB). En el grupo A, SL2 y SL4 forman pseudonudos, y SL5 y la región intermedia entre S2 y SL7 forman pseudonudos. Las regiones de conexión que difieren del grupo B están coloreadas de rosa. Se prevé que la región intermedia entre SL5 y S3, así como la región terminal después de SL7 ('sin motivo', gris) sean nucleótidos desapareados. En el grupo B, SL2 y SL5 forman pseudonudos, y SL4 y la región intermedia entre S2 y SL7 forman pseudonudos. Las regiones de conexión (rojas) son como en el grupo A. Se predice que la región intermedia entre SL5 y S3, así como la región terminal después de SL7, serán bucles de tallo (SL6 y SL8, gris). En los subgrupos A1 y B1, se predice que la región intermedia entre S2 y S3 será un bucle de tallo (SL3, gris oscuro), mientras que en los subgrupos A2 y B2, se predice que esa región serán nucleótidos no apareados ("sin motivo", gris oscuro ).

Para investigar el mecanismo de mella en el ADN de IsrB, identificamos el sitio mellado en el ADN mediante la secuenciación de Sanger. IsrB cortó la hebra no objetivo 8–11 nt aguas arriba del TAM (datos extendidos Fig. 6a), en contraste con Cas9s, que escinde la hebra no objetivo 2–5 nt aguas arriba del PAM15. Para imitar el producto mellado, agregamos 10 nt al extremo 5 'de la hebra no objetivo en la estructura del complejo IsrB truncado SL1 (Datos extendidos Fig. 6b). Observamos la densidad EM de la parte extendida de la hebra no objetivo, que está acoplada al dominio RuvC (Datos extendidos Fig. 6e). En las estructuras IsrB, las partes TAM y TAM-proximal de la hebra no objetivo se eliminan del dominio RuvC (Datos extendidos Fig. 6e,f), mientras que en la estructura SpCas9, la PAM-proximal parte de la cadena no objetivo Strand interactúa con los dominios RuvC y HNH 16 (Datos extendidos Fig. 6g). La diferencia conformacional entre las hebras no objetivo cargadas en los dominios RuvC explica la ubicación distinta del corte de ADN realizado por IsrB en comparación con el realizado por SpCas9.

Para evaluar la conservación de la estructura ternaria del ωRNA en los IsrB, identificamos cinco ortólogos (CwIsrB, IsrB de Crocosphaera watsonii; DsIsrB, IsrB de Dolichospermum sp.; CsIsrB, IsrB de Calditerricola satsumensis; BbIsrB, IsrB de la bacteria Burkholderiales; K2IsrB, IsrB descubierto de contig k249_576930 del ensamblaje del metagenoma viral) y sus ωRNA afines (Fig. 4a). Un ensayo de descubrimiento de TAM mostró que CwIsrB/K2IsrB/CsIsrB/DsIsrB reconocen un TAM NTG, mientras que BbIsrB reconoce un TAM NTGG (Fig. 4b). Confirmamos la funcionalidad de estos ωRNA y validamos las preferencias de TAM mediante un ensayo de escisión de ADN con el ADN objetivo que contiene el único TAM (Fig. 4c). Generamos modelos de estructura 3D de estos ortólogos de IsrB y los modelos de estructura bidimensional (2D) plegados de covarianza de sus ωRNA afines (Datos extendidos Fig. 7). El modelo 3D de proteína y el modelo 2D de ARN eran compatibles con las estructuras determinadas experimentalmente de DtIsrB y su afín ωRNA, lo que demuestra la confiabilidad general de la predicción estructural (Fig. 2a y Extended Data Fig. 7a,b). En la predicción de la estructura secundaria, los ωRNA de DtIsrB y los otros cinco ortólogos mantienen la composición del dominio central que consta de cuatro tallos (S1–4) y cinco bucles de tallo (SL1/2/4/5/7) (Fig. 4d y Extended Datos Fig. 7a). En la estructura crio-EM del ωRNA DtIsrB (DtRNA), SL3, SL6 y SL8 están ubicados en la periferia del andamio y no contribuyen a la formación del núcleo (Fig. 2b). El truncamiento de SL8 no afectó apreciablemente la actividad de escisión de DtIsrB, lo que indica que los ωRNA que carecen de este motivo admiten al menos la funcionalidad mínima de IsrB (Fig. 2d). En los ωRNA de CwIsrB y DsIsrB, se prevé que SL2 y SL5, así como SL4 y la región monocatenaria adyacente a SL7 formen dos estructuras de pseudonudo, consistentes con la estructura del DtRNA (Fig. 4d y Datos extendidos Fig. 7a) . Por el contrario, en los ωRNA de CsIsrB, K2IsrB y BbIsrB, se predice que SL2 y SL4, así como SL5 y la región monocatenaria adyacente a SL7, formarán dos estructuras de pseudonudo (Fig. 4d y Extended Data Fig. 7a). Esta mezcla de SL4-SL5 involucrada en la formación de pseudonudos se informó anteriormente4 y destaca la solidez estructural de los ωRNA, que mantienen estructuras similares en general a pesar de los reordenamientos estructurales. En conjunto, la funcionalidad demostrada de los ortólogos de IsrB y las similitudes estructurales predichas de los IsrB y sus ωRNA indican la generalidad del mecanismo de direccionamiento de ADN guiado por ωRNA sugerido por la presente estructura crio-EM.

Para rastrear la evolución del dominio de la proteína de IsrB a Cas9, comparamos la estructura de IsrB con la estructura de uno de los IscB más grandes conocidos (OgeuIscB)17, un pariente lejano de IsrB que contiene el dominio de nucleasa HNH, y la estructura predicha de YnpsCas9- 1 (un Cas9 de ramificación temprana del subtipo II-D de Ga0315277_10040887 que se encuentra entre los Cas9 más similares a IscB) 4 (Datos extendidos Fig. 8). Además de la ganancia del dominio HNH en IscB, también observamos grandes diferencias en otras regiones. Por ejemplo, el RECL en algunos, pero no en todos los clados de IscB, es más grande que la región enlazadora correspondiente en IsrB y se pliega en una estructura secundaria mínima, mientras que en YnpsCas9-1, se adquirió un gran dominio globular en la región REC. En otros Cas9, como SpCas9, este dominio es aún más grande y complejo. El dominio RuvC en OgeuIscB contiene algunos bucles más grandes, mientras que en YnpsCas9-1 contiene inserciones largas que parecen haber evolucionado hacia dominios altamente estructurados en otros Cas9, incluido SpCas9. Esta ampliación del dominio RuvC en Cas9 va acompañada de la pérdida del dominio PLMP. De manera similar, los dominios WED y TI tienen un tamaño mínimo en otros IsrB e IscB, excepto específicamente en OgeuIscB y otros IscB grandes en los que estos dominios se expanden. Los dominios WED y TI probablemente continuaron expandiéndose en las versiones globulares grandes que se encuentran en YnpsCas9-1 y SpCas9. SpCas9 alberga un dominio de interacción con PAM más grande que contiene una región globular adicional ubicada aguas abajo del dominio de interacción con PAM del núcleo común. La reducción del tamaño y la división del ωRNA en guías duales de RNA en Cas9 (por ejemplo, tracrRNA-crRNA) probablemente acompañó la adquisición del dominio REC y la ampliación general de todos los dominios de Cas9.

Para caracterizar con mayor detalle la minimización del ωRNA a medida que evolucionaba a cr/tracrRNA, comparamos la estructura del ωRNA DtIsrB (DtRNA) con la del ωRNA OgeuIscB (OgRNA), el RNA de guía única CjCas9 (CjRNA) y el sgRNA SpCas9 en sus Estados unidos a proteína/ADN diana (datos extendidos Fig. 9)16,17,18. Sobre la base de la topología, la ubicación y la estructura secundaria, mapeamos las características estructurales de DtRNA (S1–4 y SL1–8) en otras especies de ARN y nombramos motivos estructurales no identificados como motivos 1–5 (M1–5). Las estructuras de la región del tallo 5′ (S1 y SL1 en DtRNA) y la región del nexo (S2 en DtRNA) se conservan en las cuatro especies de RNA. La hebra ascendente de la región del tallo 5′ se reemplaza con crRNA en la transición evolutiva de OMEGA-IsrB/IscB a CRISPR-Cas9. Además, a medida que los ωRNA evolucionaron a tracrRNA, las hélices insertadas (S3/S4/SL4/SL5/SL6 en DtRNA) dentro de la región del nexo degeneraron, lo que contribuyó a la compactación y simplificación de la estructura del ARN. Los motivos SL4 de DtRNA y OgRNA forman pseudonudos de nexo que se conservan en ωRNA, mientras que algunos pares de bases en CjRNA M3 están bien superpuestos con esos pseudonudos de nexo. Un bucle de tallo incrustado en DtRNA 5'-región del tallo (SL2) se empareja con uno de los bucles de tallo incrustados en la región del nexo (SL5), formando un pseudonudo funcional (pseudonudo adaptador) que reconoce el ADN objetivo. Una base adyacente al pseudonudo adaptador (C198), forma varios contactos entre 3 y 5 Å con los restos de fosfato y desoxirribosa del ADN en la posición 6 (G6) y 7 (T7) (Fig. 3a), lo que confiere una adaptación única en que el andamio de ωRNA puede reconocer el dúplex de ARN-ADN. El pseudonudo del adaptador se conserva en los ωRNA de IsrB, pero se degenera en la transición a los ωRNA de IscB y los tracrRNA de Cas9, un cambio que se correlaciona con la expansión de la región REC y es probablemente compensado por ella.

También buscamos comprender mejor los cambios mecánicos asociados con las adquisiciones de dominio en IsrB y Cas9 durante su evolución desde el ancestro compacto similar a RuvC. Con este fin, comparamos las estructuras unidas al objetivo de Thermus thermophilus RuvC (TtRuvC), IsrB, CjCas9 y SpCas9 (Fig. 5). A medida que las proteínas que contienen el dominio RuvC evolucionaron para interactuar con los ωRNA, adquirieron los dominios TI/PI, PLMP y BH. En las estructuras tanto de IsrB como de Cas9, los dominios RuvC, WED, TI/PI y BH, así como el bucle de bloqueo de fosfato forman un núcleo funcional con configuraciones similares; el heterodúplex guía-objetivo y el dúplex TAM/PAM están unidos a este núcleo en una posición y orientación similares. El dominio TI/PI reconoce las nucleobases TAM/PAM, probablemente funcionando como cebador para el desenrollado del ADN diana y la formación de heterodúplex, con la ayuda del bucle de bloqueo de fosfato, BH y ωRNA/gRNA. Aunque IsrB y Cas9 comparten dominios RuvC y BH homólogos, IsrB (así como IscB) contiene únicamente el dominio PLMP, que interactúa directamente con RuvC I. El examen de la estructura de IsrB revela además un papel del dominio PLMP en la estabilización de la base del horquilla terminal del ωRNA y en contacto con la secuencia Shine-Dalgarno. Además, IsrB contiene solo regiones RECL y HNHL mínimas (17 y 19 aminoácidos, respectivamente, en DtIsrB), y es probable que desempeñen funciones diferentes en la orientación del ADN de las realizadas por el lóbulo REC más grande y el dominio HNH en Cas9 (por ejemplo, 625 y 135 aminoácidos, respectivamente, en SpCas9). En SpCas9, el lóbulo REC sondea el ADN diana a través de interacciones con el heterodúplex, activa la nucleasa RuvC unida al ADN a través de la comunicación con el dominio HNH y facilita la formación del bucle R19,20,21. Sin embargo, en IsrB, esta comunicación entre dominios probablemente se ve favorecida por el ωRNA tanto a través de las interacciones de la columna vertebral como de la base porque RECL y HNHL son comparativamente pequeños.

Determinantes estructurales de la evolución de las nucleasas RuvC ancestrales a IsrB y luego a Cas9. Se muestran ejemplos de descendientes modernos (existentes) de cada familia que comienzan con T. thermophilus RuvC (TtRuvC, PDB 6S16), DtIsrB, CjCas9 (PDB 5X2G) y SpCas9 (PDB 7S4X). Se muestran etapas críticas en el proceso evolutivo propuesto, incluyendo las inserciones de los dominios TI, PLMP y BH, la interacción con ωRNA, la inserción del dominio HNH, la pérdida del dominio PLMP y el reemplazo de varias partes del ωRNA con regiones REC (dominio los reemplazos se muestran con una clave de color). La porción de REC2 en CjCas9 y SpCas9 que reemplaza a SL2 en el ωRNA DtIsrB está coloreada en gris oscuro. El emparejamiento de bases conectadas se muestra solo para el dúplex guía-ADN. Se muestra el emparejamiento de bases desconectado para el pseudonudo del adaptador de ωRNA para resaltar su posición cerca del dúplex de ARN-ADN.

El ωRNA comparativamente grande (aproximadamente 300 nt en comparación con el sgRNA de 100 nt utilizado por Cas9) parece contribuir a la conexión entre la orientación del ADN y las actividades de corte, compensando las pequeñas regiones RECL y HNHL (datos extendidos Fig. 10). En la arquitectura de ARNω multicapa, las hélices de ARN de capa superior (S2/S3/S4/SL2/SL4/SL5), que forman una red de interacción para el reconocimiento heterodúplex impulsado por ARNω, están asociadas con las hélices de ARN de capa inferior (SL7/ SL8) e interactúa ampliamente con el módulo de mellado (dominios PLMP/RuvC/TI) mediante las interacciones de pseudonudos de nexo entre S2, SL4 y SL7. Dado que las mutaciones en el pseudonudo del adaptador en el ωRNA abolieron la actividad de corte de IsrB (Fig. 2d), aunque el pseudonudo está distante del ADN objetivo, los motivos estructurales del ωRNA podrían ser importantes para la regulación alostérica de la detección del ADN por el ωRNA/ RECL y corte de ADN por el dominio de la nucleasa RuvC, lo que proporciona una vía para integrar otras formas de regulación. Este mecanismo de regulación alostérico impulsado por ωRNA está respaldado por la alta carga superficial general y el área a través de la cual IsrB entra en contacto con ωRNA. Otros ARN no codificantes funcionales grandes (aproximadamente de 400 a 900 nt), como el intrón del grupo I, el intrón del grupo II y la ribonucleasa P, tienen estructuras ternarias complejas y sus regiones periféricas pueden controlar sus núcleos catalíticos centrales mediante mecanismos alostéricos22,23,24 ,25. Los estudios estructurales futuros de IsrB en otras conformaciones, como el complejo de bucle R de IsrB catalíticamente activo, abordarán esta hipótesis y profundizarán nuestra comprensión mecánica de los sistemas OMEGA.

El gen que codifica DtIsrB de longitud completa (residuos 1–353) se optimizó por codones, se sintetizó (Twist Bioscience) y se clonó en un vector pC013 modificado (Addgene Plasmid no. 90097). La región de codificación de DtIsrB consta de His6-Twinstrep-tag, SUMO-tag, DtIsrB y GFP-tag. El DtIsrB de tipo salvaje se expresó a 18 °C en células de Escherichia coli Rosetta (DE3) pLysS (Novagen). E. coli se cultivó a 37 °C en medio Luria-Bertani (que contenía 100 mg l-1 de ampicilina) hasta que la DO600 alcanzó 0,5, y luego se indujo la expresión de proteínas mediante la adición de isopropil-β-d-tiogalactopiranósido 0,1 mM y se incubó. a 18 °C durante 20 h. Las células de E. coli se resuspendieron en tampón A (Tris-HCl 50 mM, pH 8,0, imidazol 20 mM y NaCl 1 M), se lisaron mediante sonicación y luego se centrifugaron. El sobrenadante se mezcló con Ni-NTA Agarosa (Qiagen). La columna unida a proteínas se lavó con tampón A, tampón B (Tris-HCl 50 mM, pH 8,0, imidazol 20 mM y NaCl 0,3 M) y tampón C (Tris-HCl 50 mM, pH 8,0, imidazol 0,3 M y NaCl 0,3 M). NaCl). La proteína se eluyó con tampón D (Tris-HCl 50 mM, pH 8,0, imidazol 0,3 M y NaCl 1 M). El ωRNA afín de DtIsrB se transcribió in vitro con T7 RNA polimerasa, usando una plantilla de DNA amplificada por PCR y el kit HiScribe T7 Quick High Yield RNA Synthesis (NEB). La plantilla consiste en el promotor T7 (TAATACGACTCACTATAGG), la guía (GCCTTATTAAATGACTTCTC) (residuos 1 a 20) y el andamiaje de ωRNA (residuos 21 a 282). El ARN transcrito se purificó utilizando un kit RNeasy (Qiagen) según las instrucciones del fabricante. Las cadenas de ADN diana y no diana (GATCAGCTCAAGAGAAGTCATTTAATAAGGC y TTGAGCTGAT, respectivamente) se adquirieron de GENEWIZ. Para la reconstitución del complejo A, la proteína DtIsrB purificada se mezcló con el ωRNA, la cadena de ADN objetivo y la cadena de ADN no objetivo (TTGA TAM) (proporción molar, 2,3:1:7:7) en tampón E (10 Tris-HCl mM, pH 8,0 y NaCl 50 mM, MgCl2 5 mM) y se incubaron a 37 °C durante 15 min. El complejo A se purificó mediante cromatografía de filtración en gel en una columna Superose 6 Increment 10/300 (Cytiva) equilibrada con tampón F (HEPES-NaOH 20 mM, pH 7,0 y NaCl 50 mM, MgCl2 5 mM). El complejo A (concentración final: 0,1 mg ml−1) se incubó con BS3 (concentración final: 0,5 mM) a 4 °C durante 2 h. Para la reconstitución del complejo B, se insertó la proteína lambda N (MDAQTRRRERRAEKQAQWKAAN) entre DtIsrB y GFP-tag. Los residuos 34–67 del armazón de ωRNA (residuos 21–282) fueron reemplazados por un enlazador GAAA. El ARN boxB fusionado con el conector GAAA (GAAAGCCCUGAAGAAGGGC) (residuos 283–302) se agregó al extremo 3 'del andamio de ωRNA. Se usó la misma cadena de ADN diana para esta reconstitución. La cadena de ADN no diana extendida en 5' (TACTGAAGAGTTGAGCTGAT) se adquirió de GENEWIZ. La proteína DtIsrB purificada se mezcló con el ωRNA, la cadena de ADN diana y la cadena de ADN no diana (TTGA TAM) (relación molar, 2,3:1:1,5:1,5) en tampón G (Tris-HCl 10 mM, pH 8,0 y NaCl 50 mM) y se incubaron a 37 °C durante 15 min. El complejo B se purificó mediante la columna de exclusión del mismo tamaño equilibrada con tampón G. Para la preparación de la rejilla, se aplicaron soluciones purificadas de complejo A y B (0,1 mg ml−1, 3 µl) a UltrAuFoil 300 mesh R1.2 recién descargado luminiscente. /1.3 grillas (Quantifoil) en un Vitrobot Mark IV (FEI) a 4 °C con un tiempo de espera de 0 y 10 s y un tiempo de secado de 2 y 4 s bajo 95% de humedad, respectivamente.

Los datos crio-EM para el complejo A se recopilaron en el Campus de Investigación Janelia del HHMI utilizando un microscopio Titan Krios G2 (Thermo), operado a 300 kV y equipado con un filtro de energía Gatan Bioquantum (Gatan) y un detector de electrones directos K3 de postfiltro (Gatan) en el modo de conteo de electrones. Cada video se grabó con un aumento nominal de ×105 000, lo que corresponde a 0,839 Å por píxel físico (0,4195 Å por píxel de superresolución) con una exposición de electrones de 12,075 electrones por Å2 por segundo y un tiempo de exposición total de 5,0 s, lo que da como resultado una exposición acumulada de 60 e−/Å2. Luego, se recopilaron 50 cuadros por video a 1,2 e-/Å2 de dosis por cuadro para un total de 60 e-/Å2 de dosis por video. El rango de desenfoque nominal se fijó en -0,8 a -2,2 µm. La recolección de datos automatizada se llevó a cabo utilizando scripts en SerialEM. Para cada posición del escenario, se utilizó el cambio de imagen para recopilar datos de nueve hoyos con dos adquisiciones de video por hoyo. Se calibró la inclinación del haz inducida por el cambio de imagen y se aplicó la corrección de la inclinación del haz durante la recopilación de datos. Los datos de Cryo-EM para el complejo B se recopilaron en MIT.nano utilizando un microscopio Talos Arctica G2 (FEI), operado a 200 kV y equipado con un detector de electrones directo Falcon 3EC (Thermo) en el modo lineal. Cada video se grabó con un aumento nominal de ×120 000, correspondiente a un tamaño de píxel calibrado de 1,2550 Å con una exposición de electrones de 24,54 e-/pix s-1 durante 3,99 s, lo que da como resultado una exposición acumulada de 62,53 e-/Å2. A continuación, se recopilaron 20 fotogramas por vídeo a 3,1265 e-/Å2 de dosis por fotograma para un total de 62,53 e-/Å2 de dosis por vídeo. El rango de desenfoque nominal se fijó en −2,6 a −1,0 µm. La recolección de datos automatizada se llevó a cabo utilizando el software EPU (Thermo). Para cada posición del escenario, se utilizó el cambio de imagen para recopilar datos de nueve hoyos. Para obtener la reconstrucción 3D del complejo A, los datos se procesaron utilizando RELION-4.0 (ref. 26). Los cuadros de video se alinearon en parches de 5 × 5 y se ponderaron en dosis en MotionCor2 (ref. 27). Los parámetros de desenfoque se estimaron mediante CTFFIND-4.1 (ref. 28). De las 4142 micrografías preprocesadas, se recogieron 1 626 574 partículas mediante la selección automática basada en TOPAZ29 y se extrajeron en 3,146 Å píxel−1. Las 107 066 partículas seleccionadas se volvieron a extraer en 1,144 Å píxel−1 ​​y se sometieron a una ronda de refinamiento 3D y clasificación 3D sin alineación. Las 58.188 partículas seleccionadas se sometieron a una estimación de desenfoque por partícula y pulido bayesiano. Para el refinamiento de la inclinación del haz, el grupo óptico de cada micrografía se establece en función de la posición de su orificio desde el escenario. Las partículas pulidas se sometieron a refinamiento 3D y produjeron un mapa con una resolución global de 3,10 Å según el criterio de correlación de la capa de Fourier de 0,143. Para obtener la reconstrucción 3D del complejo B, los datos se procesaron utilizando los mismos programas. De las 2542 micrografías ponderadas por dosis y con corrección de movimiento, se recogieron 1 595 800 partículas mediante la selección automática basada en TOPAZ y se extrajeron en 3,138 Å píxel−1. Estas partículas se sometieron a varias rondas de clasificaciones en 2D y 3D. Las 50.661 partículas seleccionadas se volvieron a extraer en 1,255 Å píxel−1 ​​y se sometieron a un refinamiento homogéneo mediante cryoSPARC30, lo que produjo un mapa con una resolución global de 6,85 Å según el criterio de correlación de la capa de Fourier de 0,143.

El modelo de proteína inicial se generó usando AlphaFold2 (ref. 31) bajo el marco ColabFold usando parámetros predeterminados y MMseqs2 para buscar homólogos en la base de datos ColabFold32, y se modificó manualmente usando COOT33 e ISOLDE7 contra el mapa de densidad del complejo A. El ácido nucleico inicial El modelo se construyó con auto-DRRAFTER utilizando el mapa de densidad del complejo A y el modelo de estructura secundaria basado en covarianza de ωRNA8. Las estructuras secundarias de ωRNA (consulta) se predijeron mediante cmsearch34 con la opción –max para identificar el modelo de covarianza de ωRNA de IscB/IsrB con la puntuación más alta de un estudio anterior4. Para obtener el mejor modelo, a las regiones de consulta que se alineaban con el modelo se les asignaron estructuras secundarias a partir de las predicciones del modelo. Las estructuras secundarias de bucle de tallo que se encontraron erróneamente asignadas a pares de bases con una de las identidades de base igualando un carácter de espacio fueron reasignadas para no tener estructura secundaria. Las estructuras secundarias para las regiones de consulta sin cobertura (≥8 pb sin coincidencia con el mejor modelo de covarianza), excepto la región de baja conservación en el extremo 3 'más allá del nexo, se predijeron luego usando mfold35. Los pseudonudos se asignaron manualmente mediante la identificación de pares de bases coincidentes en las ubicaciones de pseudonudos esperadas para el tipo de ωRNA dado. Las coordenadas de ωRNA se modelaron con auto-DRRAFTER a partir de una versión ligeramente modificada del modelo de estructura secundaria basado en covarianza en el que se eliminaron todos los pares de bases no canónicos y la mayoría de las hélices que constaban de un solo par de bases. La notación de paréntesis de puntos para esta estructura secundaria se proporciona a continuación:

.((((((((((((((((((((.((.(((((((((...)(((((((. ...))))))))...)))))))))).((((((({..{)))))))........ )).))))..(((.((((((....)))))))....(((((((((((..... (((..((((((...[[[[[.))))))).....)))((((...}..}... .))))..(((.((......)).)))..))))))))))))...)))..]]] ]]......((((....)))).(((...)))..<<<<<<<<<<)))))) ))))))))))))))>>>>>>>>>>

Todos los nucleótidos de ADN se modelaron como ARN porque auto-DRRAFTER no puede modelar nucleótidos de ADN. La guía/armazón de ARNω/ADN objetivo/ADN no objetivo se asignaron a los residuos 1–20/21–282/283–313/314–323, respectivamente. La secuencia de ARN completa utilizada para el modelado se proporciona a continuación:

ggccuuauuaaaugacuucucgucaaccaccccugacugaagucagaggcuugcuucuggccugaguugggggcccgguuuggcggggccgggggcaacuggcugaccaggcggcccgguucgccgggcaggggguccgcggggcuaccaaggacuuccggguguuucgccagcccggacuaucuccggcagaaccgcucaaugccgcggccggccaagaccggccuaagcc cugcggacagcgccgaggcgacaaucacuccgaaaggaggccguguaucggcgaucagcucaagagaagucauuuaauaaggcuugagcugau

El modelado Auto-DRRAFTER se realizó en ausencia de coordenadas de proteínas utilizando el mapa de densidad con las regiones correspondientes a la densidad de proteínas eliminadas. Todas las rondas iniciales de modelado se realizaron en un mapa de densidad de resolución preliminar de 4,3 Å. El modelado se configuró manualmente ajustando hélices correspondientes a los residuos W:1–14 W:41–48 W:53–60 W:258–269 W:271–281 X:2–11 X:18-31 Y:1 -10 en el mapa de densidad. En la segunda ronda de modelado automático DRRAFTER, se permitió que la hélice correspondiente a los residuos W:41–48 y W:53–60 se moviera desde su ubicación inicial. Se realizaron cinco rondas de modelado, seguidas de una ronda final de modelado. Para cada ronda, se construyeron entre 2.000 y 6.000 modelos. ISOLDE y Phenix6 seleccionaron uno de los diez mejores modelos de puntuación para un mayor refinamiento, junto con el modelo de proteínas, para optimizar la geometría y mejorar el ajuste a la densidad crio-EM. Después de inspeccionar el modelo optimizado y la estructura secundaria basada en la covarianza, se realizaron dos rondas más de modelado automático DRRAFTER, incluida una ronda final, en las que el emparejamiento de bases para el pseudonudo adaptador se modificó ligeramente para que los residuos 81–84 y 194–197 se emparejaron en lugar de los residuos 81–84 y 193–196. Para este modelado adicional, solo se reconstruyeron los residuos W:73–99 y W:186–206; todos los demás residuos permanecieron fijos. Se realizó una ronda final más de modelado utilizando el mapa de densidad de resolución de 3,1 Å filtrado de paso bajo a 4 Å. La convergencia final de estos modelos (desviación cuadrática media por pares entre modelos) es de 4,1 Å. Se ha demostrado previamente que los valores de convergencia de Auto-DRRAFTER predicen la precisión del modelo. Usando una relación lineal previamente determinada entre la convergencia y la precisión del modelo (precisión de 0,61 × convergencia + 2,4 Å), la precisión estimada de estos modelos iniciales generados computacionalmente es de 4,9 Å. Para mejorar aún más la precisión, uno de estos modelos se refinó con COOT, ISOLDE y Phenix junto con la proteína para producir el modelo final del complejo de ADN objetivo IsrB-ωRNA. El modelo final (que carece de residuos de proteína 1–5/211–224/348–353, residuos de ARN 1–2/37–64/119–122/212–219/263–265 y residuos de ADN diana 1/30–31, que se resolvieron mal y se omitieron del modelo final) fue evaluado por MolProbity36 y Q-score37. Los gráficos moleculares y las cifras de densidad EM se prepararon con CueMol (http://www.cuemol.org), PyMOL (https://pymol.org/2/), UCSF Chimera (https://www.cgl.ucsf.edu /quimera/) o Quimera X (https://www.cgl.ucsf.edu/chimerax/).

Las plantillas de proteína IsrB y ωRNA se prepararon para un sistema de expresión de transcripción/traducción in vitro. La plantilla de proteína IsrB consta del promotor T7 y las secuencias de iniciación de la traducción (GCGAATTAATACGACTCACTATAGGGCTTAAGTATAAGGAGGAAAAAATATG), la secuencia ORF de IsrB y la secuencia terminadora T7 (CTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG). La plantilla de ωRNA consta de la secuencia del promotor T7 (GGAAATTAATACGACTCACTATAGG) y la secuencia de ωRNA. Las plantillas de proteína IsrB y ωRNA se incluyeron en el vector pC013 modificado (Addgene Plasmid no. 90097) y el vector pCOLADuet-1. Las mutaciones en la proteína IsrB y el ωRNA se introdujeron mediante un método basado en PCR y las secuencias se confirmaron mediante secuenciación de ADN. El amplicón de PCR de 320 pb (30 ng), que contiene la secuencia diana de 20 nt y el TAM y se marcó con fluorescencia mediante 5′ IRDye 700 (IDT), se incubó con la plantilla de proteína IsrB (50 ng) y el ωRNA plantilla (125 ng) en 12,5 μl de tampón de reacción, que contiene 5 μl de Solución A y 3,75 μl de Solución B de PURExpress In vitro Protein Synthesis Kit (NEB). Las condiciones de reacción se optimizaron como sigue. Fig. 2d, 3 h: 2 h a 37 °C, 1 h a 60 °C; Fig. 3c, 2,1 h: 2 h a 37 °C, 5 min a 60 °C; Fig. 3h, 3 h: 2 h a 37 °C, 1 h a 60 °C; Fig. 4c (CwIsrB, DsIsrB y BbIsrB), 6 h a 37 °C; Fig. 4c (CsIsrB), 6 h: 2 h a 37 °C, 4 h a 60 °C; Fig. 4c (K2IsrB) y 2 h a 37 °C. DtIsrB se deriva de un organismo termofílico, D. thermocuniculi, que crece a 60–80 °C (ref. 38). La reacción se detuvo mediante la adición de 3 µg de RNasa A (Qiagen) y 0,24 unidades de Proteinasa K (NEB). Los productos de reacción se purificaron con un gel Wizard SV y un sistema de limpieza de PCR (Promega), se resolvieron en un gel de urea TBE al 10 % Novex (Invitrogen) y luego se visualizaron con un sistema de imágenes ChemiDoc (Bio-Rad). Para examinar la estabilidad de la proteína de los mutantes de deleción, se produjeron proteínas IsrB en el sistema de expresión bacteriano utilizado en la preparación de la muestra crio-EM. Las células de E. coli se resuspendieron en tampón A (Tris-HCl 50 mM, pH 8,0, imidazol 20 mM y NaCl 1 M), se lisaron mediante sonicación y luego se centrifugaron. El sobrenadante se mezcló con perlas MagneHis (Promega). La columna unida a proteína se lavó con tampón A. La proteína se eluyó con tampón B (Tris-HCl 50 mM, pH 8,0, imidazol 0,3 M y NaCl 1 M) y se analizó mediante SDS-PAGE (datos extendidos, Fig. 5b). Para determinar los sitios de escisión del ADN de IsrB, el amplicón de PCR de 816 pb (400 ng) que contenía la secuencia objetivo de 20 nt (GCCTTATTAACCTCAGCCTC) y el TAM se incubaron con la plantilla de proteína IsrB (100 ng) y la plantilla de ωRNA (125 ng ) en 25 μl de tampón de reacción, que contiene 10 μl de Solución A y 7,5 μl de Solución B de PURExpress In vitro Protein Synthesis Kit. Después de purificar el producto de reacción, el producto mellado se escindió usando Nb.BbvCI (NEB). Los productos escindidos se extrajeron en gel, se purificaron y analizaron mediante secuenciación de ADN (GENEWIZ).

Se seleccionaron IsrB representativos con residuos intactos del sitio catalítico activo de RuvC y sin signos de truncamiento de entre los tres clados principales de IsrB identificados en un estudio anterior4, correspondientes a IsrB con ωRNA de tipo G1b, G1c y G1h. Los ωRNA correspondientes a cada IsrB se tomaron de las predicciones en un estudio previo4 y se modificaron de manera que el final del ωRNA ocurriera al comienzo del IsrB. Luego, los IsrB se descartaron si la estructura secundaria del ωRNA correspondiente, según lo determinado por mfold, no contenía los bucles de tallo conservados y los pseudonudos (identificados manualmente) que se encuentran en la estructura secundaria del ωRNA basada en la covarianza para el tipo de ωRNA dado35. El análisis nominó las secuencias CwIsrB, CsIsrB, DsIsrB, BbIsrB, K2IsrB y los ωRNA correspondientes. La estructura secundaria basada en la covarianza y las predicciones de pseudonudo se determinaron para los ωRNA correspondientes como se describe para el DtRNA. Luego, todos los ωRNA se visualizaron usando forna39.

Para el análisis del dominio PLMP, se buscó el dominio DtIsrB PLMP en HHPred para homólogos remotos, identificando IF-3 como un homólogo remoto putativo. Las secuencias representativas que contenían regiones IF-3-N-terminal y dominios PLMP de la familia IscB/IsrB se obtuvieron de UniProt y el Centro Nacional de Información Biotecnológica y se alinearon utilizando MAFFT-einsi. Los representantes estructurales se alinearon y superpusieron utilizando la superfunción pymol.

El ensayo de identificación de TAM se realizó utilizando una biblioteca de TAM, preparada como se describió anteriormente4. Los oligonucleótidos de ADN monocatenario (IDT), que contienen ocho nucleótidos aleatorizados aguas abajo de una secuencia diana de 20 nt (GCCTTATTAACCTCAGCCTC), se convirtieron en dsDNA mediante relleno con PrimeSTAR Max DNA Polymerase (Takara) y se clonaron en pUC19 mediante clonación Gibson (NEB ) para generar una biblioteca TAM. La biblioteca (25 ng) se digirió usando un sistema de expresión de transcripción/traducción in vitro que contenía las plantillas de proteína IsrB (50 ng) y ωRNA (125 ng), como se describe en la sección de experimentos de escisión in vitro. Las reacciones de CwIsrB, DsIsrB, CsIsrB, BbIsrB y K2IsrB se incubaron durante 4 h: 2 h a 37 °C, 1 h a 50 °C y 1 h a 60 °C. La reacción de DtIsrB se incubó durante 3 h: 2 h a 37 °C y 1 h a 60 °C. Luego se detuvo mediante la adición de 3 µg de RNasa A (Qiagen) y 0,24 unidades de Proteinasa K (NEB). Los productos de reacción se purificaron usando un gel Wizard SV y PCR Clean-Up System (Promega), y se digirieron usando Nb.BbvCI (NEB). Los productos de reacción purificados se sometieron a marcaje de extremos y ligadura de adaptadores utilizando un módulo de reparación de extremos/dA-Tailing NEBNext Ultra II (NEB), un kit de preparación de bibliotecas de ADN NEBNext Ultra II para Illumina (NEB) y un adaptador NEBNext para Illumina (NEB) . El ADN digerido y purificado con la enzima USER (NEB) se amplificó con una PCR de 12 ciclos utilizando un cebador específico para la columna vertebral de la biblioteca TAM y un cebador específico para el adaptador NEBNext, y con una PCR de 18 ciclos posterior para agregar Illumina i5 adaptador. Para normalizar la distribución de las secuencias flanqueantes degeneradas 8N, el plásmido de la biblioteca se amplificó con una PCR de 12 ciclos utilizando cebadores específicos para la columna vertebral de la biblioteca y con una PCR de 18 ciclos posterior para agregar el adaptador Illumina i5. Las bibliotecas amplificadas se aislaron en geles E de agarosa al 2 % (Invitrogen) y se secuenciaron en un secuenciador MiSeq (Illumina). Los datos de la secuencia resultante se analizaron extrayendo las regiones TAM de seis nucleótidos, contando los TAM individuales y normalizando el TAM a las lecturas totales de cada muestra. Los motivos de secuencia se generaron utilizando los TAM seleccionados en la fracción de mayor puntuación con el script de Python personalizado utilizado en nuestro informe anterior4.

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de investigación de Nature vinculado a este artículo.

Las coordenadas atómicas de la estructura ternaria de IsrB se han depositado en Protein Data Bank (PDB) en http://www.pdb.org (PDB 8DMB). Las reconstrucciones crio-EM tridimensionales del complejo A y el complejo B se han depositado en el Banco de datos de microscopía electrónica (complejo A EMD27533; complejo B EMD26723).

Zhang, F. Desarrollo de sistemas CRISPR-Cas para la edición del genoma y más allá. Q. Rev. Biophys. 52, e6–e6 (2019).

Artículo ANUNCIOS Google Académico

Doudna, JA La promesa y el desafío de la edición terapéutica del genoma. Naturaleza 578, 229–236 (2020).

Artículo ADS CAS Google Académico

Nishimasu, H. & Nureki, O. Estructuras y mecanismos de nucleasas efectoras guiadas por ARN CRISPR. actual Opinión Estructura. Biol. 43, 68–78 (2017).

Artículo CAS Google Académico

Altae-Tran, H. et al. La extensa familia de transposones IS200/IS605 codifica diversas endonucleasas guiadas por ARN programables. Ciencia 374, 57–65 (2021).

Artículo ADS CAS Google Académico

Kapitonov, VV, Makarova, KS & Koonin, EV ISC, un grupo novedoso de transposones de ADN bacterianos y arqueales que codifican homólogos Cas9. J. Bacteriol. 198, 797–807 (2015).

Artículo Google Académico

Afonine, PV et al. Refinamiento del espacio real en PHENIX para crio-EM y cristalografía. Acta Crystallogr. Secta. D., Estructura. Biol. 74, 531–544 (2018).

Artículo CAS Google Académico

Croll, TI ISOLDE: un entorno físicamente realista para la construcción de modelos en mapas de densidad electrónica de baja resolución. Acta Crystallogr. Secta. D., Estructura. Biol. 74, 519–530 (2018).

Artículo CAS Google Académico

Kappel, K. et al. Determinación acelerada guiada por crio-EM de estructuras tridimensionales solo de ARN. Nat. Métodos 17, 699–707 (2020).

Artículo CAS Google Académico

Briner, AE et al. Los módulos funcionales de ARN guía dirigen la actividad Cas9 y la ortogonalidad. mol. Celda 56, 333–339 (2014).

Artículo CAS Google Académico

Él, S. et al. La familia IS200/IS605 y el mecanismo de transposición monocatenario 'pelar y pegar'. Espectro de microbiología. https://doi.org/10.1128/microbiolspec.MDNA3-0039-2014 (2015).

Juneau, K., Podell, E., Harrington, DJ & Cech, TR Base estructural de la estabilidad mejorada de un dominio de ribozima mutante y una vista detallada de las interacciones ARN-disolvente. Estructura 9, 221–231 (2001).

Artículo CAS Google Académico

Jiang , F. , Zhou , K. , Ma , L. , Gressel , S. & Doudna , JA Un complejo de ARN guía Cas9 preorganizado para el reconocimiento del ADN objetivo . Ciencia 348, 1477–1481.

Artículo ADS CAS Google Académico

Hirano, S., Nishimasu, H., Ishitani, R. & Nureki, O. Base estructural para las especificidades alteradas de PAM de CRISPR–Cas9 diseñado. mol. Celda 61, 886–894 (2016).

Artículo CAS Google Académico

Kleinstiver, BP et al. Nucleasas CRISPR-Cas9 diseñadas con especificidades PAM alteradas. Naturaleza 523, 481–485 (2015).

Artículo ANUNCIOS Google Académico

Ran, FA et al. Edición del genoma in vivo utilizando Staphylococcus aureus Cas9. Naturaleza 520, 186–191 (2015).

Artículo ADS CAS Google Académico

Bravo, JPK et al. Base estructural para la vigilancia de desajustes por CRISPR-Cas9. Naturaleza 603, 343–347 (2022).

Artículo ADS CAS Google Académico

Schuler, G., Hu, C. & Ke, A. Base estructural para la escisión de ADN guiada por ARN por IscB-ωRNA y comparación mecánica con Cas9. Ciencia 376, 1476–1481 (2022).

Artículo ADS CAS Google Académico

Yamada, M. et al. La estructura cristalina del Cas9 mínimo de Campylobacter jejuni revela la diversidad molecular en los sistemas CRISPR-Cas9. mol. Celda 65, 1109–1121.e3 (2017).

Artículo CAS Google Académico

Chen, JS et al. La corrección de pruebas mejorada rige la precisión de orientación de CRISPR-Cas9. Naturaleza 550, 407–410 (2017).

Artículo ADS CAS Google Académico

Sternberg, SH, LaFrance, B., Kaplan, M. y Doudna, JA Control conformacional de la escisión del objetivo del ADN mediante CRISPR-Cas9. Naturaleza 527, 110–113 (2015).

Artículo ADS CAS Google Académico

Pacesa, M. et al. R-loop formación y mecanismos de activación conformacional de Cas9. Naturaleza 609, 191–196 (2022).

Haack, DB et al. Estructuras crio-EM de un intrón del grupo II empalme inverso en ADN. Celda 178, 612–623.e12 (2019).

Artículo CAS Google Académico

Reiter, NJ y col. Estructura de una holoenzima ribonucleasa P bacteriana en complejo con ARNt. Naturaleza 468, 784–789 (2010).

Artículo ADS CAS Google Académico

Su, Z. et al. Estructuras crio-EM de ribozima Tetrahymena de longitud completa con una resolución de 3,1 Å. Naturaleza 596, 603–607 (2021).

Artículo ADS CAS Google Académico

Weinberg, Z., Perreault, J., Meyer, MM & Breaker, RR ARN no codificantes estructurados excepcionales revelados por análisis de metagenoma bacteriano. Naturaleza 462, 656–659 (2009).

Artículo ADS CAS Google Académico

Kimanius, D., Dong, L., Sharov, G., Nakane, T. y Scheres, SHW Nuevas herramientas para el análisis automatizado de partículas individuales crio-EM en RELION-4.0. Bioquímica J 478, 4169–4185 (2021).

Artículo CAS Google Académico

Zheng, SQ et al. MotionCor2: corrección anisotrópica del movimiento inducido por haz para mejorar la microscopía crioelectrónica. Nat. Métodos 14, 331–332 (2017).

Artículo CAS Google Académico

Rohou, A. & Grigorieff, N. CTFFIND4: estimación de desenfoque rápida y precisa a partir de micrografías electrónicas. J. Estructura. Biol. 192, 216–221 (2015).

Artículo Google Académico

Bepler, T. et al. Redes neuronales convolucionales sin etiqueta positiva para la recolección de partículas en micrografías crioelectrónicas. Nat. Métodos 16, 1153–1160 (2019).

Artículo CAS Google Académico

Punjani, A., Rubinstein, JL, Fleet, DJ y Brubaker, MA cryoSPARC: algoritmos para la determinación rápida de estructuras crio-EM sin supervisión. Nat. Métodos 14, 290–296 (2017).

Artículo CAS Google Académico

Jumper, J. et al. Predicción de estructura de proteínas de alta precisión con AlphaFold. Naturaleza 596, 583–589 (2021).

Artículo ADS CAS Google Académico

Mirdita, M., et al. ColabFold: hacer que el plegamiento de proteínas sea accesible para todos. Nat. Métodos 19, 679–682 (2022).

Emsley, P., Lohkamp, ​​B., Scott, WG y Cowtan, K. Características y desarrollo de Focha. Acta Crystallogr. D., Biol. cristalogr. 66, 486–501 (2010).

Artículo CAS Google Académico

Nawrocki, EP & Eddy, SR Infernal 1.1: búsquedas de homología de ARN 100 veces más rápidas. Bioinformática 29, 2933–2935 (2013).

Artículo CAS Google Académico

Zuker, M. Servidor web Mfold para el plegamiento de ácidos nucleicos y la predicción de hibridación. Ácidos Nucleicos Res. 31, 3406–3415 (2003).

Artículo CAS Google Académico

Williams, CJ et al. MolProbity: más y mejores datos de referencia para una mejor validación de la estructura de todos los átomos. Ciencia de las proteínas 27, 293–315 (2018).

Artículo CAS Google Académico

Pintilie, G. et al. Medición de la resolución de átomos en mapas crio-EM con puntajes Q. Nat. Métodos 17, 328–334 (2020).

Artículo CAS Google Académico

Kaksonen, AH, Spring, S., Schumann, P., Kroppenstedt, RM y Puhakka, JA Desulfovirgula thermocuniculi gen. nov., sp. nov., un sulfato-reductor termofílico aislado de una mina subterránea geotérmica en Japón. En t. Sistema J. Evol. Microbiol. 57, 98–102 (2007).

Artículo CAS Google Académico

Kerpedjiev, P., Hammer, S. & Hofacker, IL Forna (ARN dirigido por la fuerza): diagramas de estructura secundaria de ARN en línea simples y efectivos. Bioinformática 31, 3377–3379 (2015).

Artículo CAS Google Académico

Descargar referencias

Damos las gracias a E. Brignole, C. Borsa, X. Zhao y S. Yang por su ayuda con la preparación de la rejilla crio-EM y la recopilación de datos. Las muestras se prepararon y se tomaron imágenes en el Centro de microscopía electrónica criogénica en MIT.nano, establecido en parte con el apoyo financiero de la Fundación Arnold y Mabel Beckman. Damos las gracias a todos los miembros del laboratorio de Zhang útil para los debates y apoyo. SH cuenta con el apoyo de una beca de investigación en el extranjero de JSPS. KK cuenta con el apoyo de Schmidt Science Fellows, en asociación con Rhodes Trust, y el Programa de becarios HHMI Hanna H. Gray. FZ cuenta con el apoyo de los Institutos Nacionales de Salud (subvención n.º 1DP1-HL141201 y 2R01HG009761-05); el Instituto Médico Howard Hughes; el Centro Poitras para la Investigación de Trastornos Psiquiátricos del MIT; el Centro Hock E. Tan y K. Lisa Yang para la Investigación del Autismo del MIT; el Centro de Terapéutica Molecular Yang-Tan en McGovern, la Fundación Caritativa BT y por la familia Phillips y J. y P. Poitras.

Los siguientes autores contribuyeron por igual: Seiichi Hirano, Kalli Kappel

Instituto Broad del MIT y Harvard, Cambridge, MA, EE. UU.

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae y Feng Zhang

Instituto McGovern para la Investigación del Cerebro en MIT, Cambridge, MA, EE. UU.

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae y Feng Zhang

Departamento de Ciencias Cerebrales y Cognitivas, Instituto Tecnológico de Massachusetts, Cambridge, MA, EE. UU.

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae y Feng Zhang

Departamento de Ingeniería Biológica, Instituto Tecnológico de Massachusetts, Cambridge, MA, EE. UU.

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae y Feng Zhang

Instituto Médico Howard Hughes, Cambridge, MA, EE. UU.

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae y Feng Zhang

Recursos compartidos CryoEM, Instituto Médico Howard Hughes, Campus de Investigación Janelia, Ashburn, VA, EE. UU.

Rui Yan, Momoko Shiozaki y Zhiheng Yu

Centro Nacional de Información Biotecnológica, Biblioteca Nacional de Medicina, Institutos Nacionales de Salud, Bethesda, MD, EE. UU.

Kira S. Makarova y Eugene V. Koonin

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

SH y FZ concibieron el proyecto. SH, KK, GF, HA-T., MEW, SK, FED y KSM diseñaron y realizaron experimentos y analizaron los resultados. RY, MS y ZY realizaron la recopilación de datos. FZ supervisó la investigación y el diseño experimental con el apoyo de RKMSH, RKM, EVK y FZ escribió el manuscrito con aportes de todos los autores.

Correspondencia a Feng Zhang.

FZ es asesor científico y cofundador de Editas Medicine, Beam Therapeutics, Pairwise Plants, Arbor Biotechnologies y Proof Diagnostics.

Nature agradece a Malcolm White, David Taylor y los otros revisores anónimos por su contribución a la revisión por pares de este trabajo. Los informes de los revisores están disponibles.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

(a) Esquema de procesamiento de datos Cryo-EM para el análisis de partículas individuales del complejo A. Mapas sin agudizar (izquierda) y agudizados (derecha) en el refinamiento 3D final. Distribución de orientación de partículas (Centro). (b) Mapa refinado final, coloreado por resolución local, calculado en RELION-4.0 con umbral FSC 0.5. (c) Curvas FSC calculadas entre los medios mapas del complejo A de la ronda final del refinado en RELION-4.0. (d) Curvas FSC calculadas entre el modelo y el mapa refinado final, utilizando phenix.validation_cryoem. ( e ) Puntuaciones Q para cada residuo del modelo de ADN de cadena no objetivo de IsrB-ωRNA-hebra objetivo en el mapa de 3.1 Å del complejo IsrB-ωRNA-DNA. Las líneas discontinuas negras y grises del gráfico representan las puntuaciones Q esperadas en función de la resolución del mapa global (3,1 Å) y la resolución del mapa local (4,5 Å), respectivamente. Las puntuaciones Q para los residuos de ARN y ADN son coherentes con los valores esperados en función de la resolución del mapa local.

Mapas de densidad crio-EM para residuos representados en las figuras principales.

( a ) Vista de primer plano de la estructura de la proteína IsrB. ( b ) Comparación estructural entre el dominio IsrB-TI unido al ADN y el dominio SpCas9-PI (PDB: 7S4X). En la estructura Cas9, el subdominio insertado entre β6 y β7 se omite para mayor claridad.

(a) Los cinco principales resultados de la búsqueda HHPred utilizando la secuencia inicial SITRVPVVGVDGRPLMPTTPRKARLLIRDGLAVPRRNKLGLFYIQMLRPVGTRTQ correspondiente al dominio PLMP de DtIsrB. ( b ) Comparación estructural del dominio PLMP de DtIsrB y el dominio N-terminal del Factor de inicio de traducción 3 (IF-3) de Geobacillus stearothermophilus (PDB: 1TIF). ( c ) Alineación de dominios N-terminales de IF-3 representativos y dominios PLMP relacionados con OMEGA.

(a) Geles PAGE desnaturalizados para resolver productos de ADN mellado. (b) Un gel SDS-PAGE para comprobar la expresión de los mutantes por deleción. Relacionado con la figura 3c.

( a ) Sitios de escisión en el ADN objetivo como ensayo mediante secuenciación de Sanger. Los sitios de corte están marcados con triángulos negros. La adenina no moldeada adicional se indica mediante un asterisco en el seguimiento de secuenciación de Sanger. ( b ) Estructura del dominio de la proteína de fusión λN-IsrB (izquierda) y esquema del mutante de ωRNA y el ADN objetivo (derecha). En el mutante de ωRNA, los residuos 34–67 se reemplazaron con GAAA y el RNA boxB se agregó al extremo 3 'del andamio de ωRNA. ( c ) Esquema de procesamiento de datos Cryo-EM para el análisis de partículas individuales del complejo B (izquierda). Mapa refinado final (derecha). (d) Curvas FSC calculadas entre los mapas medios del complejo B de la ronda final del refinamiento en cryoSPARC v3.3. ( e ) Mapa de densidad Cryo-EM del complejo B. En función de la superposición del mapa del complejo B y el modelo del complejo A, se asignaron regiones de proteína, ARN y ADN. Se observó una densidad extra en las proximidades de la región SL8 de ωRNA y se asignó al complejo λN-boxB, de acuerdo con la conectividad SL8-boxB y el volumen de λN-boxB (PDB: 1QFQ). TS, hebra diana; NTS, hebra no diana. (f y g) Mapas de densidad Cryo-EM del complejo A (f) y SpCas9 en complejo con su ARN afín y ADN diana (EMD: 24838) (g).

( a ) Estructura secundaria y predicción de pseudonudos de los andamios de ωRNA basados ​​​​en el modelo de covarianza. En los ωRNA CwIsrB/DsIsrB/BbIsrB, los motivos SL3 se reemplazan con nucleótidos desapareados. En los ωRNA CsIsrB/K2IsrB/BbIsrB, los motivos SL6 se degeneran y los motivos SL8 se reemplazan con nucleótidos desapareados. ( b ) Superposición de estructuras AlphaFold (AF) y crio-EM (EM) de DtIsrB. ( c ) Superposición de estructuras AlphaFold de seis ortólogos IsrB. CwIsrB/DsIsrB tienen inserciones de horquilla y bucle β en el dominio RuvC y RECL, respectivamente.

Comparación estructural entre DtIsrB, OgeuIscB (8CSZ), YnpsCas9-1 (modelo AF2) y SpCas9 (PDB: 4OO8).

Comparación estructural entre ARN afines de DtIsrB, OgeuIscB (8CSZ), CjCas9 (5X2G) y SpCas9 (7S4X) en sus estados unidos a proteína/ADN. Estructuras generales (izquierda). Estructuras de ARN (centro). Diagramas esquemáticos de ARN (derecha).

Esquema que destaca las similitudes y diferencias mecánicas entre IsrB y Cas9.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Hirano, S., Kappel, K., Altae-Tran, H. et al. Estructura de la omega nickasa IsrB en complejo con ωRNA y ADN diana. Naturaleza 610, 575–581 (2022). https://doi.org/10.1038/s41586-022-05324-6

Descargar cita

Recibido: 20 Abril 2022

Aceptado: 06 septiembre 2022

Publicado: 12 de octubre de 2022

Fecha de emisión: 20 de octubre de 2022

DOI: https://doi.org/10.1038/s41586-022-05324-6

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Naturaleza (2023)

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.