banner
Hogar / Blog / Un borrador del genoma de Escherichia coli del siglo XVI asociado con una infección biliar oportunista
Blog

Un borrador del genoma de Escherichia coli del siglo XVI asociado con una infección biliar oportunista

May 27, 2023May 27, 2023

Biología de las comunicaciones volumen 5, Número de artículo: 599 (2022) Citar este artículo

12k Accesos

557 Altmetric

Detalles de métricas

Escherichia coli, una de las bacterias más caracterizadas y una de las principales preocupaciones de salud pública, permanece invisible en el paisaje temporal. Aquí presentamos la meticulosa reconstrucción del primer genoma antiguo de E. coli a partir de un cálculo biliar del siglo XVI de una momia italiana con colecistitis crónica. Aislamos ADN antiguo y reconstruimos el genoma antiguo de E. coli. Consistía en un cromosoma de 4446 genes y dos plásmidos putativos con 52 genes. La cepa de E. coli pertenecía al filogrupo A y a una secuencia excepcionalmente rara tipo 4995. Los genes del componente del sistema de secreción de tipo VI parecen adquirirse horizontalmente de Klebsiella aerogenes, sin embargo, no pudimos identificar ningún gen específico de patovar ni resistencias antibióticas adquiridas. Un ensayo de sepsis en ratones mostró que una cepa contemporánea de E. coli estrechamente relacionada era avirulenta. Nuestra reconstrucción de esta antigua E. coli ayuda a pintar una imagen más completa de la carga de infecciones oportunistas del pasado.

La recuperación de ADN de patógenos antiguos (aDNA) de víctimas humanas se ha centrado casi exclusivamente en eventos de mortalidad históricamente significativos, como la peste negra, que revela la historia evolutiva de patógenos canónicos como Yersinia pestis, Mycobacterium tuberculosis1 y el virus Variola. Por el contrario, gran parte de la morbilidad y mortalidad humana es el resultado de infecciones oportunistas, que a menudo permanecen invisibles en el pasado. Los patógenos oportunistas, aquellos sin registros históricos, como Escherichia coli, Pseudomonas aeruginosa y Staphylococcus aureus, han sido poco estudiados en relación con sus cargas contemporáneas en las personas de hoy2. Se definen por su capacidad de infectar durante períodos de estrés, desequilibrio o perturbación, siendo comensales o saprofitos3. Las infecciones oportunistas probablemente jugaron un papel importante en la mortalidad humana en nuestro pasado compartido y, por lo tanto, han tenido un impacto más amplio en la salud humana de lo que se puede medir o se ha medido.

Un factor de confusión en la identificación de patógenos históricamente poco estudiados es que las infecciones resultantes probablemente fueron principalmente oportunistas. Es decir, colonizaron sus ambientes de acogida de forma asintomática, sin dejar patologías identificables y, por tanto, no son fácilmente identificables en restos humanos4. Los estudios de ADN antiguo generalmente se enfocan en patógenos obligatorios como M. leprae, Salmonella enterica e Y. pestis que se correlacionan fácilmente con eventos de mortalidad patológicamente distintos o históricamente relevantes y, como tales, se distinguen fácilmente como extraños en datos de lectura de ADN metagenómico humano antiguo5, 6,7. Las infecciones oportunistas tienen la carga adicional de la autenticación debido a su ubicuidad como contaminantes ambientales y como cepas comensales modernas. La identificación histórica de estos patógenos permitiría una evaluación cuidadosa de su historia evolutiva y el continuo comensal-patógeno definido por la ganancia y pérdida del contenido de genes a medida que las cepas modulan hacia o desde la virulencia del huésped.

E. coli es uno de esos patógenos. Es una bacteria comensal común que se encuentra en el microbioma intestinal de los vertebrados8 y que también puede convertirse en un patógeno oportunista en condiciones específicas9. E. coli tiene un impacto tan grande en nuestros sistemas de atención médica que es objeto de varios esfuerzos de desarrollo de vacunas para mitigar los efectos de las cepas más patógenas10. Habiendo sido responsable de varios brotes de intoxicación alimentaria y convirtiéndose en un patógeno principal de muertes causadas por la resistencia a los antimicrobianos, E. coli es, por lo tanto, una bacteria clave utilizada en la vigilancia de la salud pública11.

El muestreo global de cepas de E. coli produce un árbol con varios grupos filogenéticos únicos y patovares intercalados12. Mientras que las relaciones filogenéticas entre las cepas se construyen sobre la base de la similitud genética, los patovares se definen por los rasgos de virulencia de sus miembros. En muchos casos, los miembros del mismo patovar se agrupan en el mismo clado; sin embargo, dado que los genes de virulencia se pueden adquirir horizontalmente, algunos patovares, como E. coli enteroagregativa, se distribuyen en múltiples grupos filogenéticos12. Esta sorprendente diversidad y los estados transitorios evolutivos entre las cepas de E. coli destacan su plasticidad genómica y versatilidad evolutiva a lo largo de este continuo antes mencionado. Los genomas antiguos de E. coli proporcionarían información útil sobre las fuerzas que influyen en la aparición del comensalismo y la patogenicidad en las bacterias. Aquí, describimos la reconstrucción de un genoma de E. coli del siglo XVI caracterizado a partir del cálculo biliar de un noble italiano, Giovani d'Avalos (1538-1586), destacando un genoma con características comensales.

En 1983, los restos momificados de varios nobles italianos fueron recuperados de la Abadía de San Domenico Maggiore en Nápoles, Italia (Figura complementaria 1). Un cuidadoso estudio paleopatológico e histológico de uno de los individuos, Giovani d'Avalos (NASD1), un noble napolitano que murió en 1586 a la edad de 48 años (se puede encontrar más información en la sección de Notas complementarias de los Materiales complementarios), reveló paredes vesiculares engrosadas, senos de Rokitanski-Aschoff y varios cálculos biliares intactos13. Estas características sugirieron que NASD1 podría haber sufrido colecistitis crónica14. Si bien no es la única causa de colecistitis, las infecciones bacterianas crónicas por E. coli, Bacteroides spp. y Clostridium spp. puede conducir a la formación de cálculos biliares15. Estas infecciones suelen estar indicadas por un pigmento marrón, como se puede ver en el cálculo biliar de NASD115 (Fig. 1a, b).

a Hígado y vesícula biliar de Giovani d'Avalos. Los cálculos biliares se pueden ver en el rectángulo rojo. Nótese su coloración marrón oscuro. La barra de escala representa 1 cm b Vesícula biliar con una pared engrosada (a) y senos de Rokitansky-Aschoff (b) (Hematoxilina-eosina, 3X y 250X). La barra de escala para (a) representa 2 cm y 100 μm para (b). c Gráficos de daños de los extremos \({5}^{\prime}\) y \({3}^{\prime}\) de las lecturas asignadas para E.coli. Los colores se refieren al resumen, no al tipo de daño. Se utilizó Mapdamage 2.052 para calcular las tasas de daño. d Distribución de longitud de fragmentos de lecturas mapeadas deduplicadas de E. coli. Se utiliza una escala \({\log }_{10}\) para enfatizar las diferencias entre los resúmenes. Se requería una longitud mínima de 30 pb para que se mantuviera una lectura.

Los perfiles metagenómicos generados a partir de los extractos de ADN utilizando Kraken 216 proporcionaron evidencia preliminar de la presencia sustancial y creciente de Enterobacteriales en las rondas de digestión 2 (capa externa), 3–4 (capa intermedia) y 5–6 (capa interna) del cálculo biliar mientras indicando su ausencia en las muestras de tejido de NASD1 (Fig. 2 complementaria). Las lecturas de Enterobacteriales también están presentes en la ronda de digestión 1; sin embargo, son comparables con las de los reactivos en blanco (Fig. 2 complementaria), por lo que es probable que se trate de una mezcla de ADN endógeno y contaminante, como Bradyrhizobium. La indicación a nivel de especie sugirió que E. coli compuso la mayor proporción de lecturas identificadas como Enterobacteriales. Afortunadamente, las lecturas específicas de E. coli están prácticamente ausentes (≤0,002 %) de los espacios en blanco y están presentes en los resúmenes segundo a sexto. En comparación, otros taxones como Alcaligenes y Bradyrhizobium estuvieron presentes tanto en las muestras experimentales como en los espacios en blanco y es probable que sean contaminantes. Las lecturas asignadas por humanos estaban presentes en todos los resúmenes, pero también se detectaron en los espacios en blanco. También se detectó Klebsiella aerogenes, sin embargo, solo en las rondas de digestión 3-4. Para evaluar la autenticidad de las lecturas de humanos, E. coli y K. aerogenes, examinamos la cinética de desaminación y depuración (Fig. 1c, d y Fig. 3 complementaria).

El genoma antiguo de E. coli reconstruido tenía una profundidad de lectura media de 28,46 [28,31, 28,62] ×, heterocigosidad media de 7,66 × 10-4 [6,66 × 10-4, 8,66 × 10-4], 4446 genes cuando se mapearon en la E conjunto de datos de pan-genoma de .coli y un tamaño total estimado de 4050, 429 pb cuando los genes detectados están concatenados. Se detectaron diferencias significativas (prueba t bilateral, P = 7,951 × 10−05) al comparar las profundidades de lectura del núcleo (3122 genes, 28,73 [28,61, 28,86] ×) y accesorio (1324 genes, 27,82 [27,39, 28,26] ×) genomas (Fig. 2a y Tabla 1); lo mismo ocurrió con su heterocigosidad media con el núcleo en 2,74 × 10−4 [2,34 × 10−4, 3,15 × 10−4] y el genoma accesorio con 1,92 × 10−3 [1,61 × 10−3, 2,24 × 10− 3] (Fig. 4 complementaria). Se identificaron ochenta y tres genes que tenían una cobertura de genes sustancialmente más profunda (al menos dos desviaciones estándar). Luego, estos resultados se compararon con los genomas de E. coli del filogrupo A estrechamente relacionados de FSIS11816402, una cepa tipo secuencia (ST) 4995, y K-12 MG1655, una cepa ST10 (Fig. 2b y Fig. 5 complementaria). Ambas comparaciones de genoma arrojaron una profundidad media más baja con una mayor variación de cobertura. Esto es especialmente cierto para FSIS11816402, ya que el 25,24 % de sus contigs tenía una cobertura media de menos de 1 × (Figura 6 complementaria).

a Distribución de coberturas génicas medias con un CV ≤1 para el genoma antiguo. La línea discontinua indica el umbral de detección en 10×. El rectángulo negro a la derecha indica el área donde se encuentran los genes con un alto número de copias (como se define por \(\bar{x}+2* s\)). b Gráfica de cobertura para FSIS11816402. Se utilizó una ventana del 1% con fines ilustrativos. c Gráfica de cobertura para CP019906.1. Se utilizó una ventana de 0,1% con fines ilustrativos. La primera pista indica la cobertura con la línea roja que ilustra la media general. La segunda pista indica el número de SNP en la misma ventana, mientras que la tercera es el contenido de GC. d Cobertura génica del T6SS en K. aerogenes utilizando una ventana de 100 pb. Los nombres de los genes se incluyen cuando están disponibles.

Identificamos dos plásmidos potenciales dentro de los andamios ensamblados con MOB-suite17: E. coli MDR_56 plásmido sin nombre 5 (CP019906.1) y S. flexneri 1a cepa 0228 plásmidos (CP012732.1). Los mapeos posteriores de las lecturas de E. coli a estos plásmidos de referencia confirmaron su presencia en la cepa antigua y autenticaron su origen (Fig. 2c y Figs. Suplementarias 5, 7). Un plásmido, CP019906.1 tuvo una cobertura de lectura similar a la de K-12 (20.95[20.80, 21.10] ×) y 34 genes, mientras que CP012732.1 tuvo una cobertura menor (16.46[16.28, 16.64] ×) y solo 19 genes Estos plásmidos contienen regiones sin cobertura de lectura, incluida una región de ~6,6 Kbp en CP012732.1, pero no pudimos confirmar si los genes formaban parte del cromosoma.

Kraken 216 también clasificó un subconjunto de las lecturas secuenciadas como pertenecientes a K. aerogenes. Para confirmar o refutar este resultado, las lecturas no asignadas se alinearon con el genoma de referencia de K. aerogenes (NC_015663.1). La profundidad de lectura general (0,38 [0,37, 0,38] ×) y la cobertura del genoma fue baja (3,43 %), lo que sugiere que solo estaba presente un subconjunto de genes de K. aeorgenes. Sin embargo, una sección del genoma de 38 Kbp (Fig. 2d) tenía una profundidad de mapeo de lectura similar a los resultados antiguos de E. coli (20.36 [20.23, 20.50] ×).

Para ubicar la E. coli antigua dentro de la filogenia global y ayudar a identificar la cepa, producimos una alineación de SNP central de 451 E. coli y cuatro genomas de Shigella que representan la amplitud actual de la diversidad de E. coli. Después de eliminar la redundancia, la filogenia resultante contenía 107 genomas. Este conjunto de muestras podadas se usó luego para crear una nueva alineación de 5007 SNP centrales que devolvieron una topología general que se asemeja a los resultados publicados anteriormente y colocaron la cepa antigua en una filogenia fuertemente respaldada dentro del filogrupo A (Fig. 3a).

a La filogenia global con valores de arranque y grupos filogenéticos con E. coli EC42405 como grupo externo. b Filogenia del subgrupo A0 reducido según lo definido por el genotipo Clermont (+ - - -)61. Los puntos de punta representan el tipo de secuencia de la cepa. IAI1 fue el grupo externo de la filogenia. c Filogenia de las cepas ST4995. Los rectángulos rojos representan el intervalo de confianza del 95 % para la topología; las etiquetas indican la fecha mediana de la divergencia. La tasa evolutiva de la filogenia fue de 2,555 × 10−6[1,567 × 10−6, 3,992 × 10−6] subs/sitio/año. CFSAN051544 fue el grupo externo. Las flechas marrones indican la posición del genoma antiguo.

Para refinar más cuidadosamente la posición de la cepa antigua dentro del grupo A, generamos un árbol ML reducido utilizando 94 genomas (Fig. 3b) que consta de 291 SNP. El genoma antiguo se agrupó estrechamente con las cepas ST4995 con cierto apoyo estadístico (apoyo de arranque del 65 %), lo que significa que probablemente sea parte del mismo tipo de secuencia (Tabla 2). Luego se generó un árbol ML aún más refinado utilizando los 22 genomas ST4995 disponibles de Enterobase18 (Fig. 3c). El alineamiento central de SNP contenía 16 026 nucleótidos, lo que proporciona una resolución mucho mayor que los alineamientos globales y de subgrupos A0. La cepa antigua claramente se agrupa dentro de los genomas ST4995.

Buscamos señales temporales en todas las filogenias utilizando TEMPest19 y encontramos una cuando la filogenia estaba restringida a los genomas ST4995 (Figura 8 complementaria), un resultado que confirmó una prueba de aleatorización de fechas en LSD (P = 0,003). La filogenia ST4995 (Fig. 3c) sugiere un tMCRA del siglo XI (1027 [787, 1220] CE) para las cepas ST4995, casi 500 años antes de la diversificación de las cepas modernas. La tasa evolutiva estimada a lo largo de la filogenia fue de 2,555 × 10−6[1,567 × 10−6, 3,992 × 10−6] subs/sitio/año, similar a los resultados publicados previamente20.

La secuencia multilocus y la tipificación de nuestro antiguo genoma de E. coli confirmaron su ubicación en ST4995, un tipo de secuencia poco común con solo 22 cepas en la base de datos Enterobase18 que abarca 182 476 entradas18. Exhibía un Onovel15:H? serotipo, similar a sus taxones hermanos (consulte la sección Discusión complementaria en los Materiales complementarios para obtener los resultados completos). Una variante diferente de fimH, fimH86, estaba presente en nuestra cepa de E. coli.

La mayoría (95%) de las cepas de E. coli contenían 3190 genes centrales, 3122 de los cuales se detectaron en nuestro genoma antiguo (Figura 9 complementaria). El análisis de enriquecimiento de los genes centrales faltantes reveló una falta significativa de genes de ensamblaje flagelar (P = 0,0445), sin embargo, la red proteína-proteína contenía el número esperado de interacciones (P = 0,11). Un análisis de regiones con lecturas antiguas mapeadas en CP019906.1 reveló la presencia de genes involucrados en la formación de biopelículas (NP_311382.1) y una bomba de salida de múltiples fármacos (acrD). Para CP012732.1, por el contrario, las lecturas asignadas a pseudogenes probablemente estén relacionadas con las regulaciones de osmoprotección y transcripción.

Un análisis de presencia/ausencia (P/A) del genoma accesorio recapitula los resultados de los resultados de filogenia de ML (Fig. 4a) y los resultados publicados previamente21. El accesorio PCoA indica que el genoma es un miembro del filogrupo A y un miembro ancestral de ST4995. Esto último se confirma mediante un análisis P/A de un pangenoma solo de ST4995 (Figura 10 complementaria).

El genoma accesorio (a, c) y los genes de virulencia identificados (b, d) se agruparon utilizando una distancia binaria. Los filogrupos se identificaron utilizando Clermont Typing59, mientras que los patovares se determinaron utilizando los metadatos disponibles de la base de datos Patric49. El genoma antiguo está indicado por la flecha negra. En ambos binarios se calcularon las distancias antes de crear el PCoA.

Se identificaron un total de 91 factores de virulencia en el genoma antiguo, 37 de los cuales no se encontraron en E. coli K-12 MG1655 (ver Tabla 3 para familias de genes con más de un hit). Los componentes del sistema de secreción de tipo VI (T6SS) consistían en la mayoría de estos genes y contenían un alto número de copias. El T6SS, formado por la familia de genes tss, así como por hcp, vasK y vgrG, media en interacciones antagónicas entre bacterias competidoras. Además de su papel en la eliminación de bacterias, el T6SS participa en la señalización interbacteriana, la formación de biopelículas y la defensa contra fagos22. También se detectaron partes de un sistema de secreción de tipo III a niveles mucho más bajos.

También observamos complementos de genes de virulencia incompletos involucrados en varios mecanismos. En el genoma antiguo se encontraron varios genes pertenecientes a las familias de fimbrias ecp y fim. Si bien están involucrados en la virulencia9,23,24, también pueden estar presentes en cepas comensales. También se identificaron fimbrias que se sabe que están asociadas con la virulencia, como cfaB y csg23, pero no brindan suficiente información para identificar el patovar específico de la cepa antigua9,23,24. Los factores clave de virulencia para los patovares de E. coli como eae y stx para E. coli productora de toxina Shiga (STEC), genes termolábiles y estables al calor para E. coli enterotoxigénico (ETEC) y el sistema de secreción tipo III en EPEC y EHEC estuvieron ausentes9.

Por el contrario, astA, un factor de virulencia clave en E. coli enteroagregativa (EAEC)25, se detectó en el genoma antiguo. En combinación con la evidencia de que T6SS se encuentra comúnmente en las cepas EAEC9, esto puede indicar que la cepa antigua era miembro de este patovar. Sin embargo, no se detectaron los factores de virulencia EAEC restantes en el pan-genoma (aggA, aggR y aap)25. El genoma antiguo también contiene un sistema de enterobactina completo que es responsable de la absorción de hierro23. El sistema de enterobactina y el gen astA también se encontraron en E. coli K-12 MG1655, lo que nuevamente indica que no confieren suficiente virulencia por sí solos.

Para evaluar el potencial de virulencia extraintestinal de ST4995, probamos un pariente cercano (507 SNP centrales que separan las dos cepas) del genoma antiguo, la cepa de referencia ATCC11229 (consulte la Fig. 3b y la Fig. 11 complementaria para conocer las similitudes con la cepa moderna) en un ensayo de sepsis en ratones bien calibrado en el que se inoculó la cepa a diez ratones y se registró su muerte26. Ninguno de los ratones fue asesinado por ATCC11229, mientras que todos los ratones infectados por la cepa CFT073 del filogrupo B2 de control positivo fueron asesinados. El fenotipo de la cepa que mató a los ratones está relacionado con la presencia de genes específicos de virulencia extraintestinal con un papel importante en el sistema de captura de hierro que codifica genes como los que presenta la isla de alta patogenicidad (HPI)27,28. Este resultado está de acuerdo con la ausencia de genes de virulencia extraintestinales típicos presentes en la cepa ATCC11229 y antigua.

Buscamos en nuestro genoma antiguo la presencia de genes de resistencia a los antimicrobianos (AMR) utilizando el Identificador de genes de resistencia29 y encontramos 47 genes distintos en el ensamblaje del andamio de nuestro genoma antiguo de E. coli. De estos, 35 genes también se identificaron en el análisis P/A del pan-genoma global. Ocho genes contenían duplicados, siendo mdtB el más comúnmente detectado. El subconjunto restante abarcó trece clases de resistencia a fármacos antimicrobianos con nueve clases representadas más de una vez (Tabla 4). Se detectaron casetes de resistencia dirigidos a las cinco clases de fármacos más comunes en la antigua cepa de E. coli. La mayoría de estos genes son bombas de expulsión de múltiples fármacos, lo cual es típico de E. coli30. No hubo genes AMR inesperados presentes en nuestro genoma antiguo y los 35 se encontraron en E. coli K-12 MG1655.

El ADN aislado de la piedra mostró una clara evidencia de daño en el ADN. Específicamente, las gráficas de desaminación para el mapeo de lecturas antiguas a la referencia del pan-genoma de E. coli contenían perfiles de ADNa característicos que indicaban mayores tasas de desaminación en o cerca de las bases terminales (Fig. 1c). Además, los gráficos de cinética de depuración de las lecturas mapeadas de E. coli de bibliotecas con suficiente profundidad de lectura de E. coli (digestos 2, 3–4, 5–6) mostraron que los fragmentos de las secciones internas del cálculo biliar (mejor protegidos de la hidrólisis) estaban en promedio más largo (mediana de 34 pb en el resumen 2 a mediana de 37 pb en los resúmenes 5–6) (Fig. 1d). Obtuvimos resultados similares para los datos de K. aerogenes en los resúmenes dos a seis. Curiosamente, las lecturas humanas mapeadas carecen de estas características distintivas (Figura 3 complementaria). Sin embargo, lo más importante es que confirman que las secuencias de E. coli y K. aerogenes son realmente antiguas y no fueron el resultado de una contaminación moderna.

Existen dos posibles explicaciones para la falta de señal de desaminación en las lecturas humanas mapeadas. La primera es que la muestra probablemente contenga una mezcla de ADN humano antiguo tanto contaminante como, en menor grado, auténtico. Es casi seguro que este es el caso del primer resumen, ya que representa la capa externa del cálculo biliar, que habría estado sujeta a contaminación por manipulación, almacenamiento, muestreo, etc. Sin embargo, a medida que avanzamos hacia capas más profundas del cálculo biliar, presumiblemente mejor protegidos de la contaminación, la falta de ADN humano endógeno fue sorprendente. Esto es especialmente sorprendente con las distancias de edición para las lecturas de humanos y E. coli de los diferentes resúmenes (Fig. 12 complementaria). La explicación más probable es que simplemente no hay suficientes lecturas de ADN humano para un análisis de daños significativo. Los cálculos biliares generalmente se forman a partir de una combinación de colesterol, sales biliares y fosfatidilcolina15. Además, en el ambiente altamente ácido de la vesícula biliar, solo las bacterias que están especializadas en sobrevivir a estas condiciones pueden prosperar y potencialmente formar un cálculo15. Dado que los cálculos biliares no se forman a partir de componentes celulares humanos directos, es probable que su interior esté prácticamente desprovisto de ADN humano, lo que es muy diferente de los resultados que obtuvimos del ADN de abscesos antiguos31.

Los resultados de profundidad de genes del genoma antiguo de E. coli confirman la falta de contaminantes modernos, ya que son parte de una distribución normal unimodal. La única excepción a estas estadísticas de cobertura son 83 genes con profundidades medias sustancialmente mayores (Datos complementarios 2). Estos genes consisten principalmente en proteínas hipotéticas (24,10%), intergrasas y transposones (19,28%) y el T6SS (13,25%). También contienen una heterocigosidad media significativamente mayor (P = 5,03 × 10-11) (1,23 × 10-2 [9,25 × 10-3, 1,53 × 10-2]) que el resto del genoma antiguo. Estos genes de alto número de copias, sin embargo, son principalmente genes accesorios (96,34%), lo que sugiere, en combinación con la mayor heterocigosis y la presencia de transposones, que se ubicaron en elementos móviles compartidos entre múltiples especies bacterianas.

Los plásmidos que detectamos en el ensamblaje del andamio, CP019906.1 y CP012732.1, tenían coberturas de profundidad de genes más bajas que las de nuestro cromosoma reconstruido (Tabla 1). La mayoría de los plásmidos suelen estar presentes en un mayor número de copias que los cromosomas32, sin embargo, este no fue el caso ya que el cromosoma antiguo tenía una cobertura media significativa (P = 0 utilizando el método de Tukey para comparar las estimaciones de cobertura entre los plásmidos y el cromosoma antiguo) más profunda que CP019906. 1 y CP012732.1. Una posibilidad es que estos dos plásmidos en realidad no estén presentes, sino que los genes a los que se asignaron las lecturas antiguas estuvieran realmente ubicados en el cromosoma antiguo. Esto está respaldado por el hecho de que las profundidades genéticas medias de los plásmidos caen firmemente dentro de la distribución de cobertura del cromosoma (Tabla complementaria 2). Esto podría explicar grandes regiones de los plásmidos que carecen de lecturas asignadas, así como la falta de lecturas asignadas a regiones intergénicas (consulte la Fig. 2c y la Fig. 5B complementaria).

El mapeo de lecturas del genoma de K. aeorgenes podría representar una situación similar a los datos del plásmido. Curiosamente, la región de 38 Kbp en el cromosoma de K. aerogenes que tenía una profundidad de lectura similar pero significativamente diferente (P ≈ 0 utilizando el método de Tukey para comparar las estimaciones de cobertura entre el T6SS de K. aerogenes y el antiguo cromosoma de E. coli) de los plásmidos y El cromosoma de E. coli (20,36 ± 13,56 ×) contiene el sistema de secreción de tipo VI (T6SS), que es omnipresente en las bacterias gramnegativas y desempeña un papel importante en las interacciones antagónicas22. Dado que el T6SS está muy extendido entre las bacterias, su presencia no es un marcador exclusivo de K. aerogenes. Sin embargo, el mapeo de lectura competitivo entre E. coli y K. aerogenes sugiere que este T6SS pertenece a K. aerogenes en lugar del sistema homólogo en E. coli, lo que sugiere una transferencia horizontal reciente, que está respaldada por una comparación de su GC relativo contenidos33 (Suplementario Fig. 13).

La estructura de nuestra filogenia global se parece a las publicadas previamente34 y ubica el genoma antiguo en el filogrupo A con un apoyo significativo (100 % de arranque para un clado de tres cepas). Curiosamente, otras cepas históricas (~1800) de E. coli también se han colocado en este filogrupo35. Las cepas que se han aislado de humanos que viven en comunidades menos industrializadas y más rurales suelen albergar cepas que pertenecen al filogrupo A8. La fecha medieval tardía de nuestra muestra, junto con su ubicación filogenética ayuda a confirmar su autenticidad. Además, un estudio de cepas de E. coli aisladas de infecciones biliares mostró que pertenecen principalmente al grupo filogenético A36.

Identificamos una señal temporal en la filogenia reducida (Fig. 3c) que proporciona un contexto adicional para la historia evolutiva de las cepas ST4995. La mayoría del tipo de secuencia puede rastrear su linaje hasta una cepa de aproximadamente 1592 [1479, 1690] CE, sin embargo, la divergencia de nuestro genoma antiguo y otros dos, ESC_AA9618AA_AS y ESC_VA4573AA_AS, tiene un tMRCA ca más profundo. 956[689, 1172] CE. Dada la disparidad de edades entre los dos clados, es probable que ST4995 en realidad esté compuesto por al menos dos subgrupos. La evidencia que respalda esto se puede ver en un MDS del análisis P / A de todos los genomas ST4995 existentes (Fig. 9 complementaria).

El análisis P/A de los genes accesorios recapitula los resultados de las filogenias ML (Fig. 4a). El PCoA accesorio confirma que la cepa antigua es miembro del grupo filogenético A, mientras que un análisis P/A posterior con un pangenoma solo de ST4995 respalda la propuesta de que el genoma es miembro de ST4995 (Fig. 9 complementaria). El grupo filogenético A, el grupo del que proviene ST4995, es un clado bien descrito y es el tipo más comúnmente aislado de comensales humanos8. La diversidad de cepas de E. coli está impulsada principalmente por factores socioeconómicos, ya que las personas que viven en países industrializados modernos tienen más probabilidades de portar cepas B2, mientras que las que viven en comunidades rurales y menos industrializadas albergan principalmente A8. Dado el período de tiempo que vivió NASD1, nuestra antigua E. coli es miembro del grupo filogenético A.

No se detectaron genes AMR adquiridos en el genoma antiguo, lo que confirma la edad de la cepa. Después de la eliminación de las bombas de salida de múltiples fármacos de nuestro genoma, no se encontraron otros genes AMR en comparación con E. coli K-12 MG165530. Este último es extremadamente pertinente ya que una fuerte resistencia a una clase de fármaco en particular requiere varios mecanismos37. Por lo tanto, es probable que solo se necesitaran resistencias leves a estos compuestos antimicrobianos30,38.

El genoma antiguo identificado probablemente exhibió características comensales, ya que comparte la mayoría de sus factores de virulencia con E. coli K-12 MG1655. La cepa antigua carece de los factores canónicos de virulencia para STEC y ETEC y también carece de los componentes del sistema de secreción de tipo III utilizado en EHEC. Se detectaron componentes de EAEC (astA y T6SS9), pero faltaban otros factores clave de virulencia y también se detectó astA en K-12 MG1655. Los resultados del análisis P/A de los genes accesorios con etiquetas de patovar (Fig. 4c) y los genes de virulencia (Fig. 4d) presentan una imagen similar. El genoma antiguo está posicionado en un grupo relativamente general que contiene una variedad de diferentes patovares que incluyen EHEC, ETEC, ExPEC y STEC. El modelo de sepsis en ratones refuerza aún más que el genoma antiguo era un patógeno oportunista ya que la cepa proxy, ATCC 11229, no infectó a ningún ratón. Esta información, en combinación con los genes de virulencia identificados y el agrupamiento P/A de la E. coli antigua, sugiere que el genoma antiguo es un patógeno oportunista que adquirió un casete del gen T6SS de K. aerogenes durante la expansión en la vesícula biliar, de acuerdo con trabajos anteriores que muestran Klebsiella sp a menudo asociada con E. coli en infecciones biliares contemporáneas39.

Realizamos extracciones de ADN en un solo cálculo biliar, que había sido aislado de los restos momificados de NASD1, en las instalaciones de sala limpia del Centro de ADN antiguo McMaster (Universidad McMaster, Hamilton, Ontario, Canadá) utilizando metodologías específicas para el ADN antiguo. Presumimos que las sucesivas capas mineralizadas del cálculo contendrían ADN cada vez mejor conservado y, por lo tanto, sometimos el cálculo biliar a seis rondas sucesivas de desmineralización y digestión40. Posteriormente, se extrajo el ADN de 250 μL del sobrenadante procedente de cada ronda, que luego se purificó y preparó en bibliotecas de doble índice, se seleccionó por tamaño para eliminar artefactos y se secuenció en la plataforma Illumina HiSeq 1500 con lecturas de extremos emparejados de 90 pb41 , 42. Tres tipos de tejido adicionales del mismo individuo (vejiga, intestino delgado y pulmón) se procesaron y secuenciaron como anteriormente con fines comparativos. Los detalles completos de los métodos se pueden encontrar en la sección Métodos complementarios en los Materiales complementarios.

Los adaptadores se identificaron a través de AdapterRemoval43 con recorte y fusión realizados por leeHom44 usando su configuración de aDNA. Los carriles de secuenciación se agruparon cuando correspondía y Kraken 216 determinó la composición metagenómica general de las muestras. Esto se hizo para caracterizar el metagenoma e identificar taxones de interés. Se utilizó una base de datos Kraken 216 estándar con algunas modificaciones (un tamaño kmer de 25 pb y sin minimizador) para tener en cuenta las longitudes de lectura más pequeñas de los fragmentos de ADNa. Las lecturas se sometieron a deduplicación de cadenas mediante prinseq45 antes del análisis metagenómico.

Luego, las muestras se mapearon contra el genoma humano GRCh3846 con BWA47 con una distancia de edición máxima de 0.01 (-n 0.01), como máximo dos aberturas (-o 2) y la siembra efectivamente desactivada (-l 16500)48. Se requería una longitud mínima de 30 pb y una calidad de mapeo de 30 para que una lectura coincidiera con éxito. Los fragmentos que no se mapearon con éxito se compararon luego con un pan-genoma de E. coli usando la misma configuración. El pangenoma se creó con genomas de E. coli de PATRIC49 y cuatro genomas de Shigella de NCBI. Específicamente, se seleccionaron genomas que se encontraron en humanos, pollos, vacas, perros, ratones o cerdos y se determinó que tenían una calidad de genoma "buena" (según la definición de PATRIC), lo que dio como resultado 451 cepas. Estas secuencias se anotaron con Prokka50 usando las proteínas de E. coli K-12 MG1655 (NC_000913.3) obtenidas de NCBI como secuencias confiables. Las anotaciones resultantes fueron compiladas por Roary51 para crear el pan-genoma. Los parálogos no se dividieron y se utilizó una identidad blastP mínima del 90 % como configuración adicional. Las lecturas humanas mapeadas sin éxito también se compararon con K. aerogenes (NC_015663.1), ya que estaba sustancialmente (abundancia proporcional ≥1 %) presente en uno de los resúmenes y, al mismo tiempo, se excluía de los espacios en blanco.

Las lecturas de humanos, E. coli y K. aerogenes mapeadas con éxito se deduplicaron en función de sus coordenadas \({5}^{\prime}\) y \({3}^{\prime}\) con bam-rmdup (https ://bitbucket.org/ustenzel/biohazard-tools/src/master/). Las muestras deduplicadas se agruparon en función de su resumen de origen (1, 2, 3–4 o 5–6). Se utilizó MapDamage 2.052 para estimar la cantidad de desaminación en las lecturas mapeadas. También se extrajeron las distribuciones de longitud de fragmentos (FLD) y los desajustes de mapeo. La heterocigosidad se probó llamando polimorfismos de un solo nucleótido (SNP) usando bcftools con ploidía establecida en dos53 y un umbral de calidad de 100.

Después de la autenticación, se creó un ensamblaje con el conjunto completo de lecturas mapeadas de E. coli y K. aerogenes (es decir, no deduplicadas) utilizando SPAdes 3.14.1 en modo aislado54 con longitudes de kmer personalizadas: 9, 19 y 29. El ensamblaje resultante era un andamio incompleto y muy fragmentado. Esto se debió principalmente a las longitudes medianas cortas de los fragmentos (35 pb) de las lecturas de entrada y los tamaños de kmer requeridos. No obstante, el N50 del ensamblaje fue de 939 pb con una longitud total de 3.917.339 pb, que es sustancialmente más corto que los cromosomas completos de E. coli en PATRIC (5,00 [4,96, 5,05] Mbp). Se utilizó la suite MOB para identificar plásmidos potenciales en el ensamblaje, sin embargo, la identificación final se realizó mediante el mapeo de los plásmidos de referencia17.

Creamos una alineación de SNP usando los genomas de E. coli de PATRIC y los genomas de Shigella usando Snippy (https://github.com/tseemann/snippy) con E. coli EC42405 (CP043414.1) como cepa de referencia. Los pares de bases no canónicas se reemplazaron con una N y las regiones recombinantes se eliminaron con gubbins55. Como el genoma antiguo contenía varias lagunas, el indicador "percentaje_filtro" se incrementó al 32 % para garantizar que no se excluyera el conjunto. Una vez que se identificaron y eliminaron los sitios de recombinación, se creó una filogenia de máxima probabilidad usando IQ-TREE 256. Se usó ModelFinder para seleccionar el modelo filogenético apropiado con sesgo de verificación57 y el árbol se reinició 1000 veces. Los genomas redundantes se eliminaron de la filogenia usando Treemmer asegurándose de retener el 95 % de la diversidad, medida por la longitud de la raíz a la punta, que arrojó 107 genomas58. Luego se creó una nueva alineación y filogenia de SNP utilizando estos genomas podados. Las cepas modernas se etiquetaron en función de los grupos filogenéticos de E. coli conocidos utilizando ClermonTyping59. Cuatro cepas de E. coli que se identificaron como parte de A se volvieron a etiquetar como posibles cepas de Shigella. Esto se debe a la presencia de un gen ipaH en dos de los genomas y su posicionamiento en la filogenia60.

Tras determinar el filogrupo del genoma antiguo, se utilizaron los genomas del subgrupo A0 E. coli para colocar cuidadosamente la cepa antigua dentro del mismo clado. Este subgrupo está definido por el genotipo Clermont (+ - - -)61. Otras siete cepas de E. coli enterotoxigénicas obtenidas de von Mentzer et al. 2014 también fueron incluidos en la filogenia62. Esta filogenia se creó con el mismo proceso mencionado anteriormente y se arraigó con IAI1 B1 (NC_011741.1). La filogenia de las cepas ST4995 se creó con los 22 genomas ST4995 disponibles en Enterobase18 y se enraizó utilizando la cepa ST325 CFSAN051544 (SAMN05414627). Para determinar si los datos contenían alguna firma temporal, se asignaron fechas de muestreo o fechas de secuenciación a la filogenia podada y se realizó una regresión de raíz a punta (RTT) para las filogenias global, subgrupo A0 y ST4995. Luego se evaluó la presencia de una señal temporal a través de una prueba de aleatorización de fechas y con TEMPest19. Se ajustó un reloj molecular a los datos usando un enfoque de datación de mínimos cuadrados usando LSD263,64.

La filogenia ST4995 datada se creó datando los árboles de arranque con LSD2 (usando -rl ns 1500000 como configuración)63. Luego, estos árboles se resumieron utilizando treeannotator65 con la altura de los nodos establecida por la media de la distribución de arranque. La filogenia resultante se usó luego para trazar la filogenia fechada con los intervalos de confianza de la altura del nodo incluidos.

Para determinar qué genes estaban presentes en la cepa antigua, convertimos las profundidades de lectura del pangenoma antiguo de E. coli en una métrica de presencia/ausencia de genes (P/A). Luego usamos un enfoque conservador, identificando un gen como presente si tenía una profundidad de secuencia promedio de al menos 10 × con un coeficiente de variación (CV) ≤1. Se usó un filtro CV para eliminar los genes que contenían regiones sustanciales de lecturas apiladas. En comparación con un umbral de cobertura porcentual, un CV es más permisivo con áreas no mapeadas si el resto de la cobertura de genes es relativamente consistente. Se usó un umbral adicional de \(\bar{x}+2* s\) para identificar genes con un alto número de copias. Si bien aún forman parte del genoma antiguo, estos genes podrían pertenecer potencialmente a plásmidos32 o representar la amplificación de genes66.

La matriz P/A para cepas modernas fue generada por Roary51. Se identificó un genoma central del 95 % de las cepas modernas y los genes que faltaban en nuestra cepa antigua se enviaron a STRING67 para que se anotaran funcionalmente mediante una red que consiste en interacciones de "alta confianza". Los factores de virulencia se identificaron utilizando un conjunto curado de genes de virulencia conocidos68. Los genes con nombres ambiguos (es decir, group_1000) se analizaron a través de blastX69 contra la base de datos de proteínas no redundantes RefSeq del 29 de noviembre de 2019 con un valor E máximo de 10-5 para determinar los candidatos. Si se encontraban múltiples aciertos para un gen, se seleccionaba el valor E más pequeño. Los empates se resolvieron eligiendo el gen con el bitcore más alto seguido del porcentaje de identidad más alto. Se requería un porcentaje mínimo de identidad del 90% para mantener una coincidencia y cambiar el nombre del gen ambiguo. Las descripciones de los genes previamente ambiguos se buscaron con las palabras clave "secreción, invasión y enterotoxina". Los genes con resultados de esta búsqueda se incluyeron con los genes de virulencia. Para determinar el patovar del genoma antiguo, se extrajo información relevante de los metadatos de PATRIC.

Realizamos un análisis P/A en el núcleo, los genomas accesorios y los genes de virulencia. Las cepas se transformaron en una matriz de distancia binaria y se agruparon utilizando un PCoA. Para garantizar que no se incluyeran genes redundantes, se crearon dos criterios de exclusión: se excluyeron los genes que estaban presentes de forma ubicua y se eliminaron del análisis del genoma accesorio los genes que no estaban presentes en al menos cinco genomas. De los 451 genomas de E. coli, cuatro se eliminaron del análisis pangenómico debido a los bajos recuentos de genes (consulte la Fig. 14 complementaria para los recuentos de genes y los Datos complementarios 1 para los genomas eliminados). El Identificador de genes de resistencia (RGI)29 con la configuración predeterminada identificó posibles resistencias a los antimicrobianos en la cepa antigua. Solo se aceptaron las entradas RGI devueltas debido a homologías de genes y presentes en el pan-genoma. Tanto los genes de virulencia como de resistencia identificados se compararon con la cepa arquetípica de E. coli K-12 MG1655. Es avirulento y sensible a los antibióticos70.

Diez ratones hembra OF1 de 14–16 g (4 semanas de edad) de Charles River® (L'Arbresle, Francia) por cepa recibieron una inyección subcutánea de 0,2 ml de suspensión bacteriana en el cuello (2 × 108 unidades formadoras de colonias) . El tiempo hasta la muerte se registró durante los siguientes 7 días. Los ratones que sobrevivieron más de 7 días se consideraron curados y sacrificados. La cepa de E. coli CFT073 se usó como control positivo matando a todos los ratones inoculados mientras que la cepa de E. coli K-12 MG1655 se usó como control negativo para el cual sobrevivieron todos los ratones inoculados26. El protocolo (n∘APAFIS#4948) fue aprobado por el Ministerio de Investigación francés y por el comité ético de experimentos con animales. La cepa ATCC11229 (AMC 198) se obtuvo de la colección del Institut Pasteur (CIP 103795) y se secuenció el genoma completo utilizando la tecnología Illumina para verificar la identidad de la cepa. Esta cepa es de origen comensal y se usa comúnmente en pruebas de resistencia bacteriana.

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de investigación de Nature vinculado a este artículo.

Los datos de secuenciación sin procesar se cargaron en NCBI como PRJNA810725 con metadatos de respaldo ubicados en la Tabla complementaria 1. El acceso a la muestra en sí se puede organizar poniéndose en contacto con GSL

Los scripts y los datos adicionales utilizados para analizar los datos después del mapeo pangenómico están disponibles en https://github.com/longg2/AncientEcoli71. Los scripts utilizados para el mapeo inicial y la creación pangenómica están disponibles en https://github.com/longg2/LongBioinformatics/tree/vAncEcoli72.

Duchêne, S., Ho, SY, Carmichael, AG, Holmes, EC & Poinar, H. La recuperación, interpretación y uso de genomas de patógenos antiguos. actual Biol. 30, R1215–R1231 (2020).

Artículo PubMed PubMed Central CAS Google Scholar

Parkins, MD, Somayaji, R. & Waters, VJ Epidemiología, biología e impacto de las infecciones clonales por Pseudomonas aeruginosa en la fibrosis quística. clin. Microbiol. Rev. 31, e00019-18 (2018).

Achermann, Y., Goldstein, EJ, Coenye, T. & Shirtliff, ME Propionibacterium acnes: de comensal a patógeno de implante asociado a biopelícula oportunista. clin. Microbiol. Rev. 27, 419–440 (2014).

Artículo PubMed PubMed Central Google Académico

Madera, JW et al. La paradoja osteológica: problemas de inferir la salud prehistórica a partir de muestras esqueléticas. actual antropopol. 33, 343–370 (1992).

Artículo Google Académico

Krause-Kyora, B. et al. Estudio de ADN antiguo revela locus de susceptibilidad HLA para la lepra en europeos medievales. Nat. común 9, 1–11 (2018).

Artículo CAS Google Académico

Wu, X. et al. Un linaje basal de S. enterica de 3.000 años de antigüedad de la Edad del Bronce de Xinjiang sugiere que se extendió a lo largo de la Proto-Ruta de la Seda. Patog de PLoS. 17, e1009886 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Wagner, DM et al. Yersinia pestis y la plaga de Justiniano 541-543 dC: un análisis genómico. Lanceta Infectada. Dis. 14, 319–326 (2014).

Artículo PubMed Google Académico

Tenaillon, O., Skurnik, D., Picard, B. & Denamur, E. La genética de poblaciones de comensal Escherichia coli. Nat. Rev. Microbiol. 8, 207–217 (2010).

Artículo CAS PubMed Google Académico

Croxen, MA & Finlay, BB Mecanismos moleculares de patogenicidad de Escherichia coli. Nat. Rev. Microbiol. 8, 26–38 (2010).

Artículo CAS PubMed Google Académico

Rojas-Lopez, M., Monterio, R., Pizza, M., Desvaux, M. & Rosini, R. Escherichia coli patógena intestinal: conocimientos para el desarrollo de vacunas. Frente. Microbiol. 9, 440 (2018).

Artículo PubMed PubMed Central Google Académico

Murray, CJ et al. Carga mundial de resistencia bacteriana a los antimicrobianos en 2019: un análisis sistemático. Lancet 399, 629–655 (2022).

Denamur, E., Clermont, O., Bonacorsi, S. & Gordon, D. La genética de poblaciones de Escherichia coli patógena. Nat. Rev. Microbiol. 19, 37–54 (2021).

Artículo CAS PubMed Google Académico

Fornaciari, G., Pollina, L., Tornaboni, D. & Tognetti, A. Patologías pulmonares y hepáticas en la serie de momias del s. domenico maggiore en nápoles (siglo xvi). En Proc. VII Reunión Europea de la Asociación de Paleopatología (Lyon, septiembre de 1988) 89–92. Marino Solfanelli Editore (Revista de Paleopatología, Publicaciones Monográficas, 1989).

Knab, LM, Boller, A.-M. & Mahvi, DM Colecistitis. Cirugía clin. am del norte Rev. 94, 455–470 (2014).

Artículo PubMed Google Académico

Venneman, NG & van Erpecum, KJ Patogenia de los cálculos biliares. Gastroenterólogo. clin. am del norte 39, 171–183 (2010).

Artículo Google Académico

Wood, DE, Lu, J. & Langmead, B. Análisis metagenómico mejorado con Kraken 2. Genome Biol. 20, 257 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Robertson, J. & Nash, JH MOB-suite: herramientas de software para la agrupación, reconstrucción y tipificación de plásmidos a partir de ensamblajes preliminares. Microbio. genoma 4, e000206 (2018).

Zhou, Z. et al. La guía del usuario de EnteroBase, con estudios de casos sobre transmisiones de Salmonella, filogenia de Yersinia pestis y diversidad genómica central de Escherichia. Genoma Res. 30, 138–152 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Rambaut, A., Lam, TT, Carvalho, LM & Pybus, OG Pybus Exploración de la estructura temporal de secuencias heterocrónicas usando TempEst (anteriormente Path-O-Gen). Evolución del virus. 2, vista007 (2016).

Lee, H., Popodi, E., Tang, H. & Foster, PL Tasa y espectro molecular de mutaciones espontáneas en la bacteria Escherichia coli según lo determinado por la secuenciación del genoma completo. proc. Academia Nacional. ciencia 109, E2774–E2783 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Touchon, M. et al. Los antecedentes filogenéticos y el hábitat impulsan la diversificación genética de Escherichia coli. PLoS Genet. 16, e1008866 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Russell, AB, Peterson, SB & Mougous, JD Efectores del sistema de secreción Tipo VI: venenos con un propósito. Nat. Rev. Microbiol. 12, 137–148 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Liu, B., Zheng, D., Jin, Q., Chen, L. & Yang, J. VFDB 2019: una plataforma de patogenómica comparativa con una interfaz web interactiva. Ácidos Nucleicos Res. 47, D687–D692 (2019).

Artículo CAS PubMed Google Académico

Morales-Espinosa, R. et al. Caracterización de cepas UPEC aisladas de pacientes mexicanos con infecciones urinarias recurrentes. J. infectar. desarrollo Pruebas. 10, 317–328 (2016).

Artículo CAS PubMed Google Académico

Aslani, MM, Alikhani, MY, Zavari, A., Yousefi, R. & Zamani, AR Caracterización de aislados clínicos enteroagregativos de Escherichia coli (EAEC) y su patrón de resistencia a los antibióticos. En t. J. infectar. Dis. 15, e136–e139 (2011).

Artículo CAS PubMed Google Académico

Johnson, JR y col. Letalidad experimental en ratones de aislamientos de Escherichia coli, en relación con rasgos accesorios, grupo filogenético y fuente ecológica. J. infectar. Dis. 194, 1141–1150 (2006).

Artículo CAS PubMed Google Académico

Johnson, JR y col. Los rasgos accesorios y los antecedentes filogenéticos predicen la virulencia extraintestinal de Escherichia coli mejor que la fuente ecológica. J. infectar. Dis. 219, 121–132 (2019).

CAS PubMed Google Académico

Galardini, M. et al. Papel principal de los sistemas de captación de hierro en la virulencia extraintestinal intrínseca del género Escherichia revelado por un estudio de asociación del genoma completo. PLoS Genet. 16, e1009065 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Alcock, BP et al. CARD 2020: vigilancia del resistoma antibiótico con la base de datos integral de resistencia a los antibióticos. Ácidos Nucleicos Res. 48, D517–D525 (2020).

CAS PubMed Google Académico

Goldstone, RJ & Smith, DG Un enfoque de genómica de poblaciones para explotar el 'resistoma' accesorio de Escherichia coli. Microbio. genoma 3, e000108 (2017).

Devault, AM et al. Un retrato molecular de la sepsis materna de la Troya bizantina. eLife 6, e20983 (2017).

Artículo PubMed PubMed Central Google Académico

Friehs, K. Número de copias del plásmido y estabilidad del plásmido. Adv. Bioch. Ing. Biotecnología. 86, 47–82 (2004).

Daubin, V., Lerat, E. & Perrière, G. La fuente de genes transferidos lateralmente en genomas bacterianos. Genoma Biol. 4, 1–12 (2003).

Artículo Google Académico

Chaudhuri, RR & Henderson, IR La evolución de la filogenia de Escherichia coli. Infectar. Gineta. Evol. 12, 214–226 (2012).

Artículo PubMed Google Académico

Desroches, M. et al. La odisea de la cepa ancestral Escherich a través de colecciones de cultivo: un ejemplo de diversificación alopátrica. mSphere 3, e00553-17 (2018).

Wang, M.-C. et al. Diferentes roles del huésped y factores bacterianos en las infecciones extraintestinales por Escherichia coli. clin. Microbiol. Infectar. 15, 372–379 (2009).

Artículo PubMed Google Académico

Benveniste, R. & Davies, J. Mecanismos de resistencia a antibióticos en bacterias. Ana. Rev. Bioquímica. 42, 471–506 (1973).

Artículo CAS PubMed Google Académico

Piddock, LJ ¿Bombas de eflujo multirresistentes? no solo por resistencia. Nat. Rev. Microbiol. 4, 629–636 (2006).

Artículo CAS PubMed Google Académico

Brook, I. Microbiología aeróbica y anaeróbica de la enfermedad del tracto biliar. J. Clin. Microbiol. 27, 2373–2375 (1989).

Artículo CAS PubMed PubMed Central Google Scholar

Schwarz, C. et al. Nuevos conocimientos a partir de huesos viejos: conservación y degradación del ADN en restos de mamut conservados en permafrost. Ácidos Nucleicos Res. 37, 3215–3229 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Dabney, J. et al. Secuencia completa del genoma mitocondrial de un oso de las cavernas del Pleistoceno Medio reconstruido a partir de fragmentos de ADN ultracortos. proc. Natl Acad Sci. EE. UU. 110, 15758–15763 (2013).

Glocke, I. y Meyer, M. Ampliación del espectro de secuencias de ADN recuperadas de huesos y dientes antiguos. Genoma Res. 27, 1230–1237 (2017).

Schubert, M., Lindgreen, S. y Orlando, L. AdapterRemoval v2: recorte rápido de adaptadores, identificación y combinación de lecturas. Resolución BMC. Notas 9, 88 (2016).

Artículo PubMed PubMed Central Google Académico

Renaud, G., Stenzel, U. y Kelso, J. leeHom: recorte y combinación de adaptadores para lecturas de secuenciación de Illumina. Ácidos Nucleicos Res. 42, e141–e141 (2014).

Artículo PubMed PubMed Central CAS Google Scholar

Schmieder, R. & Edwards, R. Control de calidad y procesamiento previo de conjuntos de datos metagenómicos. Bioinformática 27, 863–864 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Schneider, VA et al. La evaluación de GRCh38 y ensamblajes de genoma haploide de novo demuestra la calidad duradera del ensamblaje de referencia. Genoma Res. 27, 849–864 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Li, H. & Durbin, R. Alineación de lectura corta rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 25, 1754–1760 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Duggan, AT et al. El virus de la viruela del siglo XVII revela la historia reciente de la viruela. actual Biol. 26, 3407–3412 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Wattam, AR et al. Mejoras a PATRIC, la base de datos de bioinformática totalmente bacteriana y el centro de recursos de análisis. Ácidos Nucleicos Res. 45, D535–D542 (2016).

Artículo PubMed PubMed Central CAS Google Scholar

Seemann, T. Prokka: anotación rápida del genoma procariótico. Bioinformática 30, 2068–2069 (2014).

Artículo CAS PubMed Google Académico

Página, AJ et al. Roary: análisis rápido a gran escala del genoma pan de procariotas. Bioinformática 31, 3691–3693 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Jónsson, H., Ginolhac, A., Schubert, M., Johnson, PL y Orlando, L. mapDamage2.0: estimaciones bayesianas aproximadas rápidas de los parámetros de daño del ADN antiguo. Bioinformática 29, 1682–1684 (2013).

Artículo PubMed PubMed Central CAS Google Scholar

Seguin-Orlando, A. et al. Ninguna característica genómica particular sustenta las dramáticas consecuencias económicas de las epidemias de peste del siglo XVII en Italia. iScience 24, 102383 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Nurk, S. et al. Ensamblaje de genomas y mini-metagenomas a partir de lecturas altamente quiméricas. En Conferencia Internacional Anual sobre Investigación en Biología Molecular Computacional (Springer, 2013).

Croucher, NJ y col. Análisis filogenético rápido de grandes muestras de secuencias del genoma completo bacteriano recombinante utilizando gubbins. Ácidos Nucleicos Res. 43, e15–e15 (2015).

Artículo PubMed CAS Google Académico

Minh, BQ et al. IQ-TREE 2: nuevos modelos y métodos eficientes para la inferencia filogenética en la era genómica. mol. Biol. Evol. 37, 1530-1534 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Kalyaanamoorthy, S., Minh, BQ, Wong, TK, Von Haeseler, A. y Jermiin, LS Modelfinder: selección rápida de modelos para estimaciones filogenéticas precisas. Nat. Métodos 14, 587–589 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Menardo, F. et al. Treemmer: una herramienta para reducir grandes conjuntos de datos filogenéticos con una pérdida mínima de diversidad. BMC Bioinformática 19, 1–8 (2018).

Artículo Google Académico

Beghain, J., Bridier-Nahmias, A., Le Nagard, H., Denamur, E. y Clermont, O. Clermontyping: un método in silico preciso y fácil de usar para la filotipificación de cepas del género Escherichia. Microbio. genoma 4, e000192 (2018).

Hazen, TH et al. Investigar la relación de Escherichia coli enteroinvasiva con otros aislados de E. coli y Shigella mediante el uso de genómica comparativa. Infectar. inmune 84, 2362–2371 (2016).

Clermont, O., Christenson, JK, Denamur, E. & Gordon, DM Revisión del método de tipificación filosófica de Escherichia coli de Clermont: mejora de la especificidad y detección de nuevos filogrupos. Reinar. Microbiol. Rep. 5, 58–65 (2013).

Artículo CAS PubMed Google Académico

von Mentzer, A. et al. Identificación de clados enterotoxigénicos de Escherichia coli (ETEC) con distribución global a largo plazo. Nat. Gineta. 46, 1321 (2014).

Artículo CAS Google Académico

To, T.-H., Jung, M., Lycett, S. & Gascuel, O. Citas rápidas utilizando criterios y algoritmos de mínimos cuadrados. sist. Biol. 65, 82–97 (2016).

Artículo CAS PubMed Google Académico

Duchene, S. et al. Inferir parámetros demográficos en datos genómicos bacterianos utilizando métodos filogenéticos híbridos y bayesianos. BMC Evol. Biol. 18, 1–11 (2018).

Artículo Google Académico

Suchard, MA et al. Integración de datos filogenéticos y filodinámicos bayesianos utilizando BEAST 1.10. Evolución del virus. 4, vey016 (2018).

Artículo PubMed PubMed Central Google Académico

Riehle, MM, Bennett, AF & Long, AD Arquitectura genética de adaptación térmica en Escherichia coli. proc. Academia Nacional. ciencia EE. UU. 98, 525–530 (2001).

Artículo CAS PubMed PubMed Central Google Scholar

Szklarczyk, D. et al. STRING v11: redes de asociación proteína-proteína con mayor cobertura, que respaldan el descubrimiento funcional en conjuntos de datos experimentales de todo el genoma. Ácidos Nucleicos Res. 47, D607–D613 (2019).

Artículo CAS PubMed Google Académico

de Lastours, V. et al. Mortalidad en infecciones del torrente sanguíneo por Escherichia coli: la resistencia a los antibióticos todavía no lo hace. J. Antimicrobiano. Quimioterapia. 75, 2334–2343 (2020).

Artículo PubMed CAS Google Académico

Camacho, C. et al. BLAST+: arquitectura y aplicaciones. BMC Bioinformática 10, 421 (2009).

Artículo PubMed PubMed Central CAS Google Scholar

Touchon, M. et al. La dinámica del genoma organizado en las especies de Escherichia coli da como resultado caminos adaptativos muy diversos. PLoS Genet. 5, e1000344 (2009).

Artículo PubMed PubMed Central CAS Google Scholar

largog2. longg2/AncientEcoli: versión publicada. Zenodo https://doi.org/10.5281/zenodo.6403348 (2022).

largog2. longg2/LongBioinformatics: versión antigua de Ecoli. Zenodo https://doi.org/10.5281/zenodo.6403351 (2022).

Descargar referencias

Nos gustaría agradecer a Wael Elhenawy y Brian Coombes por su correspondencia, así como a Sara Dion por su asistencia técnica con el modelo de ratón. El financiamiento para este trabajo fue respaldado por SSHRC Insight Grant, financiamiento de investigación del programa humano y microbioma de CIFAR y Boris Family Fund para HP, así como la subvención NSERC RGPIN-2020-05733 otorgada a GBG Este trabajo también fue parcialmente respaldado por el "Fondation pour la Recherche Médicale" Equipe FRM 2016, número de subvención DEQ20161136698 a ED

Estos autores contribuyeron igualmente: George S. Long, Jennifer Klunk.

Departamento de Biología, Universidad McMaster, Hamilton, Canadá

George S. Long, Jennifer Klunk y G. Brian Golding

Centro McMaster de ADN Antiguo, Departamentos de Antropología y Bioquímica, Universidad McMaster, Hamilton, Canadá

George S. Long, Jennifer Klunk, Ana T. Duggan, Madeline Tapson y Hendrik Poinar

Daicel Arbor Biosciences, 5840 Interface Drive, Suite 101, Ann Arbor, MI, 48103, EE. UU.

Jennifer Klunk y Madeline Tapson

Departamento de Antropología, Universidad McMaster, Hamilton, ON, Canadá

Ana T. Duggan

División de Paleopatología, Departamento de Investigación Traslacional y Nuevas Tecnologías en Medicina y Cirugía, Universidad de Pisa, Via Roma 57, 56126, Pisa, Italia

valentina giuffra

Departamento de Ciencias Humanísticas (DISUM), Universidad de Catania, Piazza Dante 32, 95124, Catania, Italia

Lavinia Gazze

Departamento de Civilizaciones y Formas de Conocimiento, Universidad de Pisa, Via Trieste 40, 56126, Pisa, Italia

Antonio Fornaciari y Gino Fornaciari

Departamento de Microbiología e Inmunología, Instituto Peter Doherty para Infecciones e Inmunidad, Universidad de Melbourne, Melbourne, VIC, Australia

Sebastián Duchene

Universidad de la Cité de París, IAME, UMR 1137, INSERM, 75018, París, Francia

Olivier Clermont y Erick Denamur

Laboratorio de Genética Molecular, Hospital Bichat, APHP, 75018, París, Francia

Erick Denamur

Michael G. DeGroote Institute for Infectious Disease Research and CIFAR Humans and the Microbiome Program, Toronto, ON, Canadá

Hendrik Poinar

CIFAR Humans and the Microbiome Program, Toronto, ON, Canadá

Hendrik Poinar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

GSL y JK fueron responsables de la investigación, la metodología, el análisis formal y el borrador original de este estudio. GSL también realizó la curación de datos. MT, ATD, VG, LG y AF ayudaron en la investigación. ATD también contribuyó a la metodología. GF proporcionó la muestra. ED y OC validaron la función de E. coli y los resultados de tipificación. ED también proporcionó fondos para el ensayo de sepsis en ratones. SD validó la señal temporal y ayudó en su investigación. GBG supervisó y proporcionó recursos informáticos y financiación. HP concibió y administró el proyecto, proporcionó financiamiento y también lo supervisó. Todos los autores aprovaron el manuscrito final.

Correspondencia a George S. Long, Erick Denamur o Hendrik Poinar.

Los autores declaran no tener conflictos de intereses.

Communications Biology agradece a los revisores anónimos por su contribución a la revisión por pares de este trabajo. Editor principal de manejo: Luke R. Grinham. Los informes de los revisores están disponibles.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Long, GS, Klunk, J., Duggan, AT et al. Un borrador del genoma de Escherichia coli del siglo XVI asociado con una infección biliar oportunista. Comun Biol 5, 599 (2022). https://doi.org/10.1038/s42003-022-03527-1

Descargar cita

Recibido: 01 Marzo 2022

Aceptado: 23 de mayo de 2022

Publicado: 16 junio 2022

DOI: https://doi.org/10.1038/s42003-022-03527-1

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.