Jul 22, 2023
ロービングメチルトランスフェラーゼはモザイクエピジェネティックランドスケープを生成し、Bacteroides fragilis グループの進化に影響を与える
Nature Communications volume 14、記事番号: 4082 (2023) この記事を引用 3810 アクセス数 41 Altmetric Metrics の詳細 細菌内で 3 種類の DNA メチル修飾が検出されました
Nature Communications volume 14、記事番号: 4082 (2023) この記事を引用
3810 アクセス
41 オルトメトリック
メトリクスの詳細
3 種類の DNA メチル修飾が細菌ゲノムで検出されており、機構研究により、ファージ防御から病原性の転写制御および宿主と病原体相互作用に至るまでの生理学的機能における DNA メチル化の役割が実証されています。 メチルトランスフェラーゼは遍在し、考えられるメチル化パターンは非常に多様であるにもかかわらず、エピゲノムの多様性はほとんどの細菌種で未解明のままです。 バクテロイデス フラジリス グループ (BFG) のメンバーは、共生コミュニティの主要な役割としてヒトの消化管に存在しますが、多剤耐性がますます高まっている嫌気性感染を確立することもあります。 この研究では、ロングリードシーケンス技術を利用して、NIH臨床センターで40年以上観察された感染症から培養された臨床BFG分離株のパンゲノム(n = 383)およびパネピゲノム(n = 268)分析を実行します。 私たちの分析により、単一のBFG種には数百のDNAメチル化モチーフが含まれており、個々のモチーフの組み合わせのほとんどは単一の分離株で独自に発生しており、BFGエピゲノム内でサンプリングされていない膨大なメチル化の多様性が示唆されていることが明らかになりました。 BFGゲノムのマイニングにより、6000を超えるメチルトランスフェラーゼ遺伝子が同定され、そのうち約1000は無傷のプロファージに関連していた。 ネットワーク解析により、異種ファージゲノム間の実質的な遺伝子流動が明らかになり、BFG エピゲノム多様性を推進する究極の源の 1 つとして BFG ファージ間の遺伝子交換の役割が示唆されました。
ゲノム DNA のメチル化は、細胞生命の 3 つのドメインすべておよびウイルスで検出されています 1、2、3。 真核生物のゲノムは、特定の CpG (5'-CG-3') コンテキスト内の C5 位 (5mC) でシトシンの動的メチル化を示し、特定の部位でのこの CpG メチル化の制御は、転写 4、ゲノム修復ダイナミクス、およびゲノム圧縮 5 に影響を与えます。 対照的に、細菌はモチーフ特異的な DNA メチル化 (例、5'-CC-6mA-TGG-3') を示し、特定のモチーフのほぼすべてのインスタンスがメチル化されている可能性があります 6。 真核生物のゲノムと同様に、5mC 修飾が一般的です。 ただし、細菌ゲノムでは、シトシンの N4 位置 (4mC)、および最も一般的にはアデニンの N6 位置 (6mA) で追加のメチル化が見られます。 細菌のDNAメチル化はDNAメチルトランスフェラーゼによって行われ、その一部は特定の種のすべての菌株に存在し活性があると考えられますが(例、大腸菌のGATCを修飾するDam)、他のDNAメチルトランスフェラーゼおよびそれらをコードする遺伝子は一時的に活性化されます。これらは時間の経過とともに得られたり失われたりするものであり、文化における生存には必須ではありません7。 古典的に、細菌の DNA メチル化は主に制限修飾システムに基づく抗ファージ防御の副産物として理解されてきました 8。 しかし、多くの場合数千の遺伝子座でメチル化 DNA を維持することによる他の生理学的影響が明らかになりました。 研究では、真核生物系での観察と同様に、毒性表現型9、10、11およびその他の生理学的プログラム12、13、ゲノム安定性14、15、およびメチル化モチーフ内の変異頻度への影響16、17を制御する転写活性の調節における細菌DNAメチル化の役割が実証されている。
バクテロイデス フラジリス グループ (BFG) の細菌は、バクテロイデス属、パラバクテロイデス属、および最近導入されたフォカエイコラ属の十数種に相当します18。 これらの豊富な共生生物は、人間の消化管内で嫌気的に生息しているのを容易に見つけることができ、多くの重要な代謝および免疫機能に関与していると考えられています 19,20,21。 また、これらは腸外嫌気性感染から最も一般的に回収される細菌の 1 つであり、セファロスポリンやカルバペネムを含む多くの抗生物質に対する耐性が高まっています 22,23。 それらの幅広い表現型の範囲は、部分的には、相変化、一連の多糖利用遺伝子座、および可逆プロモーターの使用によって可能になっています 24,25。
5 kb each) could be detected in assemblies (Supplementary Fig. 1C). The numbers of identified rRNA operons per circular chromosome corresponded to the expected values for the species in almost all cases based on data derived from the Ribosomal RNA Database27./p>20,000 sampled genes within the dataset, implying that an immense number of additional gene families await discovery within the BFG. This pangenome openness is largely consistent with gut-derived Bacteroides metagenome assembled genomes32./p>3 kb in length encoding only accessory genes, Supplementary Data 3) were extracted from 414 genomes representing 13 species for which three or more genomes were available (378 genomes from this study and 36 genomes from NCBI)33. Comparison of each accessory region sequence with all others in this set demonstrated that >10% of such regions were shared between species, suggesting horizontal transfer (Fig. 2c). Each accessory region was probed for a variety of features, and it was found that phage, phage defense systems, DNA methyltransferases, conjugative machinery, episomes/plasmids, and antimicrobial resistance (AMR) genes were all more common in accessory regions detected in three or more species (Fig. 2c). For instance, accessory regions encoding the tetracycline resistance gene tet(Q) and/or a cassette with genes tet(X)1, tet(X)2, and the aminoglycoside modifying enzyme aadS were detected in 12 of 13 species analyzed (Fig. 2 and Supplementary Fig. 4), likely confirming a history of selective pressure from tetracycline and aminoglycoside compounds./p>95% average nucleotide identity (see Methods) (Supplementary Fig. 5A). The majority of circular contigs (550 out 575; 95.7%) had recognizable plasmid genes such as replicases or relaxases (see Methods), and a proportion of the remainder may represent replicative intermediates of transposons, but this was not analyzed further. Despite the ubiquity of both plasmids/episomes and AMR genes in the sequencing data, we found that most of these AMR genes were not located on plasmids/episomes (53 out of 1911 AMR genes were located within circular plasmid/episome contigs) among BFG species. The overwhelming majority (>97.2%) of AMR genes appeared to be located within chromosomes, and many were associated with integrative elements23. Many of the AMR genes encoded by plasmids/episomes also appeared associated with integration of integrative elements into plasmid backbones, consistent with possible shuttling of AMR genes between chromosomes and plasmids/episomes (Supplementary Fig. 5B)./p>90% of genomes in a species, ‘Shell’ was defined as presence in >10% and ≤90% genomes in a species, and ‘Cloud’ was defined as presence in <10% of genomes in a species./p>90% amino acid identity to previously identified DNA methyltransferases. Interestingly, in the course of our analysis, we observed that within each species, there is a positive correlation between genome size and number of putative DNA methyltransferases (Supplementary Fig. 6). BFG-632 is the longest genome in the entire collection, consistent with the greatest number of methyltransferases./p> = 95 and AF > = 85 were counted. Note that accessory region sequences can often consist of multiple mobile genetic elements or genomic islands in tandem, and no attempt was made to separate individual elements within these regions with the exception of bacteriophages./p>50 copies per chromosome), and in some cases these high copy number plasmids/episomes were represented in lower copy number in companion libraries sequenced on the same flow cell. We assessed that this was likely library cross-contamination and to reduce the likelihood of artifactual assignment of plasmids/episomes to the incorrect library, we excluded circular contigs with coverage that was either 80% of the coverage value of the bacterial chromosome or less or if the coverage was less than 30-fold on average across the sequence. This may have resulted in an underestimate of the true number of plasmids/episomes. Furthermore, the Flye assembler occasionally artifactually assembles sequences as concatemers of two or more tandem copies. Each circular sequence was aligned to itself with BLASTN, and, if the total length of the alignment was greater than 140% of the total length of the sequence, the episome was trimmed down to one unit length to eliminate potential artifactual tandem duplications. To determine if the filtered sequences had plasmid-associated genes, each sequence was run through MOBsuite75 followed by RPS-BLAST against the CDD database76 with flags “ -evalue 1e-2 -seg yes”. Hits were then cross-checked against a list of models related to plasmid replicases, relaxases, conjugative machinery, integrases, and transposes (Supplementary Data 14). Also, Abricate was run as described above on each sequence. Plasmids/episomes were clustered into approximate operational taxonomic units (OTUs) using anicalc and aniclust from CheckV with flags “--min_ani 95 --min_tcov 85” (minimum ANI = 95%, minimum AF = 85%). The network graph was visualized in Cytoscape77./p>10 Tb). Requests for materials associated this work require a standard NIH Material Transfer Agreement with the NIH and U.S. Government. Requests for materials should be addressed to John Dekker at [email protected]./p>