Naure子刊:从复杂的菌群中生成谱系分辨率的、完整的宏基因组组装基因组

Nature Biotechnology [IF:54.908]
① 微生物群落可能包括密切相关生物的不同谱系,其使宏基因组组装复杂化并阻止完整宏基因组组装基因组 (MAGs) 的产生;② 作者表明使用长 (HiFi)读长结合 Hi-C 分箱的深度测序可以解决这一挑战;③ 为了解决密切相关的菌株(谱系),开发了 MAGPhase,它通过区分数百千碱基基因组序列中的变异单倍型来分离相关生物的谱系;④ 解析复杂菌群中密切相关的微生物的能力,提高了生物合成基因簇的鉴定以及将移动遗传元件分配给宿主基因组的精度。
【主编推荐语】本研究作者提出了一项原理验证研究,将 HiFi 测序应用于复杂菌群,使用来自寄生虫感染的羔羊的粪便样本的极深测序,并结合来自同一样本的 Hi-C 数据。作者记录并量化了具有 HiFi 读长的 MAGs 组装的改进,并提出了一种称为 MAGPhase 的计算方法来对这些 MAGs中的替代单核苷酸多态性 (SNP) 单倍型进行定相,以提供更精细的样本后代谱系变异分辨率。作者进一步表明,HiFi 组件极大地提高了将移动遗传元件分配给宿主基因组的精度,以及从宏基因组数据推断完整的生物合成基因簇。(@刘永鑫-中科院-宏基因组)
Generating lineage-resolved, complete metagenome-assembled genomes from complex microbial communities
2022-01-03, doi:10.1038/s41587-021-01130-z
延伸阅读: 【Nature Microbiology】

Nature子刊:使用mako快速灵活地分析关联的菌群数据

Nature Methods [IF:28.547]
① Mako 是一款将菌群数据和网络转化为图形数据库并将查询结果可视化的软件工具,从而允许没有编程知识的用户进行基于网络的查询;② Mako 附带一个数据库,该数据库由 60 项菌群研究汇编而成,其可以轻松地被扩展到用户自己的数据;③ Mako 软件支持将表格和其他文件格式上传到 Neo4j 数据库;④ 该软件包括命令行界面 (CLI)、图形用户界面 (GUI) 和 应用程序接口(API);⑤ Mako 工具箱仍有改进空间,比如其并没有充分发挥图数据库的潜力。
【主编推荐语】本研究,作者展示了 mako(微生物关联目录),其能够从菌群数据和元数据快速简单地构建网络数据库。Mako 通过基于语义网络本体的数据库模式提供标准菌群格式和 Neo4j 图数据库之间的接口,该软件包包括一系列与 Neo4j 数据库和基于模式的查询语言 Cypher 交互的方法,只需要基本的计算技能。此外,mako 包括一个 60 个从 QIITA6 下载的独立数据集衍生的精选数据库,QIITA6 是一个用于托管微生物研究的平台,有助于进行这种规模的宏分析。(@刘永鑫-中科院-宏基因组)
Fast and flexible analysis of linked microbiome data with mako
2021-12-09, doi:10.1038/s41592-021-01335-9

宁康等:利用同源序列解码菌群生态位关联,准确预测靶向蛋白结构

PNAS [IF:11.205]
① 作者提出了一个基于来自四个主要生物群落(肠道、湖泊、土壤和发酵罐)的 42.5 亿个菌群序列的 MetaSource 模型,以解码微生物生态位与蛋白质同源家族的内在联系;② 从单个 MetaSource 生物群系构建的具有多序列比对的微生物群靶向方法使用少于三倍以上的计算机内存和 CPU(中央处理单元)处理时间;③ “边际效应”分析表明,特定生物群落对补充不同 Pfam 家族的同源序列的影响大不相同;④ 其结果验证了重要的菌群-序列-Pfam 关联。
【主编推荐语】近期,华中科技大学宁康团队与合作者在PNAS发表研究。作者假设微生物生态位和蛋白质家族之间存在固有的进化联系,可用于构建精确的多序列比对(MSAs)。为了检验这个假设,作者建立了一个包含42.5亿个序列的四个主要生物群落的模型库,开发了一个名为MetaSource的机器学习模型来预测目标蛋白质的源生物群落,其可以显著提高联系图和3D结构模型的准确性,同时使用少于三倍以上的计算机内存和CPU时间。研究的结果验证了重要的生物组-序列-Pfam关联,这可以为基于菌群的蛋白质结构和功能预测的靶向方法提供更高的效率和有效性。(@刘永鑫-中科院-宏基因组)
Decoding the link of microbiome niches with homologous sequences enables accurately targeted protein structure prediction
2021-12-07, doi:10.1073/pnas.2110828118

细菌基因组和宏基因组中逆转录酶的鉴定和分类

Nucleic Acids Research [IF:16.971]
① 本研究构建了一个计算工具 myRT,其被用来识别和分类原核逆转录酶(RTs);② 其提供了有关每个RT的基因组邻域的信息,提供了潜在的功能线索;③ 作者应用该工具预测了所有完整和草图细菌基因组中的RTs,并创建一个可用于探索假定RTs及其相关蛋白质域的集合;④ 将myRT应用于宏基因组表明,与参考基因组的集合相比,肠道宏基因组按比例编码了更多与多样性生成逆转录元件 (DGRs) 相关的 RTs,数量超过与逆转录相关的RTs。
【主编推荐语】目前缺乏用于表征和分类逆转录酶 (RTs) 的工具,本研究中,作者提供了第一个用于预测细菌 RTs 及其类别的工具 myRT,并伴随着基因组邻域信息和可视化。MyRT 既可作为独立软件 (https://github.com/mgtools/myRT) 使用,也可通过网站 (https://omics.informatics.indiana.edu/myRT/) 使用,且通过 https://omics.informatics.indiana.edu/myRT/ 上的 myRT 网络服务器可以轻松访问作者在所有完整细菌基因组中预先计算的假定 RTs 集合。参考基因组和选定宏基因组中的 RTs 预测可在https://omics.informatics.indiana.edu/myRT/collection.php上获得。(@刘永鑫-中科院-宏基因组)
Identification and classification of reverse transcriptases in bacterial genomes and metagenomes
2021-12-14, doi:10.1093/nar/gkab1207

宏基因组测序对微生物生长动态的准确和稳健推断揭示了个性化的生长速率

Genome Research [IF:9.043]
① 作者提供的理论表明,无论潜在的动态模型如何,峰谷比 (PTRs)都能测量DNA合成速率和生成时间;② 作者为PTRs推导出了两个估计量,一个用于完整参考基因组,一个用于组装草图;③ 作者将其估算器组合在一个名为 CoPTR(Compute PTR)的易于使用的工具中;④ CoPTR为其用户提供了大量的文档、教程和预先计算的参考数据库;⑤ 作者证明 CoPTR 比当前最先进的技术更准确,并以对炎症性肠病研究的 1304 个宏基因组样本数据集的大规模应用得出结论。
【主编推荐语】本研究中,作者介绍了 CoPTR(Compute PTR):一种从完整的参考基因组和组装计算峰谷比 (PTRs)的工具。CoPTR 比当前最先进的技术更准确,同时总体上也提供了更多的 PTR 估计,作者进一步发展其理论,形成了PTRs的生物学解释。作者展示了 PTR 如何与相对丰度和代谢组学相结合,以研究它们对菌群的影响。总之,作者的研究表明,PTRs可以为研究群落相互作用、将多组测量与菌群联系起来,以及研究菌群动态与疾病之间的关系提供新的方法。(@刘永鑫-中科院-宏基因组)
Accurate and robust inference of microbial growth dynamics from metagenomic sequencing reveals personalized growth rates
2022-01-05, doi:10.1101/gr.275533.121

单基因长读长测序阐明了人类肠道菌群中的大肠杆菌菌株动态

Cell Reports [IF:9.423]
① 鞭毛蛋白基因是描绘菌群菌株水平组成的良好标记,作者设计了一个方案,通过鞭毛蛋白基因的扩增子测序来识别具有高分辨率和高数量的选定物种中的菌株;② 作者将该方案应用于一项针对大肠杆菌的人类饮食试验的粪便样本,发现大肠杆菌在人体肠道中具有动态而复杂的种群结构;③ 在人类肠道中,主要的大肠杆菌菌株伴随着许多卫星菌株;④ 基于鞭毛蛋白基因的方法可被用于潜在的病原体检测和追踪。
【主编推荐语】肠道菌群因其与健康和疾病的密切关系而备受关注。细菌的基因含量通常不同,导致物种内的功能变异,因此,在生态学和临床意义上,需要比物种水平方法更高的分辨率。本研究中,作者使用高度多样化的细菌鞭毛蛋白基因作为长读长测序中的标记,开发了一种以高分辨率分析菌群中菌株组成的方案,并阐明了人类肠道中详细的种群结构和主要的大肠杆菌菌株更新。(@刘永鑫-中科院-宏基因组)
Single-gene long-read sequencing illuminates Escherichia coli strain dynamics in the human intestinal microbiome
2022-01-11, doi:10.1016/j.celrep.2021.110239

IMG/VR v3:一个用于查询未培养病毒基因组的综合生态和进化框架

Nucleic Acids Research [IF:16.971]
① IMG/VR v3是目前公开的最大的病毒基因组集合,总共有2,332,702个基因组;② IMG/VR UViGs(未培养的病毒基因组)使用IMG管道进行功能注释,并使用新的CheckV工具评估其质量;③ IMG/VR UViGs的病毒分类现在反映了最新的ICTV框架,并根据与培养物基因组和宏基因组组装的基因组的序列相似性以及与预测的CRISPR间隔的匹配性提供计算机宿主预测;④ 一个重新设计的界面允许使用序列或注释查询,快速和直观地浏览和搜索IMG/VR数据库。
【主编推荐语】本研究中,作者提出了IMG/VR的第三个版本,其由18,373个培养的病毒基因组和2,314,329个未培养的病毒基因组(UViGs)组成,与之前的版本相比,序列总数几乎增加了两倍。新的IMG/VR界面使用户能够根据基因组特征和/或序列相似度有效地浏览、搜索和选择UViG。IMG/VR v3可在 https://img.jgi.doe.gov/vr 登入,基础数据可在 https://genome.jgi.doe.gov/portal/IMG_VR 下载,完整的 IMG/VR 数据库可在 https://genome.jgi.doe.gov/portal/pages/dynamicOrganismDownload.jsf?organism=IMG_VR 上下载。(@刘永鑫-中科院-宏基因组)
IMG/VR v3: an integrated ecological and evolutionary framework for interrogating genomes of uncultivated viruses
2021-01-08, doi:10.1093/nar/gkaa946
延伸阅读: 【宏基因组】

吉林大学团队开发了基于深度学习方法的宏基因组病毒序列分类方法Virtifier

Bioinformatics [IF:6.937]
① Virtifier是一种基于深度学习的用于识别宏基因组数据中病毒序列的分类器;② 它包括一个名为Seq2Vec的核苷酸序列编码方法和一个带有基于注意力的长-短期记忆(LSTM)网络的病毒序列预测器;③ Seq2Vec利用一个经过充分训练的嵌入矩阵来编码密码子,它可有效地提取核苷酸序列中密码子之间的相互关系;④ 与注意层相结合,LSTM神经网络可进一步分析密码子关系并筛选对最终特征有贡献的部分;⑤ Virtifier能够准确地识别宏基因组中的短病毒序列。
【主编推荐语】为了进一步提高从宏基因组数据中识别短病毒序列的性能,本文提出了一种基于深度学习的方法Virtifier。Virtifier在CAMI数据集和真实人体肠道宏基因组中的应用证明,它在识别长度小于500bp的病毒序列方面优于VirFinder、DeepVirFinder和PPR Meta。宏基因病毒序列检测是病毒分析的第一步,它对接下来的病毒分析工作有重大影响。Virtifier将在病毒分类和病毒性疾病检测领域发挥重要作用。Github上提供了Virtifier的Python实现和为本研究开发的Python代码 https://github.com/crazyinter/Seq2Vec 。(@刘永鑫-中科院-宏基因组)
Virtifier: a deep learning-based identifier for viral sequences from metagenomes
2021-12-15, doi:10.1093/bioinformatics/btab845
延伸阅读: 【宏基因组】
顾爱华等NC突破:胆结石背后的“坏”肠菌
本期话题:胆结石,母体菌群,抗生素耐药,药物-菌群互作,FMT,便秘,胆汁酸代谢,尿酸,大肠癌,饮食
2022-01-14
郑钜圣等GUT:深度解析1244名中老年人肠道真菌
本期话题:肠道真菌组,肥胖,生物素,肠道细菌目录,新冠,益生菌,胃癌,枸杞,SCFA,植物次生代谢物
2022-01-13
Cell等5文聚焦:多视角剖析肠屏障修复
本期话题:肠上皮,组织修复,IBD,肠内分泌细胞,平滑肌,IL-1β,外膜囊泡,噬菌体,肿瘤,丙酸
2022-01-12
胃肠顶刊重量级综述2文:困扰1%世人的乳糜泻
本期话题:乳糜泻,IBD,移植物抗宿主病,菌群-免疫互作,口腔菌群,CXCL9,海藻多糖,蜜蜂
2022-01-11
再有300万人数据强烈提示:肠镜查癌,45岁前要去做!
本期话题:结肠镜筛查,新辅助放化疗,CD8+ T细胞浸润,N6甲基腺苷阅读器,anti-PD-1,RNA结合蛋白,自噬和菌群,免疫化疗,代谢谱
2022-01-10
低聚果糖调免疫/抗氧化?总结20年进展的综述来了
本期话题:孟德尔随机化,膳食纤维,膳食热量,胆固醇,低聚果糖,植物性膳食,DASH,添加糖,维生素D
2022-01-09
痛风怎么办?医学顶刊指南&综述3连发,系统更新认知!
本期话题:痛风,代谢,益生菌,脂肪肝病,膳食纤维,生物能,IBS
2022-01-08
靶向菌群?60分Nature综述子刊详解5大方法
本期话题:菌群疗法,荧光探针,工程菌,生物转化,居住环境,寄生虫感染,药物-菌群互作,低盐饮食,益生元
2022-01-07
黄秀娟等GUT:调节菌群,或治脱发!
本期话题:脱发,抗菌肽,1型糖尿病,菌群传播,艰难梭菌,抗病毒免疫,锌,基因调控,低聚半乳糖
2022-01-06
张涛/贾慧珏等Nature子刊:血液代谢物与肠菌的因果关系
本期话题:孟德尔随机化,非洲人类微生物组,婴儿菌群,合成群落,生活方式干预,FMT,益生菌
2022-01-05