估计阅读时长: < 1 分钟环境中的微生物往往以复杂群落的形式存在,不同物种之间通过代谢相互作用形成协同或竞争关系,共同完成生物地球化学循环、维持生态系统功能。近年来,随着高通量基因组测序技术的发展,研究者可以从环境样本中获取海量微生物基因组数据,为构建基因组尺度代谢模型(Genome-scale metabolic models, GEMs)提供了基础。GEMs将微生物的全基因组注释与生化反应网络相结合,可以用于模拟微生物在特定环境条件下的代谢能力,预测其生长和代谢产物。在单菌株层面,GEMs已被广泛用于解析微生物对环境变化的代谢适应机制、指导代谢工程设计以及预测药物靶点等。在群落层面,通过将多个GEMs耦合,可以研究微生物之间的相互作用,例如通过代谢物交换实现的协同或竞争关系。 环境微生物基因组数据源困境 GEMs在系统生物学领域已发展成熟,成为连接基因型与表型的桥梁。在环境微生物研究中,GEMs的应用日益广泛,其优势在于能够量化微生物在不同环境条件下的代谢能力,并预测基因扰动或环境变化对群落功能的影响。 然而,构建环境微生物群落的GEM模型面临一个关键挑战:如何选择注释GEMs模型所使用的微生物基因组数据。对于在自然环境中的微生物往往经历基因组精简(streamlining)而丢失某些代谢途径导致一些代谢能力的丧失,很多自然界中的细菌都是高度的营养缺陷型(auxotrophy)。比如海洋浮游细菌往往丢失多种氨基酸或维生素合成途径,必须依赖其他微生物提供缺失的代谢产物才能生存。这种现象在各类环境中普遍存在,包括海洋、土壤和人体肠道等。 对于在NCBI GenBank数据库中所记录的微生物基因组数据这些大量高质量基因组,本身就是在相对富集/可控的实验条件下获得的,很多是“实验室驯化过”的株。这些株的基因组确实能支持在实验室培养基里独立生长,但这不代表它们在原始环境中也独立。如果直接使用NCBI上的完整基因组数据来构建环境微生物的GEM模型,就会忽略这些微生物在自然界中的真实代谢局限,导致模型预测出现偏差。例如,模型可能高估了微生物的独立生存能力,低估了物种间代谢互作的必要性。这种数据来源误差会影响对环境群落稳定性和功能的正确理解。 交叉喂养网络在环境菌群GEM建模中的作用 为了解决上述问题,近年来研究者开始关注交叉喂养网络(cross-feeding network)在环境菌群GEM建模中的作用。交叉喂养是指不同微生物通过代谢物的交换实现互利共生,例如一种微生物分泌某种代谢产物,另一种微生物利用该产物作为营养来源。这种代谢互作是群落稳定性和多样性的重要驱动力。在GEM建模中,可以通过模拟多个物种的共培养模型来预测哪些代谢物在物种间交换,以及这些交换如何影响群落结构和代谢输出。 环境微生物的营养缺陷现象普遍存在 研究发现,在自然环境中,微生物的基因组大小往往与营养需求呈负相关:基因组越小的菌株,合成必需营养(如氨基酸、维生素)的能力越弱,越依赖外部提供。例如,对波罗的海表层水体微生物群落的培养研究表明,当培养物中物种数超过3种时,群落中包含的微生物基因组更小,合成氨基酸和B族维生素的能力更低。这意味着这些微生物在实验室纯培养时难以生长,必须依赖共培养的其他微生物提供缺失的营养才能存活。在这里,假若我们直接使用NCBI上通过纯培养后的菌株测序结果构建GEM模型,就会忽略这种营养依赖,导致模型高估微生物的独立生长能力。 交叉喂养网络与群落Gap Filling […]
Recent Posts
Archives
- December 2025 (10)
- November 2025 (2)
- October 2025 (1)
- August 2025 (3)
- July 2025 (2)
- June 2025 (6)
- May 2025 (3)
- November 2023 (1)
- June 2023 (2)
- May 2023 (2)
- April 2023 (2)
- March 2023 (2)
- February 2023 (1)
- August 2022 (2)
- July 2022 (2)
- June 2022 (5)
- May 2022 (5)
- April 2022 (4)
- March 2022 (3)
- January 2022 (2)
- December 2021 (2)
- November 2021 (2)
- October 2021 (6)
- September 2021 (8)
- August 2021 (8)
- July 2021 (6)
- June 2021 (20)
- May 2021 (10)
Tags
algorithm (33)
bilibili (3)
binary tree (3)
clustering (19)
contour (3)
Darwinism (4)
dataframe (3)
data visualization (23)
dotnet-core (25)
GCModeller (20)
gdi+ (23)
gem (7)
ggplot (14)
graph (14)
heatmap (5)
http (4)
image processing (7)
kegg (7)
kmeans (3)
language (7)
linq (3)
linux (8)
machine learning (4)
mass spectrometry (12)
math (19)
metagenomics (5)
MSI (4)
mzkit (19)
network (8)
pathway (4)
pipeline (4)
query (5)
R# (44)
rsharp (23)
scripting (14)
single-cell (6)
sql (3)
symbolic computation (3)
text processing (4)
typescript (3)
ubuntu (4)
uniprot (3)
vb (19)
VisualBasic (50)
webassembly (3)

[…] 在前面写了一篇文章来介绍我们可以如何通过KEGG的BHR评分来注释直系同源。在KEGG数据库的同源注释算法中,BHR的核心思想是“双向最佳命中”。它比简单的单向BLAST搜索(例如,只看你的基因A在数据库里的最佳匹配是基因B)更为严格和可靠。在基因注释中,这种方法可以有效减少因基因家族扩张、结构域保守等原因导致的假阳性注释,从而更准确地识别直系同源基因,而直系同源基因通常具有相同的功能。在今天重新翻看了下KAAS的帮助文档之后,发现KAAS系统中更新了下面的Assignment score计算公式: […]
不常看到, 没有多余矫饰的表达。敬意。
[…] 在前面写了一篇文章来介绍我们可以如何通过KEGG的BHR评分来注释直系同源。在今天重新翻看了下KAAS的帮助文档之后,发现KAAS系统中更新了下面的Assignment score计算公式: […]
thanks for your comment
What's up, this weekend is nice designed for me, for the reason that this moment i am reading this great…