我是一位国产工业软件开发者

Mzkit桌面工作站

Mzkit工作站软件主要是应用于基于核磁共振/质谱数据的化学信息学方面的CAE(计算机辅助工程与计算机辅助分析)数据分析功能。目前已完成对质谱数据以及NMR数据的支持。目前的研发投入主要集中在质谱成像相关功能以及定量计算分析等分析化学相关的功能研发。

Mzkit目前为一款诺米代谢向大家所提供的免费开源的质谱数据分析软件

Latest Articles

我目前所从事的工作是在国内的一家比较大的代谢组学服务公司的高级数据科学家,主要从事一些使用VisualBasic.NET,R/R#语言进行数据科学相关的分析脚本以及流程编写开发工作。如果你对我自己模仿R语言所创建的R#语言做数据分析感兴趣的话,我这个博客网站目前是你进行R#语言学习的最好选择。

估计阅读时长: < 1 分钟MSA(多序列比对)在生物信息学中的核心目标是:通过把多条同源序列“对齐”,来突出它们之间的相似与差异,从而帮助我们:识别保守区/功能位点、推断进化关系(系统发生)、预测或解释蛋白质/核酸结构、发现共进化与功能模块,以及为后续分析(如模体搜索、结构建模、从头设计等)提供基础。基于多序列比对分析,我们可以通过这种算法,把一堆表面看上去“乱糟糟”的序列,整理成一个可以“逐位点比较”的框架。基于我们所得到的这个框架基础,我们可以进行下游的后续分析,例如: 识别哪些部分是“不能动”的(功能/结构核心); 推断它们是如何“进化而来”的(系统发生); 推测它们在空间中“长什么样”(结构预测与建模); 找出哪些部分“一起变化”(共进化与功能耦合); 并把这些信息封装成模型(HMM、profile)用于大规模搜索与注释。 Attachments MSA • 174 kB • 15 click 2026年1月8日
估计阅读时长: 16 分钟KEGG 里面目前并没有“现成的每个 KO 一条代表性序列 FASTA”这种官方序列数据库,假若我们需要基于KEGG数据库中的KO信息的注释,那我们一般会需要自己从 KEGG GENES 里面把每个 KO 对应的基因/蛋白序列抓出来,再按 KO 编号组织成 fasta 集合构建出对应的数据库。基于所建立好的KEGG基因序列数据库,我们就可以实现下面的一些基因注释工作: 在全基因组规模代谢网络重建工作中,进行我们的目标基因组中的代谢网络中的酶节点的直系同源推断,从而将我们的目标基因组中的基因映射到具体的KEGG代谢网络上的节点位置,从而重建出代谢网络模型(使用带有KO编号的蛋白序列做比对注释) 假若我们在进行宏基因组的基因丰度的计算,则可以基于所建立的KEGG基因序列数据库作为参考库,进行宏基因组测序数据中的KO基因丰度的计算(使用带有KO编号的基因序列做比对注释) Attachments KO-db_vscode • 138 […]
估计阅读时长: < 1 分钟环境中的微生物往往以复杂群落的形式存在,不同物种之间通过代谢相互作用形成协同或竞争关系,共同完成生物地球化学循环、维持生态系统功能。近年来,随着高通量基因组测序技术的发展,研究者可以从环境样本中获取海量微生物基因组数据,为构建基因组尺度代谢模型(Genome-scale metabolic models, GEMs)提供了基础。GEMs将微生物的全基因组注释与生化反应网络相结合,可以用于模拟微生物在特定环境条件下的代谢能力,预测其生长和代谢产物。在单菌株层面,GEMs已被广泛用于解析微生物对环境变化的代谢适应机制、指导代谢工程设计以及预测药物靶点等。在群落层面,通过将多个GEMs耦合,可以研究微生物之间的相互作用,例如通过代谢物交换实现的协同或竞争关系。 Attachments The-taxonomic-composition-of-various-type-samples-and-the-results-of-neutral-model • 500 kB • 14 click 2026年1月4日

关于创作者

R#语言之父,热衷于各种数据可视化。在代谢组学数据分析和机器学习领域内有着非常丰富的工作经验,大约10年的生物信息学研发工作经验。平时最开心的时候就是可以在工作中重复造各种轮子,并且可以成功的应用于各种商业化项目之中。经过多年的生物信息学和化学信息学领域内的工作,目前手头上已经重复造出了非常多的轮子,积累了大量的代码库,对各种数据分析方法轮子的使用也都非常得心应手。

诺米代谢BioDeep研发中心

谢桂纲 · 高级数据科学家

目前主要从事代谢组学领域内的数据分析方法开发,化学信息学质谱数据分析以及质谱应用研发,生物信息学大数据挖掘,工业软件研发相关的工作。

通过电子邮件联系我:xieguigang@metabolomics.ac.cn