我是一位国产工业软件开发者

Mzkit桌面工作站

Mzkit工作站软件主要是应用于基于核磁共振/质谱数据的化学信息学方面的CAE(计算机辅助工程与计算机辅助分析)数据分析功能。目前已完成对质谱数据以及NMR数据的支持。目前的研发投入主要集中在质谱成像相关功能以及定量计算分析等分析化学相关的功能研发。

Mzkit目前为一款诺米代谢向大家所提供的免费开源的质谱数据分析软件

Latest Articles

我目前所从事的工作是在国内的一家比较大的代谢组学服务公司的高级数据科学家,主要从事一些使用VisualBasic.NET,R/R#语言进行数据科学相关的分析脚本以及流程编写开发工作。如果你对我自己模仿R语言所创建的R#语言做数据分析感兴趣的话,我这个博客网站目前是你进行R#语言学习的最好选择。

估计阅读时长: 2 分钟我们在基于前面所论述的《通过diamond软件进行blastp搜索》对大规模的基因组数据进行了代谢酶的EC number的注释以及按照文章《基因组功能注释(EC Number)的向量化嵌入》的方法,得到了一个比较大的基因组代谢酶TF-IDF嵌入丰度矩阵后,如果将这里所得到的嵌入结果矩阵中的基因组,基于Family层级的物种分类分组看作为单细胞转录数据中的细胞分群结果,能否基于单细胞数据分析方法来分析和可视化我的基因组功能嵌入的结果矩阵呢?
估计阅读时长: 5 分钟基因组 为了能够实现上面所描述的这种基于EC Number的不同层级的加权嵌入,我们在原来的基因组嵌入工具上添加了一个hierarchical选项,用于支持切换为层级嵌入的操作: Imports Microsoft.VisualBasic.Data.Framework Imports Microsoft.VisualBasic.Data.NLP Imports SMRUCC.genomics.Interops.NCBI.Extensions.Pipeline Public Class GenomeMetabolicEmbedding ReadOnly vec As New TFIDF ReadOnly taxonomy As […]
估计阅读时长: 20 分钟LDA(Latent Dirichlet Allocation,潜在狄利克雷分配)是一种用于发现文档集合中潜在主题的生成式概率模型。它假设文档是由多个主题混合而成的,而每个主题又是通过一定的概率分布选择词语生成的。LDA模型包含词、主题和文档三层结构,通过概率生成过程模拟文档的形成。Gibbs LDA 的核心在于使用吉布斯采样方法来推断这些隐藏的主题分布。 Attachments v2-883ac9db7f1cbd7325b2450cd225a897_b • 29 kB • 33 click 2026年2月23日

关于创作者

R#语言之父,热衷于各种数据可视化。在代谢组学数据分析和机器学习领域内有着非常丰富的工作经验,大约10年的生物信息学研发工作经验。平时最开心的时候就是可以在工作中重复造各种轮子,并且可以成功的应用于各种商业化项目之中。经过多年的生物信息学和化学信息学领域内的工作,目前手头上已经重复造出了非常多的轮子,积累了大量的代码库,对各种数据分析方法轮子的使用也都非常得心应手。

诺米代谢BioDeep研发中心

谢桂纲 · 高级数据科学家

目前主要从事代谢组学领域内的数据分析方法开发,化学信息学质谱数据分析以及质谱应用研发,生物信息学大数据挖掘,工业软件研发相关的工作。

通过电子邮件联系我:xieguigang@metabolomics.ac.cn