我是一位国产工业软件开发者

Mzkit桌面工作站

Mzkit工作站软件主要是应用于基于核磁共振/质谱数据的化学信息学方面的CAE(计算机辅助工程与计算机辅助分析)数据分析功能。目前已完成对质谱数据以及NMR数据的支持。目前的研发投入主要集中在质谱成像相关功能以及定量计算分析等分析化学相关的功能研发。

Mzkit目前为一款诺米代谢向大家所提供的免费开源的质谱数据分析软件

Latest Articles

我目前所从事的工作是在国内的一家比较大的代谢组学服务公司的高级数据科学家,主要从事一些使用VisualBasic.NET,R/R#语言进行数据科学相关的分析脚本以及流程编写开发工作。如果你对我自己模仿R语言所创建的R#语言做数据分析感兴趣的话,我这个博客网站目前是你进行R#语言学习的最好选择。

Fig. 4 Weighted correlation network analysis (WGCNA) identifies IFNα-regulated mRNA and protein modules
估计阅读时长: 2 分钟Github项目:https://github.com/xieguigang/marker 本程序包是一个基于R语言的综合性机器学习工具集,专门设计用于生物标志物发现和疾病预测模型的构建。该工具整合了多种机器学习算法,提供了从数据预处理、特征选择到模型构建与验证的完整工作流程,特别适用于代谢组学、基因组学等高维生物数据的分析研究。在这个程序包中,主要是通过marker函数来封装了从数据与处理到模型建立的每一个步骤,主要将程序包划分为了以下的工作步骤模块: 数据加载和预处理 初始可视化(PCA图)和统计分析(线性模型、描述性统计) 特征选择(如果未提供预选特征,则使用LASSO、随机森林和SVM-RFE三种方法) 数据分割为训练集和测试集 模型集成训练(逻辑回归、XGBoost、随机森林) 结果可视化(ROC曲线、特征重要性、SHAP分析等) 大家在这里可以通过下面的技术路线图来了解在所编写的程序包中所涉及到的分析内容与步骤: 所主要涉及到的模型算法原理 机器学习方法 数学原理 使用场景 应用 LASSO回归 LASSO(Least Absolute Shrinkage and Selection […]
估计阅读时长: 2 分钟Connected Component Labeling(连通组件标记算法)主要用于识别并标记二值图像中相互连接的像素区域(即连通区域)。 imports "geometry2D" from "graphics"; imports "machineVision" from "signalKit"; let raw = readImage("—Pngtree—five chickens in different colors_3632916.jpg"); let […]
估计阅读时长: 7 分钟Boids算法(也称鸟群/鱼群算法)是Craig Reynolds于1986年提出的群体行为模拟模型,通过三条局部规则模拟鸟类、鱼群等生物群体的自组织运动。在Boids算法中,整个过程通过个体(称为“boid”)的局部交互实现全局有序行为,无需中央控制。每条规则计算个体与邻居的相互作用力,最终合力决定运动方向。Boids算法的精髓在于用局部规则涌现全局智能,其简洁性、可扩展性使其成为连接生物行为与工程控制的桥梁。从《蝙蝠侠》的蝙蝠群到无人机编队表演,从游戏生态到交通优化,Boids持续证明:自然界的简单规则,足以驱动复杂系统的有序演化。 Order by Date Name Attachments Boids • 28 MB • 171 click 2025年8月10日Boids • 471 kB • 180 […]

关于创作者

R#语言之父,热衷于各种数据可视化。在代谢组学数据分析和机器学习领域内有着非常丰富的工作经验,大约10年的生物信息学研发工作经验。平时最开心的时候就是可以在工作中重复造各种轮子,并且可以成功的应用于各种商业化项目之中。经过多年的生物信息学和化学信息学领域内的工作,目前手头上已经重复造出了非常多的轮子,积累了大量的代码库,对各种数据分析方法轮子的使用也都非常得心应手。

诺米代谢BioDeep研发中心

谢桂纲 · 高级数据科学家

目前主要从事代谢组学领域内的数据分析方法开发,化学信息学质谱数据分析以及质谱应用研发,生物信息学大数据挖掘,工业软件研发相关的工作。

通过电子邮件联系我:xieguigang@metabolomics.ac.cn