我是一位国产工业软件开发者

Mzkit桌面工作站

Mzkit工作站软件主要是应用于基于核磁共振/质谱数据的化学信息学方面的CAE(计算机辅助工程与计算机辅助分析)数据分析功能。目前已完成对质谱数据以及NMR数据的支持。目前的研发投入主要集中在质谱成像相关功能以及定量计算分析等分析化学相关的功能研发。 Mzkit目前为一款诺米代谢向大家所提供的免费开源的质谱数据分析软件

Latest Articles

我目前所从事的工作是在国内的一家比较大的代谢组学服务公司的高级数据科学家,主要从事一些使用VisualBasic.NET,R/R#语言进行数据科学相关的分析脚本以及流程编写开发工作。如果你对我自己模仿R语言所创建的R#语言做数据分析感兴趣的话,我这个博客网站目前是你进行R#语言学习的最好选择。
Abdelmoula, W.M., Lopez, B.GC., Randall, E.C. et al. Peak learning of mass spectrometry imaging data using artificial neural networks. Nat Commun 12, 5544 (2021). https://doi.org/10.1038/s41467-021-25744-8
估计阅读时长: 4 分钟 基于UMAP工具进行简单的自动化组织分区操作 在这里我们假设已经可以正常的将空间代谢数据导入至MZKit工作站软件之中。假若需要借助于MZKit工作站软件进行切片组织样本的自动化分区操作,相关的功能可以在【MSI Analysis】菜单栏中寻找到。在这里我们打开【Show Map Layer】按钮,选择【UMAP and clustering】功能。 基于降维的组织自动化分区原理 因为降维操作一般是一种特征提取操作,所以经过降维之后,在高维度空间上无法显现的特征,在低维度会呈现出来。在高维度空间散落的相近的数据点,在经过特征提取之后,低维度上会产生相似的特征信息,相互聚集在一簇。这样子我们就可以在低维度空间上通过一些聚类算法讲这些特征进行聚类,最后将聚类特征结果标记到各个散点上的对应的原始成像空间上,我们就可以看见组织分区的结果了。 Abdelmoula, W.M., Lopez, B.GC., Randall, E.C. et al. Peak learning of […]
估计阅读时长: 6 分钟 大家好呀,今天的这篇文章主要是为了回答在B站上的一位小伙伴的请求 Order by Date Name Attachments render-parameters • 18 kB • 115 click 15.10.2023view-umap • 427 kB • 97 click […]
估计阅读时长: 2 分钟 假若现在有两条Fasta序列放在你面前,现在需要你进行这两条Fasta序列的相似度计算分析。如果对于我而言,大学刚毕业刚入门生物信息学的时候,可能只能够想到通过blast比对的方式进行序列相似性计算分析。基于blast比对方式可以找到生物学意义上的序列相似性结果,但是计算的效率会比较低。假设现在让你使用这些序列进行机器学习建模分析,或者基于传统数学意义上的基于相似度的无监督聚类分析的时候,面对这些长度上长短不一的生物序列数据,可能会比较蒙圈,因为传统的数学分析方法都要求我们分析的目标至少应该是等长的向量数据。 Order by Date Name Attachments Fasta-A • 544 kB • 110 click 29.06.2023visualize • 45 kB • 96 click […]

关于创作者

R#语言之父,热衷于各种数据可视化。在代谢组学数据分析和机器学习领域内有着非常丰富的工作经验,大约10年的生物信息学研发工作经验。平时最开心的时候就是可以在工作中重复造各种轮子,并且可以成功的应用于各种商业化项目之中。经过多年的生物信息学和化学信息学领域内的工作,目前手头上已经重复造出了非常多的轮子,积累了大量的代码库,对各种数据分析方法轮子的使用也都非常得心应手。

诺米代谢BioDeep研发中心

谢桂纲 · 高级数据科学家
目前主要从事代谢组学领域内的数据分析方法开发,化学信息学质谱数据分析以及质谱应用研发,生物信息学大数据挖掘,工业软件研发相关的工作。