估计阅读时长: 3 分钟https://mzkit.org mzkit软件是我最近开发的一款开源的代谢组学领域内的原始数据文件查看工具。开发mzkit软件的初衷是为了更方便的查看很大的非靶向原始数据文件:因为在开发mzkit软件之前,在开发LCMS的代谢物注释脚本或者建立标准品库数据的时候,如果我想要查看或者导出文件中的一些质谱图碎片信息,会需要通过R环境之中的xcms程序包编程来完成。通过R脚本来查看原始数据文件,非常的不方便。所以就有了mzkit软件项目的诞生。 Order by Date Name Attachments BPC_overlay • 114 kB • 534 click 2021年7月1日LCMS_scanTree • […]

哈哈,Thanks♪(・ω・)ノ
哈哈。这个R程序包用来做代谢组数据的biomarker分析确实挺方便的呢
This clarifies everything perfectly.
其实,你不应该直接跑原始表达矩阵的。因为在原始表达矩阵中,基因的特征数量可能会非常多,做随机森林或者SVM建模就会会非常久。应该先用limma程序包对矩阵筛选一次,例如用log2fc绝对值按照阈值cutoff筛选一次,或者对log2fc绝对值排序后取前1000个特征,得到小一些feature集合的矩阵后再使用这个程序包做机器学习分析。
Thanks for taking the time to create this.