估计阅读时长: 4 分钟根据工作的需要,我为R#脚本解释器添加了一个符号计算的功能,这个符号语言特性在进行一些化学信息学分析的时候会非常有用。例如,我们在分析一些天然产物的质谱数据的时候,会需要通过母离子减掉一些糖来进行中性丢失的计算,基于中性丢失计算来进行一些解谱分析操作。在这个过程之中,化学式符号计算就可以派上很大用场了。假设我们有一个天然产物Cyanidin 3-glucoside-5-(6-p-coumaroylglucoside),从名称我们就可以看出这个天然产物是由一个Cyanidin母核,加上两个葡萄糖以及一个coumaroyl基团构成。这个天然产物的分子化学式为C36H37O18,那现在我们将这个化学式输入到R#解释器之中,按下回车就可以很清楚的了解到这个化学式的元素构成 > C36H37O18 757.1979802 (C:36, H:37, O:18) 如果想要使用这个特性,需要在R#终端上导入mzkit程序包模块:imports "formula" from "mzkit"; Order by Date Name […]

This clarifies everything perfectly.
其实,你不应该直接跑原始表达矩阵的。因为在原始表达矩阵中,基因的特征数量可能会非常多,做随机森林或者SVM建模就会会非常久。应该先用limma程序包对矩阵筛选一次,例如用log2fc绝对值按照阈值cutoff筛选一次,或者对log2fc绝对值排序后取前1000个特征,得到小一些feature集合的矩阵后再使用这个程序包做机器学习分析。
Thanks for taking the time to create this.
就是随便看看!
c⌒っ゚Д゚)っ救命啊,谢老师,我试了下用这个程序包直接跑转录组矩阵,跑了好久都没有结果