估计阅读时长: 7 分钟https://github.com/rsharp-lang/ggplot 一张统计图形就是从数据到几何对象(geometric object, 缩写为geom, 包括点、线、条形等)的图形属性(aesthetic attributes, 缩写为aes, 包括颜色、形状、大小等)的一个映射。此外, 图形中还可能包含数据的统计变换(statistical transformation, 缩写为stats), 最后绘制在某个特定的坐标系(coordinate system, 缩写为coord)中, 而分面(facet, 指将绘图窗口划分为若干个子窗口)则可以用来生成数据中不同子集的图形。 […]

哈哈,Thanks♪(・ω・)ノ
哈哈。这个R程序包用来做代谢组数据的biomarker分析确实挺方便的呢
This clarifies everything perfectly.
其实,你不应该直接跑原始表达矩阵的。因为在原始表达矩阵中,基因的特征数量可能会非常多,做随机森林或者SVM建模就会会非常久。应该先用limma程序包对矩阵筛选一次,例如用log2fc绝对值按照阈值cutoff筛选一次,或者对log2fc绝对值排序后取前1000个特征,得到小一些feature集合的矩阵后再使用这个程序包做机器学习分析。
Thanks for taking the time to create this.