估计阅读时长: 9 分钟https://github.com/xieguigang/sciBASIC 在实际应用的机器学习方法里,GradientTree Boosting (GBDT)是一个在很多应用里都很出彩的技术。XGBoost是一套提升树可扩展的机器学习系统。XGBoost全名叫(eXtreme Gradient Boosting)极端梯度提升。它是大规模并行boosted tree的工具,XGBoost 所应用的算法就是 GBDT(gradient boosting decision tree)的改进,既可以用于分类也可以用于回归问题中。 Order by Date Name […]
博客文章
September 2021
S M T W T F S
 1234
567891011
12131415161718
19202122232425
2627282930  
  1. 其实,你不应该直接跑原始表达矩阵的。因为在原始表达矩阵中,基因的特征数量可能会非常多,做随机森林或者SVM建模就会会非常久。应该先用limma程序包对矩阵筛选一次,例如用log2fc绝对值按照阈值cutoff筛选一次,或者对log2fc绝对值排序后取前1000个特征,得到小一些feature集合的矩阵后再使用这个程序包做机器学习分析。

  2. 就是随便看看!