估计阅读时长: 9 分钟 一般而言,如果我们在进行组学数据分析的时候,如果想要比较两组数据之间是否存在有差异性,一般是对两两比较的两组数据进行T-检验。但是在代谢组学数据分析领域内,则很多的组学数据分析情况为比较两组以上的数据,寻找差异的biomarker。那这个时候就需要使用上ANOVA统计检验方法了。 Order by Date Name Attachments anova • 105 kB • 12 click 28.05.2022ANOVA-screen • 27 […]
估计阅读时长: < 1 分钟 imports "clustering" from "MLkit"; require(graphics2D); multishapes = read.csv("./multishapes.csv"); [x, y] = list(multishapes[, "x"], multishapes[, "y"]); print(multishapes, […]
估计阅读时长: < 1 分钟 https://github.com/rsharp-lang/R-sharp 前言 经过了2021年一年时间的奋斗,目前R#脚本语言环境终于可以算是能够支撑起比较完整的数据分析流程了。在2021年这段时间,我为R#脚本语言环境大概做了以下几件我认为是比较里程碑式的工作: 建立起了一个比较成熟的脚本打包系统 仿照R语言引入了ggplot和ggraph类似的作图系统 借助于mzkit的开发,将R#语言成功的应用于商业化的质谱数据分析产品之中 为了扩大R#语言环境的受众,在2022年初,也就是这个月内,我相继为Python语言和Julia语言添加了对R#语言环境的支持。下面我们就来聊聊在R#语言环境中的对上面所提到的两种语言的支持。 Order by Date Name Attachments programming • 262 kB […]
估计阅读时长: 12 分钟 https://github.com/rsharp-lang/R-sharp/tree/master/studio/RData 如果我们需要将上游的R数据分析环境之中的数据集串流至下游的R#数据分析环境之中,构建出一个不同的数据分析环境混合在一块的自动化数据分析流程。我们一般会需要将上游的R环境之中的数据符号对象以RData的格式串流到下游环境中,下游环境进行反序列化加载数据到环境中执行相应的分析。例如在下游执行定制化程度更高的数据作图,将数据以在上游R环境中比较困难实现的其他二进制文件格式进行保存,或者进行分布式的跨物理机的集群化计算,等等用于实现单纯依靠R环境所比较困难实现的功能。 从上一篇博客文章之中我们比较下详细的了解了RData数据文件的文件格式以及对应的读取操作。在这篇文章之中我们来了解如何基于我们通过对RData文件读取操作所获取得到的链表数据进行反序列化操作,将R环境之中的数据集串流加载到下游的R#数据分析环境之中。 Order by Date Name Attachments rstudio-og-fb-1-1024x538 • 39 kB • 52 click 04.12.2021read-vector […]
估计阅读时长: 11 分钟 https://github.com/rsharp-lang/R-sharp/tree/master/studio/RData 在最近的工作中,需要将Docker容器内的R环境之中的数据集无缝的串流到下游的.NET Core数据分析环境之中,基于.NET Core代码库进行数据可视化之类的操作。目前在R环境与.NET Core环境之间进行交互仅存在有一个比较出名的R.NET项目。但是对于使用R.NET项目而言,我们只能够在.NET Core环境之中调用R环境做数据分析,并不能够实现R环境调用.NET Core数据分析环境。并且R.NET项目必须要依赖于R环境对应的库文件,所以使用R.NET并不能够满足我们在Docker容器间进行R数据分析环境与.Net Core数据分析环境之间的无缝衔接。 Order by Date Name Attachments RStudio_Logo • 185 […]
估计阅读时长: 7 分钟 https://github.com/xieguigang/ms-imaging Order by Date Name Attachments HR2MSI_mouse_urinary_bladder_S096_RGB • 7 MB • 51 click 13.11.2021peerj-cs-07-585 • 16 […]
估计阅读时长: 11 分钟 https://github.com/rsharp-lang/ggplot 接上一篇博客文章中谈到,我们已经通过R#语言之中的ggplot程序包绘制出了一个可以使用的火山图。在这里,我们将会通过在火山图上添加更多的可视化元素来为大家介绍R#语言之中的ggplot程序包的进阶使用方式。 Order by Date Name Attachments volcano • 651 kB • 55 click 09.10.2021volcano • […]
估计阅读时长: 7 分钟 https://github.com/rsharp-lang/ggplot 在生物信息学中的组学数据分析领域内,有一个非常常见的数据可视化图表:应用于可视化两两组别比对结果的火山图。在火山图之中,X坐标轴一般是log2FC,纵坐标Y轴,则一般是t检验的pvalue的-log10转换之后的值。由于fold change有大于1的值,A/B大于1,表示A的表达量高于B的表达量,反之小于一表示A的表达量低于B的表达量。这样子fold change经过log2转换之后,就会出现负数,散点一般呈轴对称分布在X=0的位置周围。这样子绘制出来的散点图就有点类似于火山喷发的样子了。 Order by Date Name Attachments a679af1eb9ffbfbad48c18d563ea51f3 • 45 kB • 77 click […]
估计阅读时长: 11 分钟 https://github.com/xieguigang/sciBASIC/tree/master/gr/Microsoft.VisualBasic.Imaging/Drawing3D 因为大家大多数都是从小接受电子游戏,所以长大了之后能够自己从零开始开发一个完整的3维图形引擎是每一个男程序员的梦想。这个就像玩机械的男人的梦想就是自己从头开始组装一辆汽车。还好这个梦想我在几年前就已经实现了。 Order by Date Name Attachments Cube3D_VB.NET • 4 MB • 47 click 19.09.2021Cube_screenshot • […]
估计阅读时长: 10 分钟 https://github.com/xieguigang/sciBASIC 最近在空间代谢组学中的质谱成像应用开发过程中,会需要使用到一些图像处理算法对原始的质谱成像结果图片进行诸如平滑,放大等处理。顺着图像平滑的算法搜索,通过搜索引擎找到了一个年代比较久远的图像处理算法博客文章,将其中的图像算法重新实现了一下,在这里分享给大家。 Order by Date Name Attachments lena • 558 kB • 51 click 10.09.2021lenalena • […]