在之前的BioDeep代谢物数据库整合工作之中,所提取的代谢物注释信息的唯一编码是来自于数据库表之中的递增主键。由于数据库之中的递增主键的唯一编码值是与数据内容完全无关的数据,所以在基于图数据库做数据库整合的结果在两次整合操作之后,可能会因为先后输出顺序不一致的原因,得到的在关系型数据库中的唯一递增编号可能会完全不一样了。这个问题会对数据库更新操作造成非常大的困扰。 Order by Date Name Attachments 450px-Hash_table_5_0_1_1_1_1_1_LL • 26 kB • 11 click 16.04.2022metadata-table • 58 […]
目前我们根据质谱数据进行代谢物ROI注释分析,很大一部分的工作是建立在已经可以被纯化的化合物的纯标准品所建立的标准品库数据的比对操作之上的。但是依赖于质谱参考谱图数据库所完成的代谢物注释分析,也仅能够得到很小的一部分结果,因为能够纯化或者合成的化合物在整个自然界中目前只占比较小的一部分。并且购买标准品也会需要耗费大量的实验室资金预算。 Order by Date Name Attachments MZKit-DevTools • 36 kB • 16 click 20.03.2022MZKit-DevTools-console • 51 […]
https://github.com/xieguigang/graphQL 构建一个图数据库,可以用来帮我们解决复杂的知识关联计算问题。例如我们想要程序向我们回答dihydrogen oxide与water是否是同一个东西。如果光从字符串比较角度上面来看待这个问题的话,很显然,二者的字符串比较结果肯定是False。面对上面的这个问题,图数据库则可以很简单的向我们回答道上面的两个字符串都是指代的同一个东西。 Order by Date Name Attachments tumblr_inline_mqvdlydGCp1qz4rgp • 124 kB • 17 click 05.03.2022Capture […]
https://github.com/rsharp-lang/R-sharp 前言 经过了2021年一年时间的奋斗,目前R#脚本语言环境终于可以算是能够支撑起比较完整的数据分析流程了。在2021年这段时间,我为R#脚本语言环境大概做了以下几件我认为是比较里程碑式的工作: 建立起了一个比较成熟的脚本打包系统 仿照R语言引入了ggplot和ggraph类似的作图系统 借助于mzkit的开发,将R#语言成功的应用于商业化的质谱数据分析产品之中 为了扩大R#语言环境的受众,在2022年初,也就是这个月内,我相继为Python语言和Julia语言添加了对R#语言环境的支持。下面我们就来聊聊在R#语言环境中的对上面所提到的两种语言的支持。 Order by Date Name Attachments programming • 262 kB […]
https://github.com/rsharp-lang/R-sharp/tree/master/studio/RData 如果我们需要将上游的R数据分析环境之中的数据集串流至下游的R#数据分析环境之中,构建出一个不同的数据分析环境混合在一块的自动化数据分析流程。我们一般会需要将上游的R环境之中的数据符号对象以RData的格式串流到下游环境中,下游环境进行反序列化加载数据到环境中执行相应的分析。例如在下游执行定制化程度更高的数据作图,将数据以在上游R环境中比较困难实现的其他二进制文件格式进行保存,或者进行分布式的跨物理机的集群化计算,等等用于实现单纯依靠R环境所比较困难实现的功能。 从上一篇博客文章之中我们比较下详细的了解了RData数据文件的文件格式以及对应的读取操作。在这篇文章之中我们来了解如何基于我们通过对RData文件读取操作所获取得到的链表数据进行反序列化操作,将R环境之中的数据集串流加载到下游的R#数据分析环境之中。 Order by Date Name Attachments rstudio-og-fb-1-1024x538 • 39 kB • 39 click 04.12.2021read-vector […]
https://github.com/rsharp-lang/R-sharp/tree/master/studio/RData 在最近的工作中,需要将Docker容器内的R环境之中的数据集无缝的串流到下游的.NET Core数据分析环境之中,基于.NET Core代码库进行数据可视化之类的操作。目前在R环境与.NET Core环境之间进行交互仅存在有一个比较出名的R.NET项目。但是对于使用R.NET项目而言,我们只能够在.NET Core环境之中调用R环境做数据分析,并不能够实现R环境调用.NET Core数据分析环境。并且R.NET项目必须要依赖于R环境对应的库文件,所以使用R.NET并不能够满足我们在Docker容器间进行R数据分析环境与.Net Core数据分析环境之间的无缝衔接。 Order by Date Name Attachments RStudio_Logo • 185 […]
https://github.com/rsharp-lang/ggplot 之前在阅读一篇单细胞组学数据分析的文献,觉得在文献之中有一些三维散点图用于展示降维聚类结果的效果非常的好看。于是自己在R#语言之中的ggplot程序包的2D绘图的功能基础之上,进行了三维图形数据可视化功能的开发。 (A) t-SNE map projecting myeloid cells from BC1-8 patients (all tissues). Cells are colored […]
https://github.com/rsharp-lang/Rnb 之前使用Python脚本进行编写代码的时候,十分的羡慕Python脚本可以基于ipynb记事本进行文档化的编码。在之前R#脚本是缺少相关的代码库模块将可执行的R#脚本渲染成可视化文档。但是经过几天的开发工作时候,现在R#脚本编程已经具备有了文档化编程的基本框架了。 Order by Date Name Attachments 01510007-school-notebook • 32 kB • 37 click 30.10.2021renderHtml_cli • […]
https://github.com/rsharp-lang/ggplot 接上一篇博客文章中谈到,我们已经通过R#语言之中的ggplot程序包绘制出了一个可以使用的火山图。在这里,我们将会通过在火山图上添加更多的可视化元素来为大家介绍R#语言之中的ggplot程序包的进阶使用方式。 Order by Date Name Attachments volcano • 651 kB • 42 click 09.10.2021volcano • […]
https://github.com/rsharp-lang/ggplot 在生物信息学中的组学数据分析领域内,有一个非常常见的数据可视化图表:应用于可视化两两组别比对结果的火山图。在火山图之中,X坐标轴一般是log2FC,纵坐标Y轴,则一般是t检验的pvalue的-log10转换之后的值。由于fold change有大于1的值,A/B大于1,表示A的表达量高于B的表达量,反之小于一表示A的表达量低于B的表达量。这样子fold change经过log2转换之后,就会出现负数,散点一般呈轴对称分布在X=0的位置周围。这样子绘制出来的散点图就有点类似于火山喷发的样子了。 Order by Date Name Attachments a679af1eb9ffbfbad48c18d563ea51f3 • 45 kB • 61 click […]
博客文章
May 2022
S M T W T F S
1234567
891011121314
15161718192021
22232425262728
293031