估计阅读时长: 5 分钟 https://github.com/rsharp-lang/R-sharp R#语言的语法主要来自于R语言,其在保留了很多的R语言特性的同时,也添加了很多新语法特性。对于R#与R语言之间相同的语法特性,在本简明教程中我就不再叙述了,在这里主要是给大家说明一下R#语言相对于R语言新增的一些语法特性。 R#语言中的向量 R#语言任然保持着和其前辈R语言一样的向量化编程的特性。对于声明一个向量,在R语言之中,需要使用c函数进行申明,而对于R#语言而言,除了使用c函数,还可以直接使用方括号进行申明,例如: x = c("A","B","C") # x # [1] "A" "B" "C" x = […]
估计阅读时长: 4 分钟 https://github.com/xieguigang/linux-profiler 废话不多说,首先给出一个 demo报告链接 给大家看看这个小工具的成品输出。 在去年的工作中,因为公司需要购买新的服务器做集群计算,需要一个工具来记录之前的服务器在数据分析上的性能瓶颈。于是花了两天的时间赶出来了这个专门应用于Linux系统的性能记录工具。这个小工具是一个开源项目,大家可以在Github上阅读这个开源项目(linux-profiler)的源代码。 Order by Date Name Attachments systemLoad • 53 kB • 120 […]
binary tree clustering of phenotypic
估计阅读时长: 3 分钟 https://github.com/xieguigang/bclusterTree 对于二叉树,大家肯定不会陌生。二叉树其实就是一个有向无环图(有向:访问的方向是从父节点指向子节点;无环:子节点不会成为其父辈节点的父节点),大家可以从根节点一直往下访问到任意一个叶节点;节点间的方向是根据键值的比较的大小结果来建立的,大的值在右边,小的值在左边(《左迁与右迁》),零值在当前节点。 二叉树示意图来自于这篇博文《Self-balanced Binary Search Trees with AVL in JavaScript》 Order by Date Name Attachments Rplot […]
估计阅读时长: 4 分钟 https://github.com/xieguigang/Darwinism 最近在做一个代谢组学的数据分析程序,由于需要被分析的质谱原始数据的计算量非常大,所以肯定会需要上并行计算。在并行计算中,分为两种模式:线程并行以及进程并行。 关于如果选择脚本代码的并行模式,我在这里借用了matlab文档网站里面的一张图来给大家做参考: 《Choose Between Thread-Based and Process-Based Environments》 Order by Date Name Attachments super_computing • […]
估计阅读时长: 2 分钟 在BILIBILI上观看视频:《【GCModeller教程】基因组GO功能注释原理》 哈喽,各位小伙伴们好啊,你们可爱的六神无主鸠今天又开新课了。今天主要为大家讲解的内容是GO基因功能注释的原理和操作。在开始今天的新视频前,我先为大家来讲一个圣经中的神话: 大洪水过去后, 诺亚的三个儿子的后裔形成了人类的三大支系,居住在世界各地,遍布地面。那时候人们的语言、口音都没有分别。他们在往东边迁移的时候,在示拿这个地方遇见一片平原,就在那里住下。因为在平原上,用作建筑的石料很不易得到,他们就发明了制造砖的方法,用泥作成方块,再用火烧透,他们就拿砖当石头,又拿石漆当灰泥,建造起繁华的巴比伦城。 人们为自己的业绩感到骄傲,他们决定在巴比伦修一座通天的高塔,来传颂自己的赫赫威名,并作为集合全天下弟兄的标记,以免分散。因为大家语言相通,同心协力,阶梯式的通天塔修建得非常顺利,很快就高耸入云。 上帝是不允许凡人达到自己的高度的。他看到人们这样统一强大,心想,他们语言都一样,如果真修成宏伟的通天塔,那以后还有什么事干不成呢? 必须制止人类接近自己的狂妄。上帝就离开天国到人间,变乱了人们的语言。人们各自操起不同的语言,感情无法交流,思想很难统一。修造工程因语言纷争而停止了,通天塔的建造终于半途而废了。 Order by Date Name Attachments gene_ontology_annotation • 576 kB […]
估计阅读时长: 2 分钟 在BILIBILI上观看视频:《【GCModeller教程】基因组功能富集计算原理》 Order by Date Name Attachments 20190818_GSEA_release.mp4_20190921_225144.467 • 226 kB • 116 click 30.05.2021Fisher Exact Test […]
估计阅读时长: 2 分钟 在BILIBILI上观看视频:《【GCModeller教程】KEGG代谢途径注释原理 (重置版)》 Order by Date Name Attachments kegg_annotation • 468 kB • 118 click 30.05.2021release.mp4_20190921_225235.396 • […]
估计阅读时长: 2 分钟 https://github.com/xieguigang/mzkit 在BILIBILI上观看视频:《【BioNovoGene Mzkit教程】代谢组学原始数据处理基础》 Order by Date Name Attachments profile_videocard • 211 kB • 141 click 29.05.2021metabolims […]
估计阅读时长: 6 分钟 前段时间由于工作的需要,会需要从一些网站上抓取数据用来做数据分析。在原来我进行网页爬虫开发的时候,一般会需要专门针对网页格式,使用大量的正则表达式进行内容的解析。由于你也知道,VisualBasic语言所开发的程序为一个编译好的Assembly文件,所以假若所需要爬取的网页格式变化了,我们就需要对代码做修改和重新编译。这个时候就会非常的不方便。 Order by Date Name Attachments ea5d2885-bba5-410f-b02b-0589613412ed • 12 kB • 116 click 29.05.2021graphquery_Rscript • 36 […]
估计阅读时长: 3 分钟 根据工作的需要,我为R#脚本解释器添加了一个符号计算的功能,这个符号语言特性在进行一些化学信息学分析的时候会非常有用。例如,我们在分析一些天然产物的质谱数据的时候,会需要通过母离子减掉一些糖来进行中性丢失的计算,基于中性丢失计算来进行一些解谱分析操作。在这个过程之中,化学式符号计算就可以派上很大用场了。假设我们有一个天然产物Cyanidin 3-glucoside-5-(6-p-coumaroylglucoside),从名称我们就可以看出这个天然产物是由一个Cyanidin母核,加上两个葡萄糖以及一个coumaroyl基团构成。这个天然产物的分子化学式为C36H37O18,那现在我们将这个化学式输入到R#解释器之中,按下回车就可以很清楚的了解到这个化学式的元素构成 > C36H37O18 757.1979802 (C:36, H:37, O:18) 如果想要使用这个特性,需要在R#终端上导入mzkit程序包模块:imports "formula" from "mzkit"; Order by Date Name […]
博客文章
May 2023
S M T W T F S
 123456
78910111213
14151617181920
21222324252627
28293031  
  1. […] 在上面所提到的线性变化转换过程,其实就是一个热图绘制的过程。我们一般按照不同的颜色谱做线性变换映射,就可以得到对应的不同颜色系列下的NRRD热图成像渲染结果。对于NRRD图像文件的热图成像渲染原理,其实是和质谱成像的渲染原理一摸一样的(对于质谱成像渲染而言,其主要的原理也就是将对应的扫描点上的目标离子的intensity值取出,构建出一个和NRRD文件中的光栅矩阵数据一摸一样的矩阵数据,基于这个矩阵数据进行线性变换映射到对应的颜色值完成热图成像可视化操作)。 […]

  2. […] 如果我们需要将得到光栅矩阵数据进行可视化,该怎样做呢?其实,如果我们了解过热图成像或者质谱成像的原理的话,实际上对于这个光栅矩阵的原始数据进行成像的原理应该就会很清楚了。在我们拿到这个矩阵之后,可以将矩阵的行和列看作为二维图像空间之中的x和y坐标信息,然后对应的矩阵中的单元格值可以映射为一个对应的颜色,即可将从NRRD文件之中拿到的光栅矩阵数据给可视化出来。将光栅矩阵中的数值映射为对应的颜色值的方法原理,大家可以参考一下《【热图数据可视化】颜色插值计算原理》的内容介绍,一摸一样。 […]