估计阅读时长: 5 分钟 https://github.com/xieguigang/sciBASIC 在分布式哈希表网络之中,Peer节点之间进行分布式数据传输都是使用的B编码。B编码格式与JSON编码格式较为相似,均以“键:值”形式存储,我们可以将B编码的字符串整个内容理解为一个经过特殊编码的字典,或者一个近似的JSON。B编码与JSON编码,这两种编码都仅包含有4种最基础的数据类型:字符串类型,数值类型,数组类型与对象字典类型。 Order by Date Name Attachments DHT-dark-all • 416 kB • 70 click 04.06.2021bdecode • […]
估计阅读时长: 6 分钟 https://github.com/xieguigang/sciBASIC 根据积分表达式,微分方程的数值解关键在于微分方程的初值及计算微分方程式在tm(上一时刻)与tm+d(下一时刻)与坐标轴围成面积,若这个面积计算得越准确则得到的数值解也就越精确。微分表达式中与坐标轴围成的面积可表示如下,在实施算法的时候可以结合这个图更加直观点: 从上面的示意图可以看出,一段需要进行面积积分的曲线实际上是由多个梯形构成的多边形。那我们实际上只需要将这些梯形的面积都求出来,然后加起来就好了。 这里的梯形分割就是一种欧拉逼近的思想,欧拉逼近的几何意义,就是我们可以使用一段折线来近似的逼近一条曲线。 利用欧拉逼近,我们可以将一个精确的微分方程曲线 近似的使用线段来表示 Order by Date Name Attachments ODE_Trapezoidal • 30 kB • […]
估计阅读时长: 5 分钟 https://github.com/rsharp-lang/R-sharp R#语言的语法主要来自于R语言,其在保留了很多的R语言特性的同时,也添加了很多新语法特性。对于R#与R语言之间相同的语法特性,在本简明教程中我就不再叙述了,在这里主要是给大家说明一下R#语言相对于R语言新增的一些语法特性。 R#语言中的向量 R#语言任然保持着和其前辈R语言一样的向量化编程的特性。对于声明一个向量,在R语言之中,需要使用c函数进行申明,而对于R#语言而言,除了使用c函数,还可以直接使用方括号进行申明,例如: x = c("A","B","C") # x # [1] "A" "B" "C" x = […]
估计阅读时长: 4 分钟 https://github.com/xieguigang/linux-profiler 废话不多说,首先给出一个 demo报告链接 给大家看看这个小工具的成品输出。 在去年的工作中,因为公司需要购买新的服务器做集群计算,需要一个工具来记录之前的服务器在数据分析上的性能瓶颈。于是花了两天的时间赶出来了这个专门应用于Linux系统的性能记录工具。这个小工具是一个开源项目,大家可以在Github上阅读这个开源项目(linux-profiler)的源代码。 Order by Date Name Attachments systemLoad • 53 kB • 75 […]
binary tree clustering of phenotypic
估计阅读时长: 3 分钟 https://github.com/xieguigang/bclusterTree 对于二叉树,大家肯定不会陌生。二叉树其实就是一个有向无环图(有向:访问的方向是从父节点指向子节点;无环:子节点不会成为其父辈节点的父节点),大家可以从根节点一直往下访问到任意一个叶节点;节点间的方向是根据键值的比较的大小结果来建立的,大的值在右边,小的值在左边(《左迁与右迁》),零值在当前节点。 二叉树示意图来自于这篇博文《Self-balanced Binary Search Trees with AVL in JavaScript》 Order by Date Name Attachments Rplot […]
估计阅读时长: 4 分钟 https://github.com/xieguigang/Darwinism 最近在做一个代谢组学的数据分析程序,由于需要被分析的质谱原始数据的计算量非常大,所以肯定会需要上并行计算。在并行计算中,分为两种模式:线程并行以及进程并行。 关于如果选择脚本代码的并行模式,我在这里借用了matlab文档网站里面的一张图来给大家做参考: 《Choose Between Thread-Based and Process-Based Environments》 Order by Date Name Attachments super_computing • […]
估计阅读时长: 6 分钟 前段时间由于工作的需要,会需要从一些网站上抓取数据用来做数据分析。在原来我进行网页爬虫开发的时候,一般会需要专门针对网页格式,使用大量的正则表达式进行内容的解析。由于你也知道,VisualBasic语言所开发的程序为一个编译好的Assembly文件,所以假若所需要爬取的网页格式变化了,我们就需要对代码做修改和重新编译。这个时候就会非常的不方便。 Order by Date Name Attachments ea5d2885-bba5-410f-b02b-0589613412ed • 12 kB • 76 click 29.05.2021graphquery_Rscript • 36 […]
估计阅读时长: 3 分钟 根据工作的需要,我为R#脚本解释器添加了一个符号计算的功能,这个符号语言特性在进行一些化学信息学分析的时候会非常有用。例如,我们在分析一些天然产物的质谱数据的时候,会需要通过母离子减掉一些糖来进行中性丢失的计算,基于中性丢失计算来进行一些解谱分析操作。在这个过程之中,化学式符号计算就可以派上很大用场了。假设我们有一个天然产物Cyanidin 3-glucoside-5-(6-p-coumaroylglucoside),从名称我们就可以看出这个天然产物是由一个Cyanidin母核,加上两个葡萄糖以及一个coumaroyl基团构成。这个天然产物的分子化学式为C36H37O18,那现在我们将这个化学式输入到R#解释器之中,按下回车就可以很清楚的了解到这个化学式的元素构成 > C36H37O18 757.1979802 (C:36, H:37, O:18) 如果想要使用这个特性,需要在R#终端上导入mzkit程序包模块:imports "formula" from "mzkit"; Order by Date Name […]
估计阅读时长: < 1 分钟 https://github.com/rsharp-lang/R-sharp R#语言最开始的开发需求来自于对GCModeller的组件的调用需求。因为最开始GCModeller使用的是命令行模式进行运行,但是因为VB.NET语言为编译型语言,所开发的应用程序在发布之后,用户无法轻易的修改。自己对于一些比较个性化的数据分析,在引入R#语言之前,需要专门编写一段命令行代码跑GCModeller,会十分的不方便。所以后面就有了R#脚本语言的开发。 R#语言类似于R或者Matlab语言,也是一种向量化的编程脚本语言。其语法源自于R语言,同时也结合了一些TypeScript的语法,例如TypeScript之中的字符串插值语法就被引入了R#语言之中。 const words = ["world", "R# language", "GCModeller User"]; const hello = `hello ${words}!`; […]