估计阅读时长: 10 分钟 https://github.com/xieguigang/Darwinism NetCDF文件格式(Network Common Data Format)是一种以network byteorder进行编码的CDF数据文件格式。其广泛应用于大气科学、水文、海洋学、环境模拟、地球物理等诸多数据科学计算分析领域内的数据存储。 Order by Date Name Attachments netcdf • 2 MB • […]
估计阅读时长: 5 分钟 https://github.com/xieguigang/Darwinism 对于LINQ数据查询引擎而言,其可以接收任意类型的数据源,进行数据查询。只要存在有相对应的数据源驱动程序即可。 Order by Date Name Attachments sqlite • 18 kB • 77 click 19.06.2021sqlite-contents • […]
估计阅读时长: 7 分钟 https://github.com/xieguigang/Darwinism LINQ(Language Integrated Query)技术是一种语言集成查询,即LINQ是VisualBasic语言之中的一种语法。其由微软公司于.NET Framework 3.5引入的一种SQL查询语言非常相似的数据查询语法。 Order by Date Name Attachments run-LINQ • 90 kB • […]
估计阅读时长: 4 分钟 https://github.com/xieguigang/linux-profiler 废话不多说,首先给出一个 demo报告链接 给大家看看这个小工具的成品输出。 在去年的工作中,因为公司需要购买新的服务器做集群计算,需要一个工具来记录之前的服务器在数据分析上的性能瓶颈。于是花了两天的时间赶出来了这个专门应用于Linux系统的性能记录工具。这个小工具是一个开源项目,大家可以在Github上阅读这个开源项目(linux-profiler)的源代码。 Order by Date Name Attachments systemLoad • 53 kB • 84 […]
估计阅读时长: 4 分钟 https://github.com/xieguigang/Darwinism 最近在做一个代谢组学的数据分析程序,由于需要被分析的质谱原始数据的计算量非常大,所以肯定会需要上并行计算。在并行计算中,分为两种模式:线程并行以及进程并行。 关于如果选择脚本代码的并行模式,我在这里借用了matlab文档网站里面的一张图来给大家做参考: 《Choose Between Thread-Based and Process-Based Environments》 Order by Date Name Attachments super_computing • […]
估计阅读时长: 6 分钟 前段时间由于工作的需要,会需要从一些网站上抓取数据用来做数据分析。在原来我进行网页爬虫开发的时候,一般会需要专门针对网页格式,使用大量的正则表达式进行内容的解析。由于你也知道,VisualBasic语言所开发的程序为一个编译好的Assembly文件,所以假若所需要爬取的网页格式变化了,我们就需要对代码做修改和重新编译。这个时候就会非常的不方便。 Order by Date Name Attachments ea5d2885-bba5-410f-b02b-0589613412ed • 12 kB • 86 click 29.05.2021graphquery_Rscript • 36 […]