估计阅读时长: 5 分钟https://github.com/xieguigang/Darwinism 最近在做一个代谢组学的数据分析程序,由于需要被分析的质谱原始数据的计算量非常大,所以肯定会需要上并行计算。在并行计算中,分为两种模式:线程并行以及进程并行。 关于如果选择脚本代码的并行模式,我在这里借用了matlab文档网站里面的一张图来给大家做参考: 《Choose Between Thread-Based and Process-Based Environments》 Order by Date Name Attachments super_computing • […]
估计阅读时长: 3 分钟在BILIBILI上观看视频:《【GCModeller教程】基因组GO功能注释原理》 哈喽,各位小伙伴们好啊,你们可爱的六神无主鸠今天又开新课了。今天主要为大家讲解的内容是GO基因功能注释的原理和操作。在开始今天的新视频前,我先为大家来讲一个圣经中的神话: 大洪水过去后, 诺亚的三个儿子的后裔形成了人类的三大支系,居住在世界各地,遍布地面。那时候人们的语言、口音都没有分别。他们在往东边迁移的时候,在示拿这个地方遇见一片平原,就在那里住下。因为在平原上,用作建筑的石料很不易得到,他们就发明了制造砖的方法,用泥作成方块,再用火烧透,他们就拿砖当石头,又拿石漆当灰泥,建造起繁华的巴比伦城。 人们为自己的业绩感到骄傲,他们决定在巴比伦修一座通天的高塔,来传颂自己的赫赫威名,并作为集合全天下弟兄的标记,以免分散。因为大家语言相通,同心协力,阶梯式的通天塔修建得非常顺利,很快就高耸入云。 上帝是不允许凡人达到自己的高度的。他看到人们这样统一强大,心想,他们语言都一样,如果真修成宏伟的通天塔,那以后还有什么事干不成呢? 必须制止人类接近自己的狂妄。上帝就离开天国到人间,变乱了人们的语言。人们各自操起不同的语言,感情无法交流,思想很难统一。修造工程因语言纷争而停止了,通天塔的建造终于半途而废了。 Order by Date Name Attachments gene_ontology_annotation • 576 kB […]
估计阅读时长: 2 分钟在BILIBILI上观看视频:《【GCModeller教程】基因组功能富集计算原理》 Order by Date Name Attachments 20190818_GSEA_release.mp4_20190921_225144.467 • 226 kB • 689 click 2021年5月30日Fisher Exact Test […]
估计阅读时长: 2 分钟在BILIBILI上观看视频:《【GCModeller教程】KEGG代谢途径注释原理 (重置版)》 Order by Date Name Attachments kegg_annotation • 468 kB • 787 click 2021年5月30日release.mp4_20190921_225235.396 • […]

[…] 在前面的一篇《基因组功能注释(EC Number)的向量化嵌入》博客文章中,针对所注释得到的微生物基因组代谢信息,进行基于TF-IDF的向量化嵌入之后。为了可视化向量化嵌入的效果,通过UMAP进行降维,然后基于降维的结果进行散点图可视化。通过散点图可视化可以发现向量化的嵌入结果可以比较好的将不同物种分类来源的微生物基因组区分开来。 […]
😲啊?
谢老师,写快点呀,在看着你更新文章呢。
[…] 最近的工作中我需要按照之前的这篇博客文章《基因组功能注释(EC Number)的向量化嵌入》中所描述的流程,将好几十万个微生物基因组的功能蛋白进行酶编号的比对注释,然后基于注释结果进行向量化嵌入然后进行数据可视化。通过R#脚本对这些微生物基因组的蛋白fasta序列的提取操作,最终得到了一个大约是58GB的蛋白序列。然后将这个比较大型的蛋白序列比对到自己所收集到的ec number注释的蛋白序列参考数据库之上。 […]
[…] […]