clustering – この中二病に爆焔を！

Abdelmoula, W.M., Lopez, B.GC., Randall, E.C. et al. Peak learning of mass spectrometry imaging data using artificial neural networks. Nat Commun 12, 5544 (2021). https://doi.org/10.1038/s41467-021-25744-8

估计阅读时长: 4 分钟基于UMAP工具进行简单的自动化组织分区操作在这里我们假设已经可以正常的将空间代谢数据导入至MZKit工作站软件之中。假若需要借助于MZKit工作站软件进行切片组织样本的自动化分区操作，相关的功能可以在【MSI Analysis】菜单栏中寻找到。在这里我们打开【Show Map Layer】按钮，选择【UMAP and clustering】功能。基于降维的组织自动化分区原理因为降维操作一般是一种特征提取操作，所以经过降维之后，在高维度空间上无法显现的特征，在低维度会呈现出来。在高维度空间散落的相近的数据点，在经过特征提取之后，低维度上会产生相似的特征信息，相互聚集在一簇。这样子我们就可以在低维度空间上通过一些聚类算法讲这些特征进行聚类，最后将聚类特征结果标记到各个散点上的对应的原始成像空间上，我们就可以看见组织分区的结果了。 Abdelmoula, W.M., Lopez, B.GC., Randall, E.C. et […]

生物序列图嵌入算法

谢桂纲 -

12:50 AM

估计阅读时长: 7 分钟假若现在有两条Fasta序列放在你面前，现在需要你进行这两条Fasta序列的相似度计算分析。如果对于我而言，大学刚毕业刚入门生物信息学的时候，可能只能够想到通过blast比对的方式进行序列相似性计算分析。基于blast比对方式可以找到生物学意义上的序列相似性结果，但是计算的效率会比较低。假设现在让你使用这些序列进行机器学习建模分析，或者基于传统数学意义上的基于相似度的无监督聚类分析的时候，面对这些长度上长短不一的生物序列数据，可能会比较蒙圈，因为传统的数学分析方法都要求我们分析的目标至少应该是等长的向量数据。 Order by Date Name Attachments Fasta-A • 544 kB • 185 click 2023年6月29日visualize • 45 […]

【基因组学】构建全基因组调控网络

谢桂纲 -

1:19 PM

估计阅读时长: 7 分钟一般而言，进行全基因组的转录表达调控网络的建立，我们需要基于两个数据结果来完成：目标基因的转录调控位点信息（Motif搜索结果，构成网络之中的节点）转录调控位点相应的转录调控因子（Motif位点相关的转录调控因子，构成网络之中的边连接） Order by Date Name Attachments Xor • 271 kB • 244 click 2022年6月11日An […]

【基因组学】Motif发现与序列扫描方法

谢桂纲 -

10:51 PM

估计阅读时长: 12 分钟Motif是一段典型的序列或者一个结构。一般情况下是指构成任何一种特征序列的基本结构。通俗来讲，即是有特征的短序列，一般认为它是拥有生物学功能的保守序列，可能包含特异性的结合位点，或者是涉及某一个特定生物学过程的有共性的序列区段。比如蛋白质的序列特异性结合位点，如核酸酶和转录因子。 Order by Date Name Attachments Smith-Waterman-Algorithm-Example-Step3 • 8 kB • 246 click 2022年6月7日motifPilesHeatmap-1 • 227 […]

MetaDNA代谢物注释算法原理详解

谢桂纲 -

9:30 PM

估计阅读时长: 6 分钟访问在线服务： http://metdna.zhulab.cn/ Metabolite identification is the long-standing challenge for liquid chromatography-mass spectrometry (LC-MS)-based untargeted metabolomics. Here, […]

基于DBSCAN算法进行聚类

谢桂纲 -

11:09 PM

估计阅读时长: 2 分钟imports "clustering" from "MLkit"; require(graphics2D); multishapes = read.csv("./multishapes.csv"); [x, y] = list(multishapes[, "x"], multishapes[, "y"]); print(multishapes, […]

【ggplot】绘制三维散点图

谢桂纲 -

1:13 AM

估计阅读时长: 14 分钟https://github.com/rsharp-lang/ggplot 之前在阅读一篇单细胞组学数据分析的文献，觉得在文献之中有一些三维散点图用于展示降维聚类结果的效果非常的好看。于是自己在R#语言之中的ggplot程序包的2D绘图的功能基础之上，进行了三维图形数据可视化功能的开发。 (A) t-SNE map projecting myeloid cells from BC1-8 patients (all tissues). Cells are colored […]

PhenoGraph算法详细实现

谢桂纲 -

5:43 PM

估计阅读时长: 15 分钟https://gcmodeller.org 在这篇博客文章之中，我主要是来详细介绍一下是如何从头开始实现Phenograph单细胞分型算法的。在之前的一篇博客文章《【单细胞组学】PhenoGraph单细胞分型》之中，我们介绍了Phenograph算法的简单原理，以及一个在R语言之中所实现的Phenograph算法的程序包Rphenograph。在这里我主要是详细介绍在GCModeller软件之中所实现的VisualBasic语言版本的Phenograph单细胞分型算法。 Attachments Rphenograph • 236 kB • 235 click 2021年9月20日

HR2MSI mouse urinary bladder S096 - spatial regions

【图像处理】基于Contour Tracing 方法获取多边形轮廓

谢桂纲 -

9:38 PM

估计阅读时长: 10 分钟https://github.com/xieguigang/sciBASIC 最近在研究实现空间代谢组学中的一些特征区域的自动化划分分割。在得到了特征点集合之后，我们需要根据一些图像处理算法进行特征区域的提取操作。之前，我们尝试过基于绘制等高线图Marching Squares算法的方式来将特征点集合自动转换为特征区域的多边形，实现轮廓扫描获取的功能。但是实现的效果嘛，和实际的区域存在着一些较大的差异。 Order by Date Name Attachments HR2MSI mouse urinary bladder S096 - spatial regions […]

pxocgx01_blastx against multiple related xanthomonas species

KEGG的BHR评分注释直系同源

谢桂纲 -

12:28 PM

估计阅读时长: 8 分钟https://gcmodeller.org/ KEGG is a database resource for understanding high-level functions and utilities of the biological system, […]

Posts in clustering

【MZKit】简单自动化组织分区

生物序列图嵌入算法

【基因组学】构建全基因组调控网络

【基因组学】Motif发现与序列扫描方法

MetaDNA代谢物注释算法原理详解

基于DBSCAN算法进行聚类

【ggplot】绘制三维散点图

PhenoGraph算法详细实现

【图像处理】基于Contour Tracing 方法获取多边形轮廓

KEGG的BHR评分注释直系同源

Recent Posts

Archives

博客文章

Posts in clustering

【MZKit】简单自动化组织分区

生物序列图嵌入算法

【基因组学】构建全基因组调控网络

【基因组学】Motif发现与序列扫描方法

MetaDNA代谢物注释算法原理详解

基于DBSCAN算法进行聚类

【ggplot】绘制三维散点图

PhenoGraph算法详细实现

【图像处理】基于Contour Tracing 方法获取多边形轮廓

KEGG的BHR评分注释直系同源

Recent Posts

Archives

博客文章

Tags