遗传学 – この中二病に爆焔を！

估计阅读时长: < 1 分钟UPGMA（Unweighted Pair Group Method with Arithmetic Mean，非加权配对组平均法）是一种经典的基于距离矩阵构建系统发育树的聚类算法。其核心思想是假设进化速率恒定（分子钟假说），通过迭代合并距离最近的两个类群（或序列）来构建树。UPGMA算法具有原理简单，计算速度快，易于理解和实现。对于符合分子钟假说（即所有分支进化速率相同）的数据，能给出正确的拓扑结构这些优点。但是其“进化速率恒定”的假设在现实中常常不成立。如果数据存在明显的速率差异（即存在长枝），UPGMA可能会构建出错误的树（拓扑结构错误）。因此，它更适用于进化速率相对均匀的近缘物种或基因的比较。

【群体遗传学】群体基因型的F检验原理

谢桂纲 -

11:07 AM

估计阅读时长: 7 分钟F统计量是群体遗传学中由Sewall Wright提出的重要统计量，用于衡量遗传变异在群体中的分布情况。它提供了对群体遗传结构和遗传分化的定量描述。F统计量主要有三种类型：Fis、Fit和Fst，分别反映个体内的、总体的和群体间的遗传分化。F统计量在群体遗传学中通常指的是Fst（Fixation Index，固定指数），它是一个衡量群体间遗传差异的指标。Fst的值范围从0到1，其中0表示群体间没有差异，1表示群体间完全分离。在群体遗传学研究中，Fst常用于评估群体的遗传多样性、群体间的迁移率以及自然选择的压力等。 Order by Date Name Attachments 41598_2021_92984_Fig1_HTML • 2 MB • 966 click 2022年5月28日p1 […]

June 2026
S	M	T	W	T	F	S
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

单细胞视角下的微生物基因组代谢酶嵌入分析 – この中二病に爆焔を！ on 基因组功能注释（EC Number）的向量化嵌入2026年2月25日
[…] 我们在基于前面所论述的《通过diamond软件进行blastp搜索》对大规模的基因组数据进行了代谢酶的EC number的注释以及按照文章《基因组功能注释（EC Number）的向量化嵌入》的方法，得到了一个比较大的基因组代谢酶TF-IDF嵌入丰度矩阵后，如果将这里所得到的嵌入结果矩阵中的基因组，基于Family层级的物种分类分组看作为单细胞转录数据中的细胞分群结果，能否基于单细胞数据分析方法来分析和可视化我的基因组功能嵌入的结果矩阵呢？ […]
单细胞视角下的微生物基因组代谢酶嵌入分析 – この中二病に爆焔を！ on 通过diamond软件进行blastp搜索2026年2月25日
[…] 我们在基于前面所论述的《通过diamond软件进行blastp搜索》对大规模的基因组数据进行了代谢酶的EC number的注释以及按照文章《基因组功能注释（EC Number）的向量化嵌入》的方法，得到了一个比较大的基因组代谢酶TF-IDF嵌入丰度矩阵后，如果将这里所得到的嵌入结果矩阵中的基因组，基于Family层级的物种分类分组看作为单细胞转录数据中的细胞分群结果，能否基于单细胞数据分析方法来分析和可视化我的基因组功能嵌入的结果矩阵呢？ […]
基因组代谢酶层级嵌入 – この中二病に爆焔を！ on 酶EC编号结构解析2026年2月23日
[…] 对于基于ec number来生成层级数据，我们直接使用《酶EC编号结构解析》文章末尾所展示的层级数据生成函数来实现。 […]
二叉树聚类可视化微生物群落代谢差异 – この中二病に爆焔を！ on 基因组功能注释（EC Number）的向量化嵌入2026年2月15日
[…] 在前面的一篇《基因组功能注释（EC Number）的向量化嵌入》博客文章中，针对所注释得到的微生物基因组代谢信息，进行基于TF-IDF的向量化嵌入之后。为了可视化向量化嵌入的效果，通过UMAP进行降维，然后基于降维的结果进行散点图可视化。通过散点图可视化可以发现向量化的嵌入结果可以比较好的将不同物种分类来源的微生物基因组区分开来。 […]
谢桂纲 on 通过diamond软件进行blastp搜索2026年2月15日
😲啊？

Posts in 遗传学

UPGMA算法构建进化树

【群体遗传学】群体基因型的F检验原理

Recent Posts

Archives

博客文章

Posts in 遗传学

UPGMA算法构建进化树

【群体遗传学】群体基因型的F检验原理

Recent Posts

Archives

博客文章

Tags