估计阅读时长: 2 分钟

在BILIBILI上观看视频:【空间代谢组学】AP-MALDI 质谱成像技术介绍

哈啰,大家好呀,鸽了大半年之后,你们的小姐姐又回来啦。为了更好的制作出质量更高的视频,你们的六神无主鸠小姐姐呀,在这大半年的时间里面一直在努力的学习新技术。经过半年的钻研学习,收获满满。谈到最近几年的热门尖端技术,大家都会谈论到空间转录组和单细胞技术。一般而言,代谢组学的发展要稍微滞后于转录组学研究。最近一年呢,随着空间转录组的热度的降低,空间代谢组的热潮也终于姗姗来迟终于到来了。今天呢,我想要为大家介绍的是在最近几年内出现的,目前比较火热的空间代谢组学研究领域内的质谱成像技术。

利用质谱实现分子成像最早是由范德堡大学的Richard Caprioli等在1997年提出的。作为质谱最年轻的应用之一,质谱成像技术在医学研究、生物学研究、药物研究等诸多领域有着巨大的价值,已经成为质谱研究的一大热点。

质谱成像是以质谱技术为基础的成像方法,该方法通过质谱直接扫描生物样品成像,可以在同一张组织切片或组织芯片上同时分析数百种分子的空间分布特征。简单而言,质谱成像技术就是借助于质谱的方法,再配套上专门的质谱成像软件控制下,使用一台通过测定质荷比来分析生物分子的标准分子量的质谱仪来成像的方法。

目前呢,进行质谱成像主流的硬件设备大抵就是,AP-MALDI组合赛默飞公司的QE设备进行质谱检测,或者布鲁克的MALDI-TOF MS解决方案。对于AP-MALDI而言,其工作原理就是,以低熔点的小分子有机物做基质,吸收激光能量,在其脱附成气态进入气相的过程中发生电离,生成基质离子。中性待测分析物与基质离子发生气相中的质子交换或电子迁移并离子化,进入质谱而被检测到。

通过AP-MALDI离子源在样本表面的扫描移动,就可以将样本切片上不同的空间位置的信号检测到,产生质谱成像的原始数据了。

那,现在我们有了质谱成像的原始数据,我们现在就开始按照惯例,进行质谱成像的代码工作原理的学习吧!

质谱成像的原理

简单的来说,质谱成像就是一个更加精密的热图数据可视化。我们可以把热图中的表示样本的列看作为成像的二维图的X轴坐标,将热图数据可视化中表示每一个gene feature的行看作为质谱成像的二维图中的Y坐标轴。那我们从原始数据中按照遍历XY坐标点依次填充热图的单元格,生成热图的过程就是质谱成像的产生过程了。

那我们是如何将原始数据中的信号值转换为质谱成像图中的颜色值的呢?啊,这个非常简单,我们只需要做一下线性变换就可以了。

在质谱成像的代码开发中,存在有一个专门的术语用于描述将我们的质谱中检测到的离子信号值映射到对应的颜色值之中,这个术语就是灰度值。没错就是灰度图的灰色的深浅值。由于在计算机中表示颜色的通道值的取值范围最多只有255个值,所以我们在进行质谱成像过程中所能够进行映射的最大灰度值也就是0到255之间了。

进行质谱成像中的颜色映射所需要进行的线性变化操作,是非常简单的:我们只需要将得到的信号值集合中的每一个信号值除上我们的信号值集合中的最大信号值,就可以对原始信号值进行线性变换,转换为0到1之间的值了。然后我们根据灰度等级的需求,将[0,1]线性变换过后的值乘上我们的灰度等级后取整数,就可以得到通过线性变换产生的灰度值了。

利用灰度值取出颜色列表中的对应索引位置的颜色,用来填充质谱成像图中对应位置的单元格,依次填充完毕之后就可以得到一幅完整的质谱成像图。假设我们的颜色列表是灰色列表,那我们得到的就是一个原始的灰度图了。假设我们的颜色列表是通过对应的颜色谱产生的表示等级的颜色列表,那我们就可以得到可以对信号值进行高低可视化的热图了。

灰度图优化

那,现在我们来执行我们的线性变换代码,然后染色看看效果。

好像效果也不是那么的好吧。是我们的代码的问题么?检查一遍我们的映射代码,我们是直接从原始数据中的信号值开始做线性变换的。会不会是原始数据出了问题?

那既然首先怀疑是原始数据的问题,我们现在就先对我们的信号值做一下直方图看看数据的分布情况:哇塞,好像我们的质谱原始数据中的信号分布特别的糟糕哦。

是的,在质谱原始数据之中,由于离子的信号响应值强度是与其离子化能力具有很高的相关度的,所以这个就导致了有些离子因为其电离化能力特别高,所以其信号响应值会特别的高。这就导致了,我们所看见的原始数据的信号分布直方图的差异特别的两极分化:少数的离子信号异常的高,大部分的离子的信号值都是非常的低。这就导致能够产生的线性映射的等级非常的不均匀,大部分的离子的灰度等级都是1级。嗯嗯,我们现在来对信号分布计算一下信息墒,可以看见,原始数据的信息墒非常的低,说明目前直接进行原始数据线性变换,我们所能够得到的信息非常的少。

那,有办法来解决这个问题么?别着急,Ignacio Rosas-Román等人通过分析质谱成像分析中的信号值的分布特征,建立了TrIQ信号映射区间的确定方法,基于TrIQ方法可以有效的解决上面所提到的信号分布的异常情况。

在TrIQ方法之中,我们是通过信号值的分布特征,进行分布频率的累加,可以作出一条CDF曲线,得到对应的概率累加值。当我们设定一个预期的目标概率累加值之后,就可以计算出一个信号区间的上限阈值。在这个阈值下,CDF概率累加值与我们的目标概率累加值之间的差值是最小的,并且这个时候用目标信号阈值做区间上限,此时计算出来的信息墒最高,能够从质谱成像图中得到的信息量也就最大化,整个图像的对比度呈最大化。

那,我们接下来应用一下TrIQ算法来构建出信号区间的新上限值,之后重新做分布直方图,计算一下信息墒。

看来我们的信号数据处理方法的效果确实很好,从直方图可以看得到,信号值已经没有了原先那么恐怖的两极分化现象了。信息墒目前也比之前要高上非常多了。说明依照新的信号值区间上限,我们可以得到比之前直接做原始数据映射更多的信息量

好的,最后对处理过后的信号数据进行质谱成像数据可视化,发现整个图像的对比度要比之前的结果要高上许多,整个结果图像也要清晰很多了。


离子通道叠加图

在前面我们介绍的质谱成像可视化,都是基于将离子信号直接通过线性变换映射到一个颜色列表来实现可视化的。一般这种情况我们仅仅能够可视化一种离子或者多种离子的信号混合的结果。如果我们需要将有限的几种离子进行叠加显示,查看目标离子在分布区域上的差异性呢?

别急,我们首先回到颜色的数据结构上来。对于在计算机程序中的一个颜色值而言,其无非就是通过RGB三种颜色的任意组合来进行调色的。那如果我们进行质谱成像的时候,并非将灰度值映射到一个颜色列表上,而是直接映射到对应的RGB通道之中,效果会怎样?

这样子的话,是不是会呈现出:假若一种离子只在一个区域中出现,而我们将这个离子的信号映射到了R通道中,那应该会在该区域出现红色灰度映射。然后我们再叠加另一个区域分布的离子到G通道之中,再叠加在另外区域中分布的离子到B通道之中,是不是就可以进行三原色的叠加,查看看三种离子的区域特异性分布的可视化结果呢。

没错,上面的方法进行质谱成像可视化就是目前在杂志中经常出现的三原色离子叠加图。我们现在来挑选出三种离子,组合在一起进行三原色叠加,可以看见三种离子非常特异性的分布在了整个质谱成像图上的不同的部位区域之中。

Attachments

4 Responses

  1. […] 在上面所提到的线性变化转换过程,其实就是一个热图绘制的过程。我们一般按照不同的颜色谱做线性变换映射,就可以得到对应的不同颜色系列下的NRRD热图成像渲染结果。对于NRRD图像文件的热图成像渲染原理,其实是和质谱成像的渲染原理一摸一样的(对于质谱成像渲染而言,其主要的原理也就是将对应的扫描点上的目标离子的intensity值取出,构建出一个和NRRD文件中的光栅矩阵数据一摸一样的矩阵数据,基于这个矩阵数据进行线性变换映射到对应的颜色值完成热图成像可视化操作)。 […]

    来自中国
  2. […] 如果之前了解过质谱成像热图可视化的原理我们就知道,我们只需要将实际的数据做线性变化,映射到一个颜色列表之中即可。实际上按照对颜色的线性变换映射进行热图绘制的过程是非常的简单的,但是在进行线性变换映射之前,我们需要解决一个颜色列表的数据来源问题:我们在进行热图绘制的时候,会有不同的颜色等级映射需求,例如将数据分成30个等级,60个等级或者120个等级等。数据等级一般会存在好几十个等级,但是我们的颜色版中的关键颜色一般只有几种。在这种情况下我们就需要一种计算方法将我们的颜色填充到这些实际需求的数据等级中去,这种颜色填充的过程就是热图颜色插值。 […]

    来自中国
  3. This is the perfect blog for anyone who wishes to find out about this topic. You understand so much its almost hard to argue with you (not that I actually would want toÖHaHa). You definitely put a brand new spin on a topic that has been discussed for many years. Excellent stuff, just great!

    来自美国

Leave a Reply

Your email address will not be published. Required fields are marked *

博客文章
September 2024
S M T W T F S
1234567
891011121314
15161718192021
22232425262728
2930  
  1. 在mysql之中,针对24小时内的数据按照半个小时进行一次统计数量: ```sql SELECT DATE_FORMAT(FROM_UNIXTIME(FLOOR(UNIX_TIMESTAMP(add_time) / 1800) * 1800), '%Y-%m-%d %H:%i') AS half_hour, COUNT(*) AS count FROM user_track.page_view WHERE add_time >=…

  2. 针对图对象进行向量化表示嵌入: 首先,通过node2vec方法,将node表示为向量 第二步,针对node向量矩阵,进行umap降维计算,对node进行排序,生成node排序序列 第三步,针对node排序序列进行SGT序列图嵌入,实现将网络图对象嵌入为一维向量