文章阅读目录大纲
脂质的分类
LipidMAPS是美国国立卫生院推进的“脂质代谢途径研究计划”,涵盖目前最权威的脂类分类、命名法和结构信息,还囊括了众多的脂质组定性定量方法。此外,它还提供了一些生物信息学分析工具,比如基于质谱的脂质定性工具,通过给定特定的m/z,或特征子离子信息,或二级谱图信息,可以预测可能的脂质分子;又比如可以管理、可视化及编辑脂质信号通路等。
在LipidMaps数据库之中,定义了脂质代谢物的8大类型:
脂质分类 | 中文名称 | 说明 |
---|---|---|
Fatty Acyls [FA] | 脂肪酰(FA) | 脂肪酸和脂肪酰基具有一系列重复的亚甲基,这些亚甲基赋予这类脂质疏水性。脂肪酸 (Fatty Acids),主链由重复亚甲基序列构成,末端为羧基。脂肪酰也称脂酰化合物,泛指脂肪酸及含有脂肪酸残基的脂质。脂肪酰是由乙酰辅酶A和丙二酰辅酶A及甲基丙二酸单酰辅酶A经由脂肪酸合成反应而得的多种分子。 |
Glycerolipids [GL] | 甘油酯(GL) | 甘油酯是甘油(丙三醇)上的羟基与脂肪酸酯化的产物。甘油与脂肪酸的酯化产物(不包括甘油磷脂)。甘油酯根据甘油的羟基被酯化的个数而分类。甘油中一个羟基被酯化称为单甘油酯,两个羟基被酯化称为甘油二酯,三个羟基被酯化称为甘油三酯。 |
Glycerophospholipids [GP] | 甘油磷脂(GP) | 甘油磷脂因为甘油上的羟基被酯化的个数分为甘油磷脂和溶血甘油磷脂。 |
Sphingolipids [SP] | 鞘脂类(SP) | 鞘脂是一组复杂化合物的统称,有共同的鞘氨醇骨架(sphingoid base)。鞘氨醇分子的C1、C2、C3带有功能基团-OH、-NH2、-OH,与甘油磷脂中甘油的三个羟基在结构上相似。由丝氨酸和长脂肪链的酰基辅酶A从头合成,之后转换为神经酰胺、磷鞘脂、糖鞘脂和其它化合物。哺乳类体内的鞘脂主要以鞘磷脂为主,而昆虫体内则主要是磷酸乙醇胺神经酰胺,真菌体内有植物神经磷酸肌醇及含有甘露糖的鞘脂。 |
Sterol Lipids [ST] | 固醇脂(Sterol lipids,ST) | 固醇脂又称甾醇脂,固醇脂的类别主要根据生物学功能进行细分。固醇脂包括固醇(Sterols),类固醇(Steroids),Secosteroids,胆汁酸及其衍生物(Bile acids and derivatives),类固醇轭合物(Steroid conjugates),Hopanoids,以及其他类。固醇(Sterols)里包括,胆固醇,麦角甾醇,豆甾醇,C24丙固醇等等。胆固醇及其衍生物在哺乳动物系统中得到了最广泛的研究,与甘油磷脂和鞘磷脂一起构成了膜脂的重要组成部分。胆固醇是三个六碳环(A、B、C环) 和一个五碳环(D环)稠合而成,这种母核为环戊烷多氢菲母核。 |
Prenol Lipids [PR] | 异戊烯醇脂(Prenol lipids,PR) | 异戊烯醇脂类以异戊烯醇序列作为母核的化合物,是异戊二烯单位的缩合体,即类萜(terpens)。重复单位以C-C键连接在一起,呈非极性。两个异戊二烯单位头尾连接就形成单萜;含有4个、6个和8个异戊二烯单位的萜类化合物分别称为双萜、三萜或四萜。还有一些化合物可以看作是异戊烯醇脂类的衍生物,它们与类萜关系密切,但其结构式并不是五碳单位的偶数倍数,如缺少一个碳原子的檀烯,以及我们曾经介绍过的龙脑、樟脑。 |
Saccharolipids [SL] | 糖脂(Saccharolipids,SL) | 糖脂是指脂肪酸直接与糖骨架连结的化合物,形成与双层脂膜相容的结构。在糖脂中,由糖取代了甘油酯和磷脂中甘油的骨架角色,脂酰的数目不必区分是何种键,酰胺键或酯键。糖脂可以作为多糖或磷酸化的衍生物出现。 |
Polyketides [PK] | 聚酮类(Polyketides,PK) | 聚酮类是在聚酮合酶的作用下催化乙酰基和丙酰基单元的聚合形成。主要可分为芳香族聚酮化合物和复合聚酮化合物。结构和功能最多样化的天然产物之一,很大一部分是环形分子,骨架可以进一步糖基化、甲基化、羟基化、氧化等。聚酮合成酶产生的天然产物结构的多样性要大得多,其中许多具有脂质的特征。I类聚酮化合物合酶形成受约束的大环内酯,大小通常为14至40个原子,而II类和III类聚酮化合物合酶产生复杂的芳香环系统。聚酮化合物主链通常通过糖基化,甲基化,羟基化,氧化和/或其他过程进一步修饰。一些聚酮与非核糖体合成的肽连接以形成杂合支架。许多常用的抗菌、抗寄生虫、抗癌药物是聚酮或其衍生物。这些药物包括红霉素,四环素,制霉菌素,阿维菌素和抗肿瘤埃博霉素。 |
Lipid Classification System
The LIPID MAPS® Lipid Classification System is comprised of eight lipid categories, each with its own subclassification hierarchy. All lipids in the LIPID MAPS® Structure Database (LMSD) have been classified using this system and have been assigned LIPID MAPS® ID's (LM_ID) which reflects their position in the classification hierarchy. LMSD can be searched by lipid class, common name, systematic name or synonym, mass, InChIKey or LIPID MAPS® ID with the search box in the banner, or alternatively, by LIPID MAPS® ID, systematic or common name, mass, formula, category, main class, subclass data, or structure or sub-structure with one of the search interfaces in the LMSD database section. Each LMSD record contains an image of the molecular structure, common and systematic names, links to external databases, Wikipedia pages (where available), other annotations and links to structure viewing tools. In addition to LMSD search interfaces, you can drill down through the classification hierarchy below to the LMSD record for an individual lipid.
脂质命名规律
脂质代谢物的命名规则一般是以如下格式呈现的:
。对于chemotaxonomy而言,其就是脂质物质的分子骨架分类,例如FA, PC, LPC, SM, Cer, TG, Zye等;carbon指的是脂质代谢物之中的碳链上的碳原子数量,例如18指目标脂质物质中的碳链上存在有18个碳原子;紧随碳原子数量后面的一个数字表示分子结构之中的双键的数量,例如2表示目标脂质物质中存在有2个双键。chemotaxonomy (carbon:double_bond)
举一个实际的例子:LysoPC(20:5),从这个名字之中我们可以了解到目标脂类物质是基于LysoPC(lysophospholipid, LyP)基础框架延申出来的。其碳链为20个碳原子的链条长度,并且在其碳链上存在有5个双键。
从上图的化学结构之中我们可以非常清楚地看得出来,LysoPC左边的碳链上存在有20个碳原子,并且在这条链上存在有5个双键。对于一般性的非靶向脂质代谢组学而言,由于脂质物质注释目前并没有太多的标准品数据用于比对计算分析得到注释结果,更一般的脂质注释方法一般为通过分子结构做谱图预测,基于谱图预测来完成比对注释分析。所以在脂质非靶代谢组学结果数据中,我们的脂类物质一般是可以根据母离子mz确认可能存在的化学元素组成,但是具体的分子结构在非靶脂质组学注释中并不会有太高的置信度。所以假若我们阅读基于LCMS非靶的脂质组学的文献,会发现文献中多以LysoPC(20:5)这类用于描述脂质物质的化学组成的通用名称,而非具体展开其化学结构。
碳链结构描述
那假若现在我们需要具体的描述目标脂质代谢物的化学结构呢,在其对应的代谢物名称中该怎样进行系统性的命名呢?这个说起来也是非常简单的,仍然以上面的
为例子:如果我们需要用名字描述出上面的具体的分子结构,我们可以将LysoPC(20:5)展开为:LysoPC(20:5)
LysoPC(20:5(5Z,8Z,11Z,14Z,17Z))
。是不是看着这个长串的名字就开始头晕了,别着急,现在开始来详细说明一下这个分子结构名称。
在脂类物质的根据分子结构进行系统命令的规则之中,除了碳原子数和双键数规则之外,还存在有双键的顺式(cis)和反式(trans)的规定。对于这类涉及到具体的分子结构特征的规则之中,其格式一般为
。即某一个双键的碳原子编号上的双键是顺式还是反式的。例如5Z表示编号为5的碳原子上存在有一个碳碳双键。index[ZE]
: cis,顺式异构;两个相同原子或基团在双键的同侧的为顺式异构。Z
:trans,反式异构;两个相同原子或基团在双键的异侧的为反式异构。E
现在再回到上面的分子结构图上面,我们可以从左往右计数数出左边的碳链之中的5个顺式的碳碳双键的原子编号分别为5,8,11,14,17号碳原子上,所以我们就可以得到一个可以更加进一步描述分子结构的系统名称:LysoPC(20:5(5Z,8Z,11Z,14Z,17Z))
上面的举例为单条碳支链的情况,假若我们的目标脂类物质中存在有多条碳支链的时候又该怎么处理命名呢。这个很简单,我们只需要在碳数之间使用下划线(_)
或者斜线(/)
分开即可。例如对于下面的具有两条碳链的脂质物质,可以命名为:
。SM(d19:1/16:0)
Sphingomyelin (d19:1/16:0) or SM(d19:1/16:0) is a type of sphingolipid found in animal cell membranes, especially in the membranous myelin sheath which surrounds some nerve cell axons. It usually consists of phosphorylcholine and ceramide. SM(d19:1/16:0) consists of a nonadecasphingosine backbone and a palmitic acid chain. In humans, sphingomyelin is the only membrane phospholipid not derived from glycerol. Like all sphingolipids, SM has a ceramide core (sphingosine bonded to a fatty acid via an amide linkage). In addition, it contains one polar head group, which is either phosphocholine or phosphoethanolamine. The plasma membrane of cells is highly enriched in sphingomyelin and is considered largely to be found in the exoplasmic leaflet of the cell membrane. However, there is some evidence that there may also be a sphingomyelin pool in the inner leaflet of the membrane. Moreover, neutral sphingomyelinase-2, an enzyme that breaks down sphingomyelin into ceramide, has been found to localize exclusively to the inner leaflet further suggesting that there may be sphingomyelin present there. Sphingomyelin can accumulate in a rare hereditary disease called Niemann-Pick Disease, types A and B. Niemann-Pick disease is a genetically-inherited disease caused by a deficiency in the enzyme sphingomyelinase, which causes the accumulation of sphingomyelin in spleen, liver, lungs, bone marrow, and the brain, causing irreversible neurological damage. SMs play a role in signal transduction. Sphingomyelins are synthesized by the transfer of phosphorylcholine from phosphatidylcholine to a ceramide in a reaction catalyzed by sphingomyelin synthase.
对于上面的名称之中的两条碳链上的碳原子数量和双键数量,大家可以对照着上面的分子结构图自己数一下就可以明白了。
官能团位置
除了上面所提到的碳链之中的双键位置我们可以详细描述出来,我们也可以在脂质物质的系统命名之中添加相应的官能团的位置描述。例如下面所示的脂质物质
,我们可以了解到:PC(22:6(4Z,7Z,10Z,13Z,16Z,19Z)/20:5(5Z,8Z,11Z,14Z,16E)-OH(18R))
PC(22:6(4Z,7Z,10Z,13Z,16Z,19Z)/20:5(5Z,8Z,11Z,14Z,16E)-OH(18R)) is an oxidized phosphatidylcholine (PC or GPCho). Oxidized phosphatidylcholines are glycerophospholipids in which a phosphorylcholine moiety occupies a glycerol substitution site and at least one of the fatty acyl chains has undergone oxidation. As all oxidized lipids, oxidized phosphatidylcholines belong to a group of biomolecules that have a role as signaling molecules. The biosynthesis of oxidized lipids is mediated by several enzymatic families, including cyclooxygenases (COX), lipoxygenases (LOX) and cytochrome P450s (CYP). Non-enzymatically oxidized lipids are produced by uncontrolled oxidation through free radicals and are considered harmful to human health (PMID: 33329396 ). As is the case with diacylglycerols, glycerophosphocholines can have many different combinations of fatty acids of varying lengths, saturation and degrees of oxidation attached at the C-1 and C-2 positions. PC(22:6(4Z,7Z,10Z,13Z,16Z,19Z)/20:5(5Z,8Z,11Z,14Z,16E)-OH(18R)), in particular, consists of one chain of one 4Z,7Z,10Z,13Z,16Z,19Z-docosahexaenoyl at the C-1 position and one chain of 18-hydroxyleicosapentaenoyl at the C-2 position. Phospholipids are ubiquitous in nature and are key components of the lipid bilayer of cells, as well as being involved in metabolism and signaling. Similarly to what occurs with phospholipids, the fatty acid distribution at the C-1 and C-2 positions of glycerol within oxidized phospholipids is continually in flux, owing to phospholipid degradation and the continuous phospholipid remodeling that occurs while these molecules are in membranes. Oxidized PCs can be synthesized via three different routes. In one route, the oxidized PC is synthetized de novo following the same mechanisms as for PCs but incorporating oxidized acyl chains (PMID: 33329396 ). An alternative is the transacylation of one of the non-oxidated acyl chains with an oxidated acylCoA (PMID: 33329396 ). The third pathway results from the oxidation of the acyl chain while still attached to the PC backbone, mainely through the action of LOX (PMID: 33329396 ).
- 其分子之中包含有两条碳支链,其中一条支链为22个碳原子,包含有6个双键。同理,另一条碳支链上为20个碳原子,5个双键构成。
- 两条碳支链上的双键的位置我们也可以非常直观的从名称中了解到
- 但是第二条碳支链上还特别存在有一个羟基取代了对应的氢
那,现在我们就可以了解到,除了双键的位置我们可以在系统命名中标注出来,我们还可以将某条碳支链上对应的碳原子位置上的官能团给标注出来。下面总结了一些比较常见出现的官能团列表。
常见官能团以及缩写
中文 | 英文 | 简写 | 中文 | 英文 | 简写 |
---|---|---|---|---|---|
乙基支链 | Ethyl branch | Et | 甲基支链 | Methyl branch | Me |
溴代 | Bromo | Br | 氯代 | Chloro | Cl |
氟代 | Fluoro | F | 碘代 | Iodo | I |
硝基 | Nitro | NO2 | 环氧基 | Epoxy | Ep |
过氧基 | Peroxy | OO | 甲氧基 | Methoxy | OMe |
烷氧基(醚) | Alkoxy(ether) | oxy | 氨基 | Amino | NH2 |
氢过氧基 | Hydroperoxy | OOH | 磺酰基 | Sulfonyl | SH |
羟基 | Hydroxy | OH | 氧代(酮/醛) | Oxo(keto/aldehyde) | oxo |
氰基 | Cyano | CN | 磷酸盐 | Phosphate | P |
硫酸盐 | Sulfate | S | 羧基 | Carboxylic acid | COOH |
氨基乙酸 | Glycine | G | 氨基乙磺酸 | Taurine | T |
环丙基 | Cyclopropyl | cy3 | 环丙烯基 | Cyclopropenyl | cy3:1 |
环丁基 | Cyclobutyl | cy4 | 环戊基 | Cyclopentyl | cy5 |
环己基 | Cyclohexyl | cy6 |
- 【MZKit】简单自动化组织分区 - 2023年11月5日
- 【MZKit教程】质谱成像原始数据文件查看 - 2023年6月29日
- 生物序列图嵌入算法 - 2023年6月29日
No responses yet