估计阅读时长: 8 分钟在之前的BioDeep代谢物数据库整合工作之中,所提取的代谢物注释信息的唯一编码是来自于数据库表之中的递增主键。由于数据库之中的递增主键的唯一编码值是与数据内容完全无关的数据,所以在基于图数据库做数据库整合的结果在两次整合操作之后,可能会因为先后输出顺序不一致的原因,得到的在关系型数据库中的唯一递增编号可能会完全不一样了。这个问题会对数据库更新操作造成非常大的困扰。 Order by Date Name Attachments 450px-Hash_table_5_0_1_1_1_1_1_LL • 26 kB • 296 click 2022年4月16日metadata-table • 58 […]
估计阅读时长: 7 分钟Assembles a manifold that is defined through a series of overlapping, locally-defined PCA subspaces. Non-mutual k-nearest-neighborhoods […]
估计阅读时长: 5 分钟目前我们根据质谱数据进行代谢物ROI注释分析,很大一部分的工作是建立在已经可以被纯化的化合物的纯标准品所建立的标准品库数据的比对操作之上的。但是依赖于质谱参考谱图数据库所完成的代谢物注释分析,也仅能够得到很小的一部分结果,因为能够纯化或者合成的化合物在整个自然界中目前只占比较小的一部分。并且购买标准品也会需要耗费大量的实验室资金预算。 Order by Date Name Attachments The-Periodic-Table • 2 MB • 386 click 2022年3月20日Leucine[M+H]+ • 33 […]
估计阅读时长: 5 分钟单细胞轨迹可以揭示基因调控如何控制细胞命运:大多数细胞状态转变,无论是在发育,重编程或者是疾病异常状态,都以基因表达变化的级联为特征。 Order by Date Name Attachments vec • 722 kB • 351 click 2022年3月17日Slide10 • 14 […]
估计阅读时长: 5 分钟https://github.com/xieguigang/graphQL 构建一个图数据库,可以用来帮我们解决复杂的知识关联计算问题。例如我们想要程序向我们回答dihydrogen oxide与water是否是同一个东西。如果光从字符串比较角度上面来看待这个问题的话,很显然,二者的字符串比较结果肯定是False。面对上面的这个问题,图数据库则可以很简单的向我们回答道上面的两个字符串都是指代的同一个东西。 Order by Date Name Attachments tumblr_inline_mqvdlydGCp1qz4rgp • 124 kB • 296 click 2022年3月5日Capture […]
估计阅读时长: 2 分钟imports "clustering" from "MLkit"; require(graphics2D); multishapes = read.csv("./multishapes.csv"); [x, y] = list(multishapes[, "x"], multishapes[, "y"]); print(multishapes, […]
估计阅读时长: < 1 分钟https://github.com/rsharp-lang/R-sharp 前言 经过了2021年一年时间的奋斗,目前R#脚本语言环境终于可以算是能够支撑起比较完整的数据分析流程了。在2021年这段时间,我为R#脚本语言环境大概做了以下几件我认为是比较里程碑式的工作: 建立起了一个比较成熟的脚本打包系统 仿照R语言引入了ggplot和ggraph类似的作图系统 借助于mzkit的开发,将R#语言成功的应用于商业化的质谱数据分析产品之中 为了扩大R#语言环境的受众,在2022年初,也就是这个月内,我相继为Python语言和Julia语言添加了对R#语言环境的支持。下面我们就来聊聊在R#语言环境中的对上面所提到的两种语言的支持。 Order by Date Name Attachments programming • 262 kB […]
估计阅读时长: 18 分钟https://github.com/rsharp-lang/R-sharp/tree/master/studio/RData 如果我们需要将上游的R数据分析环境之中的数据集串流至下游的R#数据分析环境之中,构建出一个不同的数据分析环境混合在一块的自动化数据分析流程。我们一般会需要将上游的R环境之中的数据符号对象以RData的格式串流到下游环境中,下游环境进行反序列化加载数据到环境中执行相应的分析。例如在下游执行定制化程度更高的数据作图,将数据以在上游R环境中比较困难实现的其他二进制文件格式进行保存,或者进行分布式的跨物理机的集群化计算,等等用于实现单纯依靠R环境所比较困难实现的功能。 从上一篇博客文章之中我们比较下详细的了解了RData数据文件的文件格式以及对应的读取操作。在这篇文章之中我们来了解如何基于我们通过对RData文件读取操作所获取得到的链表数据进行反序列化操作,将R环境之中的数据集串流加载到下游的R#数据分析环境之中。 Order by Date Name Attachments rstudio-og-fb-1-1024x538 • 39 kB • 324 click 2021年12月4日read-vector […]
估计阅读时长: 17 分钟https://github.com/rsharp-lang/R-sharp/tree/master/studio/RData 在最近的工作中,需要将Docker容器内的R环境之中的数据集无缝的串流到下游的.NET Core数据分析环境之中,基于.NET Core代码库进行数据可视化之类的操作。目前在R环境与.NET Core环境之间进行交互仅存在有一个比较出名的R.NET项目。但是对于使用R.NET项目而言,我们只能够在.NET Core环境之中调用R环境做数据分析,并不能够实现R环境调用.NET Core数据分析环境。并且R.NET项目必须要依赖于R环境对应的库文件,所以使用R.NET并不能够满足我们在Docker容器间进行R数据分析环境与.Net Core数据分析环境之间的无缝衔接。 Order by Date Name Attachments RStudio_Logo • 185 […]
估计阅读时长: 10 分钟https://github.com/xieguigang/ms-imaging Order by Date Name Attachments HR2MSI_mouse_urinary_bladder_S096_RGB • 7 MB • 332 click 2021年11月13日peerj-cs-07-585 • 16 […]
you can try search video on bilibili.com
Скажите, пожалуйста, есть ли учебные материалы по программному обеспечению mzkit, упомянутому в статье? Я искал в интернете, но не нашел…
well, errrrrrr. Although the mzPack file format offers excellent compatibility with all mass spectrometry data analysis applications, from LC-MS, GC-MS,…
Thank you for your thoughtful comment. Your interpretation of the Best Hit Ratio (BHR) score is entirely accurate and demonstrates…
Очень интересно! Здесь предложен новый универсальный бинарный формат файлов для хранения данных масс-спектрометрии. Не могли бы вы подробно рассказать об…