Hi,大家好,我是编程小6,很荣幸遇见你,我把这些年在开发过程中遇到的问题或想法写出来,今天说一说
空间转录组数据分析_单细胞转录组分析,希望能够帮助你!!!。
Li, J., Chen, S., Pan, X. et al. Cell clustering for spatial transcriptomics data with graph neural networks. Nat Comput Sci 2, 399–408 (2022). https://doi.org/10.1038/s43588-022-00266-5
Dataset | Genes | Cells | Cell Types | Others |
---|---|---|---|---|
MERFISH | 10,050 | 1368 | - | human osteosarcoma cells from 3 batches |
seqFISH+ | 10,000 | 2.050 | 11 | mouse OB (cortex) |
DLPFC | - | - | 12 samples,up to six cortical layers and white matter | human dorsolateral prefrontal cortex |
10× Visium spatial transcriptomics | - | - | human breast cancer |
已有的一种以无监督方式学习图结构数据中节点表示的方法,DGI依赖于最大化训练后的节点表示与图整体特征的互信息
本文通过Readout函数得到整图的特征,即通过聚合节点特征的方式来得到整图的特征表示。最常用的Readout函数为
R ( H ) = σ ( 1 N ∑ i = 1 N h → i ) R\left( H \right) =\sigma \left( \frac{1}{N}\sum_{i=1}^N{\overrightarrow{h}_i} \right) R(H)=σ(N1i=1∑Nhi)
即整图特征=激活函数(每个节点平均特征)
更多DGI相关信息可参考这里
更多Readout相关信息可参考这里
无监督图嵌入方法DGI,形成从原始输入到隐变量的映射。即学习一个映射函数 E ( X , A ) = H = { h 1 , h 2 , . . . , h N } E\left( X,A \right) =H=\left\{ h_1,\ h_2,\ ...,\ h_N \right\} E(X,A)=H={
h1, h2, ..., hN}
其中X为原始节点特征,A为邻接矩阵,H为训练后的节点特征
(1)GCN公式
本文采用标准GCN
(2)激活函数
本文采用参数整流线性单位函数作为激活函数,a为可学习的参数
(3)生成负样本邻接矩阵
A ˉ = C ( A ) \bar{A}=C\left( A \right) Aˉ=C(A)
即负样本邻接矩阵 A ˉ \bar{A} Aˉ为随机图结构,因此可以根据该随机拓扑结构得到每个节点的局部表征 h ˉ i \bar{h}_i hˉi
(4)目标函数
目标函数为DGI目标函数,最大化L,即最大化正样本节点与整图特征的互信息,最小化负样本节点与整图特征的互信息
D为互信息,E表示由不同网络结构训练的模型,s为由正样本图结构训练的得到的整图特征(利用Readout函数由每个节点得到整图特征)
数据集:带有3个复制本的MERFISH,每一列对应一个复制本
第一行为细胞的空间位置,不同颜色对应不同聚类
第二行为该复制本构建的图结构,可看出空间位置近的细胞网络结构紧密
计算邻居富集率:对于一个类别的所有细胞,根据图结构收集每个细胞的邻居细胞,计算邻居细胞属于每个类别的占比,得到邻居富集率
结果表明每个类别的邻居富集率均很高
与MERFISH数据集文献对比,每个聚类仅对应一个细胞周期阶段,且第一列中C0与C3空间位置相近,所以邻居富集度较高。
作者对比CCST与7种其他算法在DLPFC数据集上的聚类性能,常用聚类指标ARI、FMI、NMI值越大表明算法越准确。
空间位置相近的细胞通常属于同一大脑皮层,但有些相近的细胞属于不同大脑皮层。为了测试算法对该现象的识别性,本文采用LISI指标(the local inverse Simpson’s index)衡量细胞的局部多样性,值越小表明不同聚类的空间分离性越好。
在已被良好标注的数据集上,对每种细胞类型进行二分类,以发现潜在细胞亚型。
a图为CCST对中间神经元细胞发现的细胞亚型
b图为2种细胞亚型的邻居富集度分布(图中隐去中间神经元细胞),说明这2种细胞亚型的微环境差异明显
选取top200差异表达基因进行GO分析,c图对应聚类C0,发现主要是神经功能相关;d图对应C1,发现主要是定位调控和细胞迁移等功能。
因此,该人工注释的中间神经元细胞可以分为2个亚型,一个为可以与其他神经元交流的成熟功能性神经细胞,一个为与邻居细胞交互的未成熟细胞,主要进行定位和迁移。这个结论也可从其他文献中得到验证。
同时,作者还在其他3种人工注释的细胞中识别出新的细胞亚型。
今天的分享到此就结束了,感谢您的阅读,如果确实帮到您,您可以动动手指转发给其他人。
上一篇
已是最后文章
下一篇
已是最新文章