




如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号CN116825186A (43)申请公布日2023.09.29 (21)申请号202310723261.5 (22)申请日2023.06.19 (71)申请人西北工业大学 地址710072陕西省西安市碑林区友谊西 路127号 (72)发明人彭佳杰杨光 (74)专利代理机构苏州隆恒知识产权代理事务 所(普通合伙)32366 专利代理师周子轶 (51)Int.Cl. G16B20/00(2019.01) G16B40/00(2019.01) 权利要求书2页说明书13页附图3页 (54)发明名称 基于生成对抗网络的单细胞数据批次效应 校正方法 (57)摘要 本申请实施例提供了一种基于生成对抗网 络的单细胞数据批次效应校正方法,包括:对单 细胞数据进行测序,从而得到高维单细胞基因表 达计数矩阵;对高维单细胞基因表达计数矩阵基 于识别模型根据变分推断的方式进行计算学习, 从而去近似估计后验分布,且利用随机生成的高 斯噪声和高维单细胞数据的分布均值和分布方 差近似估计潜在低维表示分布,从而获得近似的 低维表示向量;基于生成模型对所述低维表示向 量进行重构,从而获得单细胞重构原始数据;其 中,在生成模型重构所述低维表示向量时,对低 维表示向量加批次标签,用于去除批次效应。 CN116825186A CN116825186A权利要求书1/2页 1.基于生成对抗网络的单细胞数据批次效应校正方法,其特征在于,所述方法包括: 对所述单细胞数据进行测序,从而得到高维单细胞基因表达计数矩阵; 对所述高维单细胞基因表达计数矩阵基于识别模型根据变分推断的方式进行计算学 习,从而去近似估计后验分布,且利用随机生成的高斯噪声和高维单细胞数据的分布均值 和分布方差近似估计潜在低维表示分布,从而获得近似的低维表示向量; 基于生成模型对所述低维表示向量进行重构,从而获得单细胞重构原始数据; 其中,在所述生成模型重构所述低维表示向量时,对所述低维表示向量加批次标签,用 于去除批次效应; 将生成对抗网络中生成器并入所述识别模型,从而生成新生成模型,利用所述新生成 模型对所述高维单细胞基因表达计数矩阵与所述单细胞重构原始数据进行判别得分,从而 提高所述生成模型重构数据的能力。 2.根据权利要求1所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征 在于,在对所述低维表示向量进行重构的过程中包括: 通过负二项分布拟合单细胞数据,且使用零膨胀模型拟合dropout事件,从而降低 dropout事件发生的概率,减小所述单细胞重构原始数据与所述单细胞数据之间的偏差。 3.根据权利要求2所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征 在于,基于零膨胀模型与负二项分布模型对所述单细胞数据进行拟合的过程中包括: 将负二项分布模型分为发生dropout事件和未发生dropout事件,再利用生成模型分别 拟合零膨胀、负二项分布模型的三个参数:dropout事件发生的概率、负二项分布的离散度 和表达均值。 4.根据权利要求1所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征 在于,所述生成对抗网络中的所述判别器进行判别的过程中包括: 所述生成对抗网络中的生成器根据所述判别器的评分更新网络参数,从而生成与真实 的所述单细胞数据相近的所述单细胞重构原始数据。 5.根据权利要求1所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征 在于,在获得近似的所述低维表示向量的过程中: 基于星型生成对抗网络,对多批次的所述单细胞数据选择一个目标批次,将其余批次 的所述单细胞数据统一通过生成器映射到所述目标批次所在的数据分布空间中,从而校正 不同批次的所述单细胞数据之间的批次效应。 6.根据权利要求5所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征 在于,在所述星型生成对抗网络校正不同批次的所述单细胞数据之间的批次效应过程中: 在所述目标批次中进行预聚类,且将其他批次的数据划分到距离最近的所述目标批次 的细胞簇中,从而获得多个批次数据的细胞类型预标签。 7.根据权利要求6所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征 在于,进行所述预聚类后获得多个不同的所述细胞簇,再根据多个所述细胞簇中的样本均 值计算所述细胞簇的中心位置。 8.根据权利要求7所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征 在于,在处理其余批次的数据中,将每个批次的样本与所述目标批次的所述细胞簇中心的 距离进行单独计算,并将数据划分到距离最近的所述目标批次的所述细胞簇中。 2 CN116825186A权利要求书2/2页 9.根据权利要求6所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特
Ta的资源

2020110359336低致栓颅内血管编织支架及其处理方法

2020110303186一种钙钛矿量子点聚合物粒子的制备方法

2020110124078基于精准医疗的大数据分析系统及方法

2020109651910 应用近红外谷物分析仪建立油莎豆中粗脂肪含量的检测方法

2020109529321一种铝合金用无氟无氯环保粒状精炼剂及其制备和应用

2020108899336一种新能源商用车总装车间线路布局

2020108620703城市燃气管网多输差协同计算模型及应用方法

2020108207369一种微交联阳离子型聚丙烯酰胺絮凝剂及其制备方法与应用

2020108035131一种基于全站仪的激光雷达外部参数标定方法

2020107682859一种内燃机等离子节油器阴阳极的制备方法

13****40
实名认证
内容提供者


最近下载