CN2023107232615基于生成对抗网络的单细胞数据批次效应校正方法.pdf 立即下载
2024-08-17
约1.8万字
约19页
0
1.9MB
举报 版权申诉
预览加载中,请您耐心等待几秒...

CN2023107232615基于生成对抗网络的单细胞数据批次效应校正方法.pdf

CN2023107232615基于生成对抗网络的单细胞数据批次效应校正方法.pdf

预览

免费试读已结束,剩余 14 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN116825186A
(43)申请公布日2023.09.29
(21)申请号202310723261.5
(22)申请日2023.06.19
(71)申请人西北工业大学
地址710072陕西省西安市碑林区友谊西
路127号
(72)发明人彭佳杰杨光
(74)专利代理机构苏州隆恒知识产权代理事务
所(普通合伙)32366
专利代理师周子轶
(51)Int.Cl.
G16B20/00(2019.01)
G16B40/00(2019.01)




权利要求书2页说明书13页附图3页
(54)发明名称
基于生成对抗网络的单细胞数据批次效应
校正方法
(57)摘要
本申请实施例提供了一种基于生成对抗网
络的单细胞数据批次效应校正方法,包括:对单
细胞数据进行测序,从而得到高维单细胞基因表
达计数矩阵;对高维单细胞基因表达计数矩阵基
于识别模型根据变分推断的方式进行计算学习,
从而去近似估计后验分布,且利用随机生成的高
斯噪声和高维单细胞数据的分布均值和分布方
差近似估计潜在低维表示分布,从而获得近似的
低维表示向量;基于生成模型对所述低维表示向
量进行重构,从而获得单细胞重构原始数据;其
中,在生成模型重构所述低维表示向量时,对低
维表示向量加批次标签,用于去除批次效应。
CN116825186A
CN116825186A权利要求书1/2页

1.基于生成对抗网络的单细胞数据批次效应校正方法,其特征在于,所述方法包括:
对所述单细胞数据进行测序,从而得到高维单细胞基因表达计数矩阵;
对所述高维单细胞基因表达计数矩阵基于识别模型根据变分推断的方式进行计算学
习,从而去近似估计后验分布,且利用随机生成的高斯噪声和高维单细胞数据的分布均值
和分布方差近似估计潜在低维表示分布,从而获得近似的低维表示向量;
基于生成模型对所述低维表示向量进行重构,从而获得单细胞重构原始数据;
其中,在所述生成模型重构所述低维表示向量时,对所述低维表示向量加批次标签,用
于去除批次效应;
将生成对抗网络中生成器并入所述识别模型,从而生成新生成模型,利用所述新生成
模型对所述高维单细胞基因表达计数矩阵与所述单细胞重构原始数据进行判别得分,从而
提高所述生成模型重构数据的能力。
2.根据权利要求1所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征
在于,在对所述低维表示向量进行重构的过程中包括:
通过负二项分布拟合单细胞数据,且使用零膨胀模型拟合dropout事件,从而降低
dropout事件发生的概率,减小所述单细胞重构原始数据与所述单细胞数据之间的偏差。
3.根据权利要求2所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征
在于,基于零膨胀模型与负二项分布模型对所述单细胞数据进行拟合的过程中包括:
将负二项分布模型分为发生dropout事件和未发生dropout事件,再利用生成模型分别
拟合零膨胀、负二项分布模型的三个参数:dropout事件发生的概率、负二项分布的离散度
和表达均值。
4.根据权利要求1所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征
在于,所述生成对抗网络中的所述判别器进行判别的过程中包括:
所述生成对抗网络中的生成器根据所述判别器的评分更新网络参数,从而生成与真实
的所述单细胞数据相近的所述单细胞重构原始数据。
5.根据权利要求1所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征
在于,在获得近似的所述低维表示向量的过程中:
基于星型生成对抗网络,对多批次的所述单细胞数据选择一个目标批次,将其余批次
的所述单细胞数据统一通过生成器映射到所述目标批次所在的数据分布空间中,从而校正
不同批次的所述单细胞数据之间的批次效应。
6.根据权利要求5所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征
在于,在所述星型生成对抗网络校正不同批次的所述单细胞数据之间的批次效应过程中:
在所述目标批次中进行预聚类,且将其他批次的数据划分到距离最近的所述目标批次
的细胞簇中,从而获得多个批次数据的细胞类型预标签。
7.根据权利要求6所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征
在于,进行所述预聚类后获得多个不同的所述细胞簇,再根据多个所述细胞簇中的样本均
值计算所述细胞簇的中心位置。
8.根据权利要求7所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特征
在于,在处理其余批次的数据中,将每个批次的样本与所述目标批次的所述细胞簇中心的
距离进行单独计算,并将数据划分到距离最近的所述目标批次的所述细胞簇中。

2
CN116825186A权利要求书2/2页
9.根据权利要求6所述的基于生成对抗网络的单细胞数据批次效应校正方法,其特
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

CN2023107232615基于生成对抗网络的单细胞数据批次效应校正方法

文档大小:1.9MB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用