2021103628991基于单细胞Hi-C数据的细胞类型预测系统.pdf 立即下载
2024-08-17
约1万字
约12页
0
1.5MB
举报 版权申诉
预览加载中,请您耐心等待几秒...

2021103628991基于单细胞Hi-C数据的细胞类型预测系统.pdf

2021103628991基于单细胞Hi-C数据的细胞类型预测系统.pdf

预览

免费试读已结束,剩余 7 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN113160886B
(45)授权公告日2023.04.07
(21)申请号202110362899.1G06N3/0464(2023.01)
(22)申请日2021.04.02G06N3/048(2023.01)
G06F18/214(2023.01)
(65)同一申请的已公布的文献号G06F18/23213(2023.01)
申请公布号CN113160886AG06F18/24(2023.01)
(43)申请公布日2021.07.23(56)对比文件
(73)专利权人山东大学CN110957009A,2020.04.03
地址250101山东省济南市高新区舜华路CN111564183A,2020.08.21
1500号审查员白立鹏

(72)发明人吴昊周冰董记华
(74)专利代理机构济南圣达知识产权代理有限
公司37221
专利代理师李圣梅
(51)Int.Cl.
G16B20/30(2019.01)
G16B40/00(2019.01)权利要求书2页说明书6页附图3页
(54)发明名称
基于单细胞Hi-C数据的细胞类型预测系统
(57)摘要
本公开提出了基于单细胞Hi‑C数据的细胞
类型预测系统,包括:数据预处理模块,被配置
为:对于单细胞Hi‑C数据,将一条染色体按照预
先设置的分辨率分成若干个不重叠的bins,然
后对信息进行匹配,构成接触矩阵;神经网络模
块,被配置为:对数据预处理模块处理后的接触
矩阵进行处理,输出模型预测结果的四种细胞类
型。该预测模型能够应用于对未知类型的细胞测
序数据进行细胞类型预测。
CN113160886B
CN113160886B权利要求书1/2页

1.基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,包括:
数据处理模块,被配置为:对于单细胞Hi‑C数据集,将细胞的每一条染色体按照预先设
置的分辨率分成若干个不重叠的bins片段,然后根据数据中的序列对信息进行匹配,从而
每一个细胞的每一条染色体构成一个接触矩阵;
神经网络模块,被配置为:对数据预处理模块处理后的接触矩阵输入至模型进行训练,
直至模型训练完成,用训练完的模型根据输入样本来输出预测结果的细胞类型;
所述神经网络模块,包括输入层、两个隐藏层和一个输出层;
其中输入层用于接受神经网络模型的输入即单细胞Hi‑C接触矩阵;
其中输出层产生神经网络模型的输出,该输出为大小是一行四列的向量,其中值最大
为第几列表示预测结果为第几类;
其中隐藏层被用于学习数据集的特征信息,通过训练和修改模型的参数来最终完成学
习任务;
所述神经网络模块中,ReLU激活函数用于隐藏层解决深度神经网络的非线性问题,
Sigmoid激活函数用于输出模型预测结果的细胞类型。
2.如权利要求1所述的基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,所述数据
处理模块,还包括:将每一个染色体的Hi‑C接触矩阵整合成为单细胞Hi‑C矩阵,该矩阵的行
是细胞,列为表示一个细胞所有特征信息的接触信息。
3.如权利要求1所述的基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,单细胞
Hi‑C数据集中,根据细胞质量文件中的指标筛选符合一定条件的细胞,以确保单细胞Hi‑C
数据中的细胞均为有效且可用。
4.如权利要求1所述的基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,数据处理
模块针对单细胞Hi‑C数据处理时,包括:
首先,给定一条已知长度的染色体,按照预设的分辨率分成n段,每一段记做一个seg,
即每一个seg长度为r;
其次,根据相互作用对文件中每一个read对的信息,统计并构造每条染色体的接触矩
阵;
最后,由接触矩阵经过卷积平滑和重启随机游走处理产生矩阵Q。
5.如权利要求1所述的基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,构造每条
染色体的接触矩阵时,每一个read都有开始位和结束位,根据其开始位和结束位的平均值
确定对应的seg,统计每一对seg对应的read对的数量;
根据染色体中得到的seg之间相互作用程度,每一条染色体的Hi‑C数据构造接触矩阵,
其中矩阵元素表示染色体两个对应的seg之间支持相互作用的read对数量。
6.如权利要求1所述的基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,所述数据
处理模块,还包括:
对每一条染色体的接触矩阵用一个卷积核遍历一遍,对于每一个矩阵元素用其周围元
素的平均值来表示以实现平滑操作;
其次使用随机游走方法结合全局信息和局部信息;
最后在保证特征信息不丢失的基础上,用PCA技术降低细胞样本的维度。
7.基于单细胞Hi‑C数据的细胞类型预测装置,基于服务器实现,其特征是,所述服务器

2
CN113160886B权利要求
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

2021103628991基于单细胞Hi-C数据的细胞类型预测系统

文档大小:1.5MB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用