




如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
(19)国家知识产权局 (12)发明专利 (10)授权公告号CN113160886B (45)授权公告日2023.04.07 (21)申请号202110362899.1G06N3/0464(2023.01) (22)申请日2021.04.02G06N3/048(2023.01) G06F18/214(2023.01) (65)同一申请的已公布的文献号G06F18/23213(2023.01) 申请公布号CN113160886AG06F18/24(2023.01) (43)申请公布日2021.07.23(56)对比文件 (73)专利权人山东大学CN110957009A,2020.04.03 地址250101山东省济南市高新区舜华路CN111564183A,2020.08.21 1500号审查员白立鹏 (72)发明人吴昊周冰董记华 (74)专利代理机构济南圣达知识产权代理有限 公司37221 专利代理师李圣梅 (51)Int.Cl. G16B20/30(2019.01) G16B40/00(2019.01)权利要求书2页说明书6页附图3页 (54)发明名称 基于单细胞Hi-C数据的细胞类型预测系统 (57)摘要 本公开提出了基于单细胞Hi‑C数据的细胞 类型预测系统,包括:数据预处理模块,被配置 为:对于单细胞Hi‑C数据,将一条染色体按照预 先设置的分辨率分成若干个不重叠的bins,然 后对信息进行匹配,构成接触矩阵;神经网络模 块,被配置为:对数据预处理模块处理后的接触 矩阵进行处理,输出模型预测结果的四种细胞类 型。该预测模型能够应用于对未知类型的细胞测 序数据进行细胞类型预测。 CN113160886B CN113160886B权利要求书1/2页 1.基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,包括: 数据处理模块,被配置为:对于单细胞Hi‑C数据集,将细胞的每一条染色体按照预先设 置的分辨率分成若干个不重叠的bins片段,然后根据数据中的序列对信息进行匹配,从而 每一个细胞的每一条染色体构成一个接触矩阵; 神经网络模块,被配置为:对数据预处理模块处理后的接触矩阵输入至模型进行训练, 直至模型训练完成,用训练完的模型根据输入样本来输出预测结果的细胞类型; 所述神经网络模块,包括输入层、两个隐藏层和一个输出层; 其中输入层用于接受神经网络模型的输入即单细胞Hi‑C接触矩阵; 其中输出层产生神经网络模型的输出,该输出为大小是一行四列的向量,其中值最大 为第几列表示预测结果为第几类; 其中隐藏层被用于学习数据集的特征信息,通过训练和修改模型的参数来最终完成学 习任务; 所述神经网络模块中,ReLU激活函数用于隐藏层解决深度神经网络的非线性问题, Sigmoid激活函数用于输出模型预测结果的细胞类型。 2.如权利要求1所述的基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,所述数据 处理模块,还包括:将每一个染色体的Hi‑C接触矩阵整合成为单细胞Hi‑C矩阵,该矩阵的行 是细胞,列为表示一个细胞所有特征信息的接触信息。 3.如权利要求1所述的基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,单细胞 Hi‑C数据集中,根据细胞质量文件中的指标筛选符合一定条件的细胞,以确保单细胞Hi‑C 数据中的细胞均为有效且可用。 4.如权利要求1所述的基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,数据处理 模块针对单细胞Hi‑C数据处理时,包括: 首先,给定一条已知长度的染色体,按照预设的分辨率分成n段,每一段记做一个seg, 即每一个seg长度为r; 其次,根据相互作用对文件中每一个read对的信息,统计并构造每条染色体的接触矩 阵; 最后,由接触矩阵经过卷积平滑和重启随机游走处理产生矩阵Q。 5.如权利要求1所述的基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,构造每条 染色体的接触矩阵时,每一个read都有开始位和结束位,根据其开始位和结束位的平均值 确定对应的seg,统计每一对seg对应的read对的数量; 根据染色体中得到的seg之间相互作用程度,每一条染色体的Hi‑C数据构造接触矩阵, 其中矩阵元素表示染色体两个对应的seg之间支持相互作用的read对数量。 6.如权利要求1所述的基于单细胞Hi‑C数据的细胞类型预测系统,其特征是,所述数据 处理模块,还包括: 对每一条染色体的接触矩阵用一个卷积核遍历一遍,对于每一个矩阵元素用其周围元 素的平均值来表示以实现平滑操作; 其次使用随机游走方法结合全局信息和局部信息; 最后在保证特征信息不丢失的基础上,用PCA技术降低细胞样本的维度。 7.基于单细胞Hi‑C数据的细胞类型预测装置,基于服务器实现,其特征是,所述服务器 2 CN113160886B权利要求
Ta的资源

2020110359336低致栓颅内血管编织支架及其处理方法

2020110303186一种钙钛矿量子点聚合物粒子的制备方法

2020110124078基于精准医疗的大数据分析系统及方法

2020109651910 应用近红外谷物分析仪建立油莎豆中粗脂肪含量的检测方法

2020109529321一种铝合金用无氟无氯环保粒状精炼剂及其制备和应用

2020108899336一种新能源商用车总装车间线路布局

2020108620703城市燃气管网多输差协同计算模型及应用方法

2020108207369一种微交联阳离子型聚丙烯酰胺絮凝剂及其制备方法与应用

2020108035131一种基于全站仪的激光雷达外部参数标定方法

2020107682859一种内燃机等离子节油器阴阳极的制备方法

13****40
实名认证
内容提供者


最近下载