本申请涉及人工智能技术和计算结构生物学,尤其涉及一种阳性抗体筛选方法、装置、设备及存储介质。
背景技术:
1、随着大分子药物的不断发展,抗体药物的重要性随之提升,市场需求逐年扩容,相关的抗体筛选技术的发展也是日新月异,目前应用较普遍的有杂交瘤技术、抗体文库筛选技术、b细胞克隆技术等。
2、其中,杂交瘤技术通过将免疫动物的b淋巴细胞与骨髓瘤细胞融合,形成在体外长期存活并分泌免疫蛋白的杂交瘤细胞,并通过克隆化可利用杂交瘤细胞大量的生产单克隆抗体,解决了无法在体外筛选和生产抗体的难题,但需要对动物进行免疫,耗费大量的实验时间;抗体文库筛选技术中的噬菌体展示技术,通过将不同的外源dna序列插入噬菌体的外壳蛋白基因中,融合后通过子代噬菌体重新组装展现在其表面,形成噬菌体展示文库,再利用特定蛋白的培养板从文库中捕捉能特异性结合靶蛋白的噬菌体,将其洗脱下来干扰细胞宿主,孵育、扩增,进而富集能特异性结合靶蛋白的噬菌体,获得能识别靶分子的化合物。然而,噬菌体展示技术依赖于高质量和多样化的抗体库,才能分离出更具开发性的高亲和力抗体。
3、传统的抗体筛选方法主要依赖于实验室人工筛选,效率较低且成本高昂。而b细胞克隆技术,其依赖于流式细胞荧光分选技术(fluorescence activated cell sorting,facs)等相关生物技术的发展和成熟。流式细胞荧光分选技术使用激光和荧光染料来检测和测量细胞的特性,能够对抗原免疫的实验动物中获得的b细胞进行筛选,从而实现能够表达阳性抗体的b细胞的大规模筛选。然而facs筛选技术复杂度高,实现快速的细胞筛选依赖于极强的专业知识和经验,而且筛选得到的b细胞仍有相当一部分并不能表达阳性抗体,且结合能力参差不齐,需要进一步筛选时仍然依赖于实验室人工筛选。
4、因此,如何提高从抗原免疫后的b细胞中筛选能够表达阳性抗体的b细胞的筛选效率和准确性,是目前需要解决的问题。
技术实现思路
1、为解决或部分解决相关技术中存在的问题,本申请提供一种阳性抗体筛选方法、装置、设备及存储介质,能够实现阳性抗体的高效、高准确度筛选。
2、本申请第一方面提供一种阳性抗体筛选方法,包括:
3、获取待测免疫细胞的单细胞测序数据;
4、对所述待测免疫细胞的单细胞测序数据与预先构建的参考基因组数据进行数据比对处理,得到所述待测免疫细胞的测序数据比对信息;
5、根据所述测序数据比对信息,提取抗体序列及其对应的亲和力表达特征;
6、整合所述抗体序列与其对应的亲和力表达特征,并将整合后的待测抗体特征数据输入阳性抗体预测模型,由所述阳性抗体预测模型预测所述待测抗体序列与对应抗原结合的概率,得到阳性抗体筛选结果。
7、作为一个可选的实施方式,所述根据所述测序数据比对信息,提取抗体序列及其对应的亲和力表达特征,包括:
8、利用预先构建的语言模型计算所述测序数据比对信息中抗体序列对应的困惑度;
9、对所述测序数据比对信息中抗体序列进行聚类及进化树构建处理,提取所述抗体序列对应的克隆型和进化树特征信息。
10、作为一个可选的实施方式,所述对所述测序数据比对信息中抗体序列进行聚类及进化树构建处理,提取所述抗体序列对应的克隆型和进化树特征信息,包括:
11、分别对facs分选前后的测序数据比对信息中抗体序列进行聚类及进化树构建处理,提取所述抗体序列对应的克隆型和进化树特征信息。
12、作为一个可选的实施方式,所述分别对facs分选前后的测序数据比对信息中抗体序列进行聚类及进化树构建处理,提取所述抗体序列对应的克隆型和进化树特征信息,包括:
13、分别对facs分选前后的测序数据比对信息中抗体序列进行聚类及进化树构建处理,提取facs分选前后所述抗体序列对应的克隆型和进化树特征参数;
14、对facs分选前后所述抗体序列对应的克隆型和进化树特征参数进行特征比对,并将特征比对得到的差异信息以及所述抗体序列对应的克隆型和进化树特征参数作为所述抗体序列对应的克隆型和进化树特征信息。
15、作为一个可选的实施方式,所述根据所述测序数据比对信息,提取抗体序列及其对应的亲和力表达特征,还包括:
16、根据所述测序数据比对信息中基因表达数据得到多个细胞亚群,并基于所述细胞亚群建立各细胞的分化轨迹;
17、基于各所述细胞的分化轨迹提取预设亲和力关联基因的基因表达量,作为所述各细胞对应的基因表达特征信息。
18、作为一个可选的实施方式,所述预设亲和力关联基因包括与各所述细胞的细胞周期、增殖能力相关的基因。
19、作为一个可选的实施方式,所述阳性抗体预测模型,通过掩码机制对采集的抗体序列及其对应的亲和力表达特征样本集训练得到。
20、本申请第二方面提供一种阳性抗体筛选装置,包括:
21、获取模块,用于获取待测免疫细胞的单细胞测序数据;
22、预处理模块,用于对所述待测免疫细胞的单细胞测序数据与预先构建的参考基因组数据进行数据比对处理,得到所述待测免疫细胞的测序数据比对信息;
23、特征提取模块,用于根据所述测序数据比对信息,提取抗体序列及其对应的亲和力表达特征;
24、筛选模块,用于整合所述抗体序列与其对应的亲和力表达特征整合,并将整合后的待测抗体特征数据输入阳性抗体预测模型,由所述阳性抗体预测模型预测所述待测抗体序列与对应抗原结合的概率,得到阳性抗体筛选结果。
25、本申请第三方面提供一种电子设备,包括:
26、处理器;以及
27、存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
28、本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
29、本申请提供的技术方案可以包括以下有益效果:可以基于输入的待测抗体特征数据中抗体序列及其对应的亲和力表达特征信息,分析抗体性质与各个不同数据源特征信息之间的内在联系,从而得到高准确度的预测结果,提高阳性抗体筛选准确率和效率,降低实验成本。
30、进一步地,通过对不同模态的特征数据与抗体序列进行一一对应,从而根据这些不同模态、不同数据源的特征数据对抗体序列与特定抗原是否具有结合能力进行预测,提高抗体阳性预测的准确率;整合了facs处理得到的分选结果数据,能够作为辅助预测的特征之一,从而进一步提高抗体阳性预测准确率。
31、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
1.一种阳性抗体筛选方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述测序数据比对信息,提取抗体序列及其对应的亲和力表达特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述测序数据比对信息中抗体序列进行聚类及进化树构建处理,提取所述抗体序列对应的克隆型和进化树特征信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述分别对facs分选前后的测序数据比对信息中抗体序列进行聚类及进化树构建处理,提取所述抗体序列对应的克隆型和进化树特征信息,包括:
5.根据权利要求2所述的方法,其特征在于,所述根据所述测序数据比对信息,提取抗体序列及其对应的亲和力表达特征,还包括:
6.根据权利要求5所述的方法,其特征在于,所述预设亲和力关联基因包括与各所述细胞的细胞周期、增殖能力相关的基因。
7.根据权利要求1所述的方法,其特征在于,所述阳性抗体预测模型,通过掩码机制对采集的抗体序列及其对应的亲和力表达特征样本集训练得到。
8.一种阳性抗体筛选装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有可执行代码,其特征在于,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。