本发明大体上涉及用于预测参与与抗原识别分子相互作用的氨基酸位置的计算系统和方法,所述氨基酸位置在以与主要组织相容性复合体(mhc)分子的复合物(mhc-肽复合物)形式呈现的靶标肽内,以及涉及用于预测针对识别mhc-肽复合物中靶标肽的抗原识别分子的脱靶肽的计算系统和方法。
背景技术:
1、抗原识别分子,例如t细胞受体(tcr)和抗体,能够鉴别抗原,包括如本文定义的宿主的免疫系统识别的药剂。抗原识别分子可以通过与抗原呈递细胞表面上的以与主要组织相容性复合体(mhc)分子的复合物(mhc-肽复合物)形式呈现的抗原肽结合来帮助免疫系统中和抗原。
2、mhc-肽复合物呈现在抗原呈递细胞表面上,这是由于细胞过程的结果,其中抗原细胞中的mhc基因编码mhc分子;mhc分子随后与抗原肽结合,从而产生mhc-肽复合物;并且所得的mhc-肽复合物位于细胞表面上,使得肽的一部分呈现用于与抗原识别分子结合。每个肽由氨基酸的短链组成,并且mhc-肽复合物中肽的一些氨基酸与mhc分子结合,而其余氨基酸中的至少一些可呈现用于与抗原识别分子结合。
3、该细胞过程也在身体天然的细胞中进行。通常,抗原识别分子能够区分天然细胞上呈递的肽与抗原呈递细胞上呈递的肽,从而使正常细胞不会受到免疫系统的攻击。抗原识别分子能够与抗原呈递细胞表面的mhc-肽复合物的肽结合,以帮助免疫系统中和抗原。
4、目前正在进行研究,目的是通过上述机制工程化抗原识别分子以靶向原本不会被靶向的细胞。例如,癌细胞是免疫系统无法有效抑制的天然细胞,研究表明,可以工程化tcr、抗体和其他抗原识别分子,以靶向癌细胞上的癌症特异性mhc-肽复合物。虽然使用工程化抗原识别分子进行靶向治疗可能有效中和预期靶细胞,但如果工程化抗原识别分子除了攻击预期靶细胞外还攻击脱靶天然细胞,则治疗的副作用可能很严重。副作用通常在临床试验期间鉴定,这可能导致患者死亡、对患者产生其他不良影响以及在研发上浪费时间和资源。因此,本领域需要允许准确有效预测对感兴趣的靶标肽的脱靶的方法和系统,这有助于在靶标选择步骤评估与靶标肽相关的风险,并有助于筛选最特异性的抗原识别分子。
技术实现思路
1、一台或多台计算机的系统可以通过在系统上安装在操作中导致系统执行动作的软件、固件、硬件或它们的组合来配置为执行特定操作或动作。一个或多个计算机程序可以通过包括当由数据处理装置执行时导致装置执行动作的指令来配置为执行特定操作或动作。一个一般方面包括非瞬态计算机可读介质,其被配置为与计算设备的一个或多个处理器通信。非瞬态计算机可读介质包括执行以下步骤的指令,这些步骤可以以各种顺序和交错步骤执行:a)接收以mhc-靶标肽复合物形式呈现的靶标肽的计算表示作为输入;b)确定靶标肽与mhc-靶标肽复合物的mhc分子的结合亲和力;c)生成多个突变肽的序列,每个突变肽与靶标肽的各自氨基酸位置处的突变相关;d)确定多个突变肽中的每个突变肽与mhc分子的结合亲和力;e)至少部分地基于每个突变肽的结合亲和力与靶标肽的结合亲和力的比较,预测参与与识别所述mhc-靶标肽复合物的抗原识别分子的相互作用的氨基酸位置;以及f)提供可能参与与抗原识别分子的相互作用的氨基酸位置的指示作为输出。该方面的其他实施方案包括相应的计算机系统、装置和记录在一个或多个计算机存储设备上的计算机程序,其各自被配置为执行所述方法的操作。
2、实现方式可以包括以下特征中的一个或多个。非瞬态计算机可读介质可以包括指令,当由处理器执行时,所述指令使计算设备:当以下a)、b)或c)时,预测多个位置中的各个位置参与与识别mhc-靶标肽复合物的抗原识别分子的相互作用:a)如果靶标肽的百分位等级小于或等于0.5,则具有与各个位置相关的突变的突变肽的百分位等级小于1.0,b)如果靶标肽的百分位等级在0.5和2.0之间,则具有与各个位置相关的突变的突变肽的百分位等级小于2.0,或c)如果靶标肽的百分位等级大于或等于2.0,则具有与各个位置相关的突变的突变肽的百分位等级小于4.0,如由百分位等级值确定的。所述技术的实现方式可以包括硬件、方法或过程、或计算机可访问介质上的计算机软件。
3、一个一般方面包括非瞬态计算机可读介质,其被配置为与计算设备的一个或多个处理器通信。非瞬态计算机可读介质包括执行以下步骤的指令,这些步骤可以以各种顺序和交错步骤执行:a)接收以mhc-靶标肽复合物形式呈现的靶标肽的计算表示作为输入;b)预测靶标肽内可能参与与识别mhc-靶标肽复合物的抗原识别分子的相互作用的所有氨基酸位置;d)在预测或检测到的具有适当长度的肽的总池中生成肽的工作列表,使得工作列表中列出的肽各自包括至少两个氨基酸,所述氨基酸(i)位于与靶标肽内参与与抗原识别分子的相互作用的位置相对应的位置,和(ii)与靶标肽的相应氨基酸相同;e)确定工作列表中列出的每个肽与mhc-靶标肽复合物的mhc分子的结合亲和力;f)过滤工作列表以仅包括具有大于第一阈值的与mhc分子的计算结合亲和力的肽,从而生成脱靶肽的工作列表;以及g)提供脱靶肽的工作列表和/或工作列表中脱靶肽的数量作为输出。该方面的其他实施方案包括相应的计算机系统、装置和记录在一个或多个计算机存储设备上的计算机程序,其各自被配置为执行该方法的动作。
4、实现方式可以包括以下一个或多个特征。非瞬态计算机可读介质可以包括指令,当由处理器执行时,该指令使得计算设备:估计在基本的正常组织中表达的脱靶肽工作列表中的肽的数量;并且提供在基本的正常组织中表达的脱靶肽的数量作为输出。当由处理器执行时,该指令使得计算设备:针对肽工作列表中的每个肽,确定这样的肽是否在基本的正常组织中表达;并且过滤工作列表以仅包括在基本的正常组织中表达的肽。当由处理器执行时,该指令使得计算设备:生成潜在次级靶标肽的列表,该列表包括具有大于第一阈值的与mhc分子的计算结合亲和力并且在基本的正常组织中表达低的肽。当由处理器执行时,该指令使计算设备:计算肽工作列表中肽的相似度(dos)得分,所述dos得分至少部分基于与靶标肽相应位置上的氨基酸相同的氨基酸的数量,靶标肽的氨基酸参与与抗原识别分子的相互作用;并且过滤工作列表以仅包括dos得分大于第二阈值的肽。在计算dos得分时,仅考虑被鉴定为未与mhc分子结合的靶标肽的位置。当由处理器执行时,所述指令使计算设备:提供抗原识别分子的计算表示作为输入,所述抗原识别分子能够与mhc-靶标肽复合物结合;确定抗原识别分子与多个mhc肽复合物的结合亲和力,每个mhc肽复合物包括来自工作列表的各自可能脱靶标的肽和mhc分子;并过滤工作列表以仅包括包含抗原识别分子的结合基序的可能脱靶标的肽。当由处理器执行时,所述指令使计算设备:提供特定患者的基本的正常组织中的脱靶肽表达作为输入;并提供所述患者的脱靶效应的指示作为输出。所述技术的实现方式可以包括硬件、方法或过程、或计算机可访问介质上的计算机软件。
5、一个一般方面包括非瞬态计算机可读介质,其被配置为与计算设备的一个或多个处理器通信。非瞬态计算机可读介质包括执行以下步骤的指令,这些步骤可以按各种顺序和交错步骤执行:a)接收以与主要组织相容性复合体(mhc)分子的复合物(mhc-靶标肽复合物)形式呈现的靶标肽的计算表示作为输入;b)在预测或检测到的具有适当长度的肽的总池中鉴定包含至少两个氨基酸的相似肽,所述氨基酸(i)位于与靶标肽内参与与抗原识别分子的相互作用的位置相对应的位置,并且(ii)与靶标肽的相应氨基酸相同;c)确定每个鉴定的相似肽与mhc分子的结合亲和力;d)至少部分地基于鉴定具有比第一阈值更强的与mhc分子的计算结合亲和力的相似肽来鉴定脱靶肽;以及e)提供脱靶肽作为输出。
6、一个一般方面包括非瞬态计算机可读介质,其被配置为与计算设备的一个或多个处理器通信。非瞬态计算机可读介质包括执行以下步骤的指令,这些步骤可以以各种顺序和交错步骤执行:a)在疾病相关肽中选择预测与mhc分子结合的两个或更多个潜在靶标肽;b)估计与每个潜在靶标肽相关的脱靶肽的数量,以及c)至少部分地基于与每个潜在靶标肽相关的脱靶肽的数量对潜在靶标肽进行排序。该方面的其他实施方案包括相应的计算机系统、装置和记录在一个或多个计算机存储设备上的计算机程序,其各自被配置为执行方法的操作。
7、实现方式可以包括以下一个或多个特征。非瞬态计算机可读介质可以包括指令,当由处理器执行时,该指令使得计算设备:计算每个脱靶肽的dos得分,使得dos得分表示各自脱靶肽和靶标肽之间的相似性;并且至少部分地基于与每个潜在靶标肽相关的脱靶肽的dos得分对潜在靶标肽进行排序。当由处理器执行时,该指令使得计算设备:至少部分地基于脱靶肽中与靶标肽相应位置处的氨基酸相同的氨基酸的数量来计算dos得分,其中靶标肽的所述氨基酸参与与抗原识别分子的相互作用。在计算dos得分时,仅考虑被鉴定为不参与与mhc分子的相互作用的靶标肽的位置。当由处理器执行时,该指令使计算设备:至少部分地基于脱靶肽的dos得分计算每个潜在靶标肽的体内毒性概率。每个潜在靶标肽的体内毒性概率至少部分基于具有高于预定阈值的dos得分的高毒性脱靶肽的数量。至少部分地基于受疾病影响的组织和基本的正常组织中相应mrna或蛋白质的表达水平的比较来鉴定步骤(a)中的疾病相关肽。所述技术的实现方式可以包括硬件、方法或过程、或计算机可访问介质上的计算机软件。
8、一个一般方面包括非瞬态计算机可读介质,其包括在其上的数据库,所述数据库包括多个疾病相关肽序列,每个疾病相关肽序列与脱靶肽相关并根据与各自脱靶肽相关的体内毒性概率排序,每个脱靶肽具有与由各自疾病相关肽序列鉴定的肽大致相同的对主要组织相容性复合体(mhc)分子的结合亲和力。该方面的其他实施方案包括相应的计算机系统、装置和记录在一个或多个计算机存储设备上的计算机程序,其各自被配置为执行所述方法的操作。
9、一个一般方面包括非瞬态计算机可读介质,其包括在其上的数据库,所述数据库包括多个疾病相关肽序列;以及多个脱靶肽序列,每个脱靶肽序列与各自的疾病相关肽序列相关,其中由疾病相关肽序列鉴定的每个疾病相关肽对主要组织相容性复合体(mhc)分子具有结合亲和力,该结合亲和力大约等于由各自脱靶肽序列鉴定的脱靶肽对mhc分子的结合亲和力。该方面的其他实施方案包括相应的计算机系统、装置和记录在一个或多个计算机存储设备上的计算机程序,其各自被配置为执行方法的操作。
10、一个一般方面涉及一种用于预测以mhc-靶标肽复合物形式呈现的靶标肽内的氨基酸位置的方法,所述氨基酸位置参与与识别所述mhc-靶标肽复合物的抗原识别分子的相互作用,所述方法包括:a)确定靶标肽与mhc分子的结合亲和力;b)生成多个突变肽,每个突变肽与靶标肽的各自氨基酸位置处的突变相关;c)确定多个突变肽中的每个突变肽与mhc分子的结合亲和力;以及d)至少部分地基于每个突变肽的结合亲和力与靶标肽的结合亲和力的比较来预测参与与抗原识别分子的相互作用的氨基酸位置。
11、在某些实施方案中,使用基于计算机的模型来确定靶标肽与mhc分子的结合亲和力。
12、在某些实施方案中,通过实验测量来确定靶标肽与mhc分子的结合亲和力。
13、在某些实施方案中,使用半数最大抑制浓度(ic50)值或百分位等级值来确定靶标肽与mhc分子的结合亲和力。
14、在某些实施方案中,生成多个突变肽涉及将各自氨基酸突变为甘氨酸氨基酸。
15、在某些实施方案中,生成多个突变肽涉及将各自氨基酸突变为丙氨酸氨基酸。
16、在某些实施方案中,该方法还包括当具有与各个位置相关的突变的突变肽的结合亲和力大约等于靶标肽的结合亲和力时,预测多个位置中的各个位置参与与识别mhc-靶标肽复合物的抗原识别分子的相互作用。
17、在某些实施方案中,该方法还包括当以下a)、b)或c)时,预测多个位置中的各个位置参与与识别mhc-靶标肽复合物的抗原识别分子的相互作用:a)如果靶标肽的百分位等级小于或等于0.5,则具有与各个位置相关的突变的突变肽的百分位等级小于1.0,b)如果靶标肽的百分位等级在0.5和2.0之间,则具有与各个位置相关的突变的突变肽的百分位等级小于2.0,或c)如果靶标肽的百分位等级大于或等于2.0,则具有与各个位置相关的突变的突变肽的百分位等级小于4.0,如由百分位等级值确定的。
18、在某些实施方案中,该方法还包括当满足以下两个条件时,预测多个位置中的各个位置参与与识别mhc-靶标肽复合物的抗原识别分子的相互作用:(i)具有与各个位置相关的突变的突变肽的结合亲和力大约等于靶标肽的结合亲和力,并且(ii)靶标肽在各个位置处的氨基酸是非甘氨酸残基。
19、在某些实施方案中,该方法还包括基于mhc-靶标肽复合物的已知结构验证靶标肽内的多个位置中的各个位置不参与与mhc分子的相互作用。
20、一个一般方面涉及一种鉴定针对抗原识别分子的脱靶肽的方法,所述抗原识别分子识别以与主要组织相容性复合体(mhc)分子的复合物(mhc-靶标肽复合物)形式呈现的靶标肽,所述方法包括:a)预测靶标肽内可能参与与抗原识别分子的相互作用的所有氨基酸位置;b)在预测或检测到的具有适当长度的肽的总池中鉴定包含至少两个氨基酸的相似肽,所述氨基酸(i)位于与靶标肽内参与与抗原识别分子的相互作用的位置相对应的位置,并且(ii)与靶标肽的相应氨基酸相同;c)确定每个鉴定的相似肽与mhc分子的结合亲和力;以及d)至少部分地基于鉴定具有比第一阈值更强的与mhc分子的计算结合亲和力的相似肽来鉴定脱靶肽。
21、一个一般方面涉及一种用于估计抗原识别分子的脱靶肽的数量的方法,所述抗原识别分子识别以mhc-靶标肽复合物形式呈现的靶标肽,所述方法包括:a)预测靶标肽内可能参与与抗原识别分子的相互作用的所有氨基酸位置;b)在预测或检测到的具有适当长度的肽的总池中鉴定包含至少两个氨基酸的相似肽,所述氨基酸(i)位于与靶标肽内参与与抗原识别分子的相互作用的位置相对应的位置,并且(ii)与靶标肽的相应氨基酸相同;c)确定每个鉴定的相似肽与mhc分子的结合亲和力;以及d)至少部分地基于对具有比第一阈值更强的与mhc分子的计算结合亲和力的相似肽进行计数来估计脱靶肽的数量。
22、在某些实施方案中,步骤(b)包括在预测或检测到的具有适当长度的肽的总池中鉴定包含至少三个氨基酸的相似肽,所述氨基酸(i)位于与靶标肽内参与与抗原识别分子的相互作用的位置相对应的位置,并且(ii)与靶标肽的相应氨基酸相同。
23、在某些实施方案中,步骤(b)包括在预测或检测到的具有适当长度的肽的总池中鉴定包含至少四个氨基酸的相似肽,所述氨基酸(i)位于与靶标肽内参与与抗原识别分子的相互作用的位置相对应的位置,并且(ii)与靶标肽的相应氨基酸相同。
24、在某些实施方案中,步骤(b)包括在预测或检测到的具有适当长度的肽的总池中鉴定包含至少五个氨基酸的相似肽,所述氨基酸(i)位于与靶标肽内参与与抗原识别分子的相互作用的位置相对应的位置,并且(ii)与靶标肽的相应氨基酸相同。
25、在某些实施方案中,步骤(c)中的结合亲和力通过确定百分位等级值来确定,并且其中在步骤(d)中至少部分地基于对具有低于2.0的百分位等级值的相似肽进行计数来估计脱靶肽的数量。
26、在某些实施方案中,该方法还包括在脱靶肽中仅包括在基本的正常组织中表达的肽。
27、在某些实施方案中,该方法还包括针对每个鉴定的脱靶肽,确定这样的肽是否在基本的正常组织中表达。
28、在某些实施方案中,基于相应mrna或蛋白质表达的水平确定肽表达。
29、在某些实施方案中,基于质谱数据确定肽表达。
30、在某些实施方案中,该方法还包括在脱靶肽中仅包括具有比第一阈值更强的与mhc分子的计算结合亲和力并且在基本的正常组织中可检测到表达的相似肽。
31、在某些实施方案中,该方法还包括计算相似肽的相似度(dos)得分,所述dos得分至少部分基于与靶标肽相应位置处的氨基酸相同的各自相似肽的氨基酸数量,靶标肽的所述氨基酸参与与抗原识别分子的相互作用。
32、在某些实施方案中,在计算dos得分时仅考虑被鉴定为未与mhc分子结合的靶标肽的位置。
33、在某些实施方案中,该方法还包括在脱靶肽中仅包括具有大于第二阈值的dos得分的相似肽。
34、在某些实施方案中,使用上文公开的用于估计抗原识别分子的脱靶肽数量的方法进行步骤(a)中的预测靶标肽内参与与抗原识别分子的相互作用的氨基酸位置,所述抗原识别分子识别以mhc-靶标肽复合物形式呈现的靶标肽。
35、在某些实施方案中,步骤(b)中检测到的肽的总池基于质谱数据。
36、在某些实施方案中,mhc分子是i类mhc分子,并且步骤(b)中预测或检测到的肽的长度为8-12个氨基酸。
37、在某些实施方案中,mhc分子是i类mhc分子,并且靶标肽的长度为8-12个氨基酸。
38、在某些实施方案中,抗原识别分子是t细胞受体(tcr)、嵌合抗原受体(car)、抗体或其抗原结合片段。
39、一个一般方面涉及一种用于对潜在靶标肽进行排序以减轻脱靶毒性的方法,所述方法包括:a)在疾病相关肽中选择预测与mhc分子结合的两个或更多个潜在靶标肽;b)估计与每个潜在靶标肽相关的脱靶肽的数量;和c)至少部分地基于与每个潜在靶标肽相关的脱靶肽的数量对潜在靶标肽进行排序。
40、在某些实施方案中,使用本文所述方法估计步骤(b)中的脱靶肽的数量。
41、在某些实施方案中,该方法还包括对潜在靶标肽进行排序,使得具有较少相关脱靶肽的潜在靶标肽被选择用于进一步分析和/或用于生成和/或测试抗原识别分子。
42、在某些实施方案中,该方法还包括计算每个脱靶肽的相似度(dos)得分,使得dos得分表示各自脱靶肽和靶标肽之间的相似性;并且至少部分地基于与每个潜在靶标肽相关的脱靶肽的dos得分对潜在靶标肽进行排序。
43、在某些实施方案中,计算dos得分至少部分地基于脱靶肽中与靶标肽相应位置处的氨基酸相同的氨基酸的数量,靶标肽的所述氨基酸参与与抗原识别分子的相互作用。
44、在某些实施方案中,在计算dos得分时仅考虑被鉴定为不参与与mhc分子的相互作用的靶标肽的位置。
45、在某些实施方案中,该方法还包括至少部分基于脱靶肽的dos得分计算每个潜在靶标肽的体内毒性概率。
46、在某些实施方案中,每个潜在靶标肽的体内毒性概率至少部分基于具有高于预定阈值的dos得分的高毒性脱靶肽的数量。
47、在某些实施方案中,该方法还包括对靶标肽进行排序,使得具有较低毒性的潜在靶标肽被优先考虑。
48、在某些实施方案中,至少部分地基于受疾病影响的组织和基本的正常组织中相应mrna或蛋白质的表达水平的比较来鉴定步骤(a)中的疾病相关肽。
49、在某些实施方案中,该方法还包括在数据库中提供潜在靶标肽的排序。
50、在某些实施方案中,该方法还包括在数据库中提供与每个潜在靶标肽相关的脱靶肽的列表。
51、在另一个方面,本文提供了一种评估抗原识别分子的脱靶效应的体外方法,所述方法包括a)使抗原识别分子与以与主要组织相容性复合体(mhc)分子的复合物(mhc-靶标肽复合物)形式呈现的靶标肽接触;b)使抗原识别分子与与所述靶标肽相关的一个或多个脱靶肽接触,其中每个所述脱靶肽以与(a)中相同的mhc分子的复合物(mhc-脱靶肽复合物)形式呈现;和c)确定并比较抗原识别分子与mhc-靶标肽复合物和每个mhc-脱靶肽复合物的结合水平。
52、在另一个方面,本文提供了一种评估抗原识别分子的脱靶效应的体外方法,所述方法包括a)将抗原识别分子与一个或多个与抗原识别分子识别的靶标肽相关的脱靶肽接触,其中每个所述脱靶肽以与主要组织相容性复合体(mhc)分子的复合物(mhc-脱靶肽复合物)形式呈现;和b)确定抗原识别分子与每个mhc-脱靶肽复合物的结合水平。
53、在上述体外方法的一些实施方案中,该方法还可以包括如果抗原识别分子可检测地结合至少一个mhc-脱靶肽复合物,则确定抗原识别分子可能具有脱靶效应,其中所述脱靶肽在基本的正常组织中表达。
54、在另一个方面,本文提供了一种用于选择抗原识别分子的方法,所述方法包括:a)使多个抗原识别分子与以与主要组织相容性复合体(mhc)分子的复合物(mhc-靶标肽复合物)形式呈现的靶标肽接触;b)使相同的多个抗原识别分子与一个或多个与所述靶标肽相关的脱靶肽接触,其中每个所述脱靶肽以与(a)中相同的mhc分子的复合物(mhc-脱靶肽复合物)形式呈现;c)至少部分地基于每个抗原识别分子可检测地结合的mhc-脱靶肽复合物的数量来选择一个或多个抗原识别分子;以及d)任选地,使用一个或多个选定的抗原识别分子重复步骤(a)-(c)。
55、在一些实施方案中,一个或多个选定的抗原识别分子可检测地结合不超过五个(例如,不超过四个、不超过三个、不超过两个或不超过一个)mhc-脱靶肽复合物,其中脱靶肽在基本的正常组织中表达。
56、在一些实施方案中,一个或多个选定的抗原识别分子不可检测地结合任何mhc-脱靶肽复合物,其中脱靶肽在基本的正常组织中表达。
57、在一些实施方案中,多个抗原识别分子是在文库中。在一些实施方案中,文库是噬菌体展示文库或酵母文库。
58、在各种实施方案中,mhc-肽复合物固定在固体支持物上。在各种实施方案中,mhc-肽复合物存在于抗原呈递细胞上。
59、在各种实施方案中,结合水平通过检测与mhc-肽复合物结合的抗原识别分子的量来确定。
60、在各种实施方案中,该方法以高通量格式(例如,96孔板)进行。
61、在另一个方面,本文提供了一种针对特异性结合靶标肽的抗原识别分子富集样品的方法,所述方法包括a)在存在与所述靶标肽相关的一个或多个脱靶肽的情况下,使包含多个抗原识别分子的样品与靶标肽接触,其中所述靶标肽和所述一个或多个脱靶肽中的每一个以与主要组织相容性复合体(mhc)分子的复合物(mhc-靶标肽复合物或mhc-脱靶肽复合物)形式呈现;b)通过分离与mhc-靶标肽复合物结合的抗原识别分子来富集样品;以及c)任选地,使用富集的样品重复步骤(a)-(b)。
62、在上述方法的一些实施方案中,mhc-靶标肽复合物存在于抗原呈递细胞上,而mhc-脱靶肽复合物不存在于抗原呈递细胞上。在一些实施方案中,mhc-靶标肽复合物固定在固体支持物上,而mhc-脱靶肽复合物不固定在固体支持物上。在一些实施方案中,mhc-靶标肽复合物被标记,而mhc-脱靶肽复合物未被标记或与所述mhc-靶标肽复合物不同地标记。
63、在上述方法的各种实施方案中,使用本文所述的方法鉴定一个或多个脱靶肽。
64、在上述方法的各种实施方案中,抗原识别分子是t细胞受体(tcr)、嵌合抗原受体(car)、抗体或其抗原结合片段。在一些实施方案中,抗原识别分子存在于溶液中。在一些实施方案中,抗原识别分子存在于细胞上。
65、在另一方面,本文提供了一种包含使用本文所述方法鉴定的至少两个脱靶肽的文库。在一些实施方案中,本公开内容的文库包含一个或多个肽,所述肽各自选自seq id no:1-7、9和11-74的氨基酸序列,或其任何组合。在一些实施方案中,至少两个脱靶肽各自以与主要组织相容性复合体(mhc)分子的复合物形式呈现。
1.一种非瞬态计算机可读介质,其被配置为与计算设备的一个或多个处理器通信,所述非瞬态计算机可读介质包括其上的指令,当由处理器执行时,所述指令使计算设备:
2.权利要求1的非瞬态计算机可读介质,其中当由处理器执行时,所述指令使计算设备:
3.一种非瞬态计算机可读介质,其被配置为与计算设备的一个或多个处理器通信,所述非瞬态计算机可读介质包括其上的指令,当由处理器执行时,所述指令使计算设备:
4.权利要求3的非瞬态计算机可读介质,其中当由处理器执行时,所述指令使计算设备:
5.权利要求3的非瞬态计算机可读介质,其中当由处理器执行时,所述指令使计算设备:
6.权利要求5的非瞬态计算机可读介质,其中当由处理器执行时,所述指令使计算设备:
7.权利要求3-6中任一项的非瞬态计算机可读介质,其中当由处理器执行时,所述指令使计算设备:
8.权利要求7的非瞬态计算机可读介质,其中在计算dos得分时仅考虑被鉴定为未与mhc分子结合的靶标肽的位置。
9.权利要求3-8中任一项的非瞬态计算机可读介质,其中当由处理器执行时,所述指令使计算设备:
10.权利要求3-9中任一项的非瞬态计算机可读介质,其中当由处理器执行时,所述指令使计算设备:
11.一种非瞬态计算机可读介质,其被配置为与计算设备的一个或多个处理器通信,所述非瞬态计算机可读介质包括其上的指令,当由处理器执行时,所述指令使计算设备:
12.一种非瞬态计算机可读介质,其被配置为与计算设备的一个或多个处理器通信,所述非瞬态计算机可读介质包括其上的指令,当由处理器执行时,所述指令使计算设备:
13.权利要求12的非瞬态计算机可读介质,其中当由处理器执行时,所述指令使计算设备:
14.权利要求13的非瞬态计算机可读介质,其中当由处理器执行时,所述指令使计算设备:
15.权利要求13或14的非瞬态计算机可读介质,其中在计算dos得分时仅考虑被鉴定为不参与与mhc分子的相互作用的靶标肽的位置。
16.权利要求12-15中任一项的非瞬态计算机可读介质,其中当由处理器执行时,所述指令使计算设备:
17.权利要求16的非瞬态计算机可读介质,其中每个潜在靶标肽的体内毒性概率至少部分基于具有高于预定阈值的dos得分的高毒性脱靶肽的数量。
18.权利要求12-17中任一项的非瞬态计算机可读介质,其中至少部分地基于受疾病影响的组织和基本的正常组织中相应mrna或蛋白质的表达水平的比较来鉴定步骤(a)中的疾病相关肽。
19.一种非瞬态计算机可读介质,其包括在其上的数据库,所述数据库包括多个疾病相关肽序列,每个疾病相关肽序列与脱靶肽相关并根据与各自脱靶肽相关的体内毒性概率排序,每个脱靶肽具有与由各自疾病相关肽序列鉴定的肽大致相同的对主要组织相容性复合体(mhc)分子的结合亲和力。
20.一种非瞬态计算机可读介质,其包括在其上的数据库,所述数据库包括:
21.一种用于预测以与主要组织相容性复合体(mhc)分子的复合物(mhc-靶标肽复合物)形式呈现的靶标肽内的氨基酸位置的方法,所述氨基酸位置参与与识别所述mhc-靶标肽复合物的抗原识别分子的相互作用,所述方法包括:
22.权利要求21的方法,其中使用基于计算机的模型来确定靶标肽与mhc分子的结合亲和力。
23.权利要求21的方法,其中通过实验测量来确定靶标肽与mhc分子的结合亲和力。
24.权利要求21-23中任一项的方法,其中使用半数最大抑制浓度(ic50)值或百分位等级值来确定靶标肽与mhc分子的结合亲和力。
25.权利要求21-24中任一项的方法,其中生成多个突变肽包括将各自氨基酸突变为甘氨酸氨基酸。
26.权利要求21-24中任一项的方法,其中生成多个突变肽包括将各自氨基酸突变为丙氨酸氨基酸。
27.权利要求21-26中任一项的方法,还包括当具有与各个位置相关的突变的突变肽的结合亲和力大约等于靶标肽的结合亲和力时,预测多个位置中的各个位置参与与识别mhc-靶标肽复合物的抗原识别分子的相互作用。
28.权利要求27的方法,所述方法包括当以下a)、b)或c)时,预测多个位置中的各个位置参与与识别mhc-靶标肽复合物的抗原识别分子的相互作用:
29.权利要求21-28中任一项的方法,还包括当满足以下两个条件时,预测多个位置中的各个位置参与与识别mhc-靶标肽复合物的抗原识别分子的相互作用:
30.权利要求21-29中任一项的方法,还包括基于mhc-靶标肽复合物的已知结构验证靶标肽内的多个位置中的各个位置不参与与mhc分子的相互作用。
31.一种鉴定针对抗原识别分子的脱靶肽的方法,所述抗原识别分子识别以与主要组织相容性复合体(mhc)分子的复合物(mhc-靶标肽复合物)形式呈现的靶标肽,所述方法包括:
32.一种用于估计抗原识别分子的脱靶肽的数量的方法,所述抗原识别分子识别以与主要组织相容性复合体(mhc)分子的复合物(mhc-靶标肽复合物)形式呈现的靶标肽,所述方法包括:
33.权利要求31或32的方法,其中步骤(b)包括在预测或检测到的具有适当长度的肽的总池中鉴定包含至少三个氨基酸的相似肽,所述氨基酸(i)位于与靶标肽内参与与抗原识别分子的相互作用的位置相对应的位置,并且(ii)与靶标肽的相应氨基酸相同。
34.权利要求33的方法,其中步骤(b)包括在预测或检测到的具有适当长度的肽的总池中鉴定包含至少四个氨基酸的相似肽,所述氨基酸(i)位于与靶标肽内参与与抗原识别分子的相互作用的位置相对应的位置,并且(ii)与靶标肽的相应氨基酸相同。
35.权利要求34的方法,其中步骤(b)包括在预测或检测到的具有适当长度的肽的总池中鉴定包含至少五个氨基酸的相似肽,所述氨基酸(i)位于与靶标肽内参与与抗原识别分子的相互作用的位置相对应的位置,并且(ii)与靶标肽的相应氨基酸相同。
36.权利要求31-35中任一项的方法,其中步骤(c)中的结合亲和力通过确定百分位等级值来确定,并且其中在步骤(d)中至少部分地基于对具有低于2.0的百分位等级值的相似肽进行计数来估计脱靶肽的数量。
37.权利要求31-36中任一项的方法,所述方法包括在脱靶肽中仅包括在基本的正常组织中表达的肽。
38.权利要求31-36中任一项的方法,还包括针对每个鉴定的脱靶肽,确定这样的肽是否在基本的正常组织中表达。
39.权利要求37或权利要求38的方法,其中肽表达基于相应mrna或蛋白质表达的水平确定。
40.权利要求37或权利要求38的方法,其中肽表达基于质谱数据确定。
41.权利要求37-40中任一项的方法,还包括在脱靶肽中仅包括具有比第一阈值更强的与mhc分子的计算结合亲和力并且在基本的正常组织中可检测到表达的相似肽。
42.权利要求31-41中任一项的方法,还包括计算相似肽的相似度(dos)得分,所述dos得分至少部分基于与靶标肽相应位置处的氨基酸相同的各自相似肽的氨基酸数量,靶标肽的所述氨基酸参与与抗原识别分子的相互作用。
43.权利要求42的方法,其中在计算dos得分时仅考虑被鉴定为未与mhc分子结合的靶标肽的位置。
44.权利要求42或权利要求43的方法,还包括在脱靶肽中仅包括具有大于第二阈值的dos得分的相似肽。
45.权利要求31-44中任一项的方法,其中使用权利要求20-29中任一项的方法进行步骤(a)中的预测靶标肽内参与与抗原识别分子的相互作用的氨基酸位置。
46.权利要求31-45中任一项的方法,其中步骤(b)中检测到的肽的总池基于质谱数据。
47.权利要求31-46中任一项的方法,其中mhc分子是i类mhc分子,并且步骤(b)中预测或检测到的肽的长度为8-12个氨基酸。
48.权利要求21-47中任一项的方法,其中mhc分子是i类mhc分子,并且靶标肽的长度为8-12个氨基酸。
49.权利要求21-48中任一项的方法,其中抗原识别分子是t细胞受体(tcr)、嵌合抗原受体(car)、抗体或其抗原结合片段。
50.一种用于对潜在靶标肽进行排序以减轻脱靶毒性的方法,所述方法包括:
51.权利要求50的方法,其中使用权利要求31-48中任一项的方法估计步骤(b)中的脱靶肽的数量。
52.权利要求50或权利要求51的方法,其进一步包括对潜在靶标肽进行排序,使得具有较少相关脱靶肽的潜在靶标肽被选择用于进行进一步分析和/或用于生成和/或测试抗原识别分子。
53.权利要求50-52中任一项的方法,还包括:
54.权利要求53的方法,其中计算dos得分至少部分地基于脱靶肽中与靶标肽相应位置处的氨基酸相同的氨基酸的数量,靶标肽的所述氨基酸参与与抗原识别分子的相互作用。
55.权利要求53或权利要求54的方法,其中在计算dos得分时仅考虑被鉴定为不参与与mhc分子的相互作用的靶标肽的位置。
56.权利要求53-55中任一项的方法,还包括至少部分地基于脱靶肽的dos得分来计算每个潜在靶标肽的体内毒性概率。
57.权利要求56的方法,其中每个潜在靶标肽的体内毒性概率至少部分地基于具有高于预定阈值的dos得分的高毒性脱靶肽的数量。
58.权利要求56或权利要求57的方法,还包括对靶标肽进行排序,使得具有较低毒性的潜在靶标肽被优先考虑。
59.权利要求50-58中任一项的方法,其中至少部分地基于受疾病影响的组织和基本的正常组织中相应mrna或蛋白质的表达水平的比较来鉴定步骤(a)中的疾病相关肽。
60.权利要求50-59中任一项的方法,还包括在数据库中提供潜在靶标肽的排序。
61.权利要求50-60中任一项的方法,还包括在数据库中提供与每个潜在靶标肽相关的脱靶肽的列表。
62.一种评估抗原识别分子的脱靶效应的体外方法,所述方法包括:
63.一种评估抗原识别分子的脱靶效应的体外方法,所述方法包括:
64.权利要求62或63的方法,还包括如果抗原识别分子可检测地结合至少一个mhc-脱靶肽复合物,则确定抗原识别分子可能具有脱靶效应,其中所述脱靶肽在基本的正常组织中表达。
65.一种用于选择抗原识别分子的方法,所述方法包括:
66.权利要求65的方法,其中一个或多个选定的抗原识别分子可检测地结合不超过五个mhc-脱靶肽复合物,其中脱靶肽在基本的正常组织中表达。
67.权利要求66的方法,其中一个或多个选定的抗原识别分子不可检测地结合任何mhc-脱靶肽复合物,其中脱靶肽在基本的正常组织中表达。
68.权利要求65-67中任一项的方法,其中多个抗原识别分子是在文库中。
69.权利要求68的方法,其中文库是噬菌体展示文库或酵母文库。
70.权利要求65-69中任一项的方法,其中mhc-肽复合物固定在固体支持物上。
71.权利要求65-70中任一项的方法,其中mhc-肽复合物存在于抗原呈递细胞上。
72.权利要求62-64中任一项的方法,其中结合水平通过检测与mhc-肽复合物结合的抗原识别分子的量来确定。
73.权利要求65-72中任一项的方法,其中该方法以高通量格式进行。
74.权利要求73的方法,其中所述方法在96孔板中进行。
75.一种针对特异性结合靶标肽的抗原识别分子富集样品的方法,所述方法包括:
76.权利要求75的方法,其中所述mhc-靶标肽复合物存在于抗原呈递细胞上,并且所述mhc-脱靶肽复合物不存在于抗原呈递细胞上。
77.权利要求75的方法,其中所述mhc-靶标肽复合物固定在固体支持物上,并且所述mhc-脱靶肽复合物未固定在固体支持物上。
78.权利要求75的方法,其中所述mhc-靶标肽复合物被标记,并且所述mhc-脱靶肽复合物未被标记或与所述mhc-靶标肽复合物不同地标记。
79.权利要求75-79中任一项的方法,其中使用根据权利要求30和32-48中任一项所述的方法鉴定一个或多个脱靶肽。
80.权利要求75-79中任一项的方法,其中抗原识别分子是t细胞受体(tcr)、嵌合抗原受体(car)、抗体或其抗原结合片段。
81.权利要求75-80中任一项的方法,其中所述抗原识别分子存在于溶液中。
82.权利要求75-80中任一项的方法,其中所述抗原识别分子存在于细胞上。
83.一种包含至少两个使用权利要求31和33-49中任一项的方法鉴定的脱靶肽的文库。
84.权利要求83的文库,其包含一个或多个肽,所述肽各自选自seq id no:1-7、9和11-74的氨基酸序列,或其任何组合。
85.权利要求83或84的文库,其中至少两个脱靶肽各自以与主要组织相容性复合体(mhc)分子的复合物形式呈现。