雄激素受体复合物相关蛋白的制作方法

xiaoxiao2020-6-23 413

专利名称：雄激素受体复合物相关蛋白的制作方法
技术领域：
本发明一般地涉及生物技术领域，更具体地，本发明涉及雄激素受体复合物相关蛋白(androgen receptor complex associated protein；ARCAP)和其相对应的氨基酸与基因序列。
本发明的特色之一是可以转译合成ARCAP的基因(基因序列SEQ ID NO1和SEQ ID NO3)，包含基因的载体和具有该基因的培养细胞。在本发明的过程中，本基因的克隆是在严格条件下与具有SEQ ID NO1序列的单链探针杂交完成。
除此之外，本发明亦包括利用本发明的培养细胞来制备ARCAP，即是将此基因表达于培养细胞中，再将它们从培养的细胞中分离纯化而得此蛋白。
同时，本发明具有癌症诊断的特性，利用ARCAP基因或其相对应的转译蛋白质检测癌症细胞内不正常致病基因或蛋白的表达。
本发明亦具有筛检药物的特性，找寻某些特定化学药物，除了降低ARCAP在癌细胞中的活性外，亦可用于降低AR之调节基因的表达作用。
在本发明中，所提及之基因、蛋白、蛋白质类似物和抗体皆可被以下一种或多种方法所应用(a)筛检分析；(b)预测医学(例如诊断分析、预后分析监督临床试验、医药基因组学)；(c)治疗方法(治疗和预防)。
本发明的基因可被用来诊断肝癌，藉以评估ARCAP传递信使核糖核酸(mRNA)在组织或细胞内的表达与过度表达情形。此基因亦可被用作PCR反应的探针(probes)或引物(primers)，或制备成标记探针于核酸印迹分析之用(例如Northern印迹)。例如，本发明的ARCAP基因可以检测癌症细胞的基因表达，癌症细胞中的基因变异，或癌症细胞中的基因活性表达。除此之外，此基因可以被用来治疗因该蛋白表达不足或过多的不正常表达，或用以制备该蛋白的抑制药物。
同时，本发明的蛋白可以用来筛选生物细胞与其作用的其他蛋白质，筛检调节该蛋白作用的药物，以及未来基因治疗的标的(例如肝癌)。并且，该蛋白可用以制备特异性抗体(多克隆抗体或单克隆抗体)，其具有结合ARCAP的作用。这些抗体可用来检测ARCAP在组织和细胞的存在与分布。例如，这些抗体可以用来诊断肝癌细胞是否含有表达或过度表达的ARCAP。
除此之外，本发明的ARCAP可用做不正常和疾病分期的指标，疾病状态的先驱期和罹患预测的指标，药物活性的指标、或者个体药理基因学表象的指标。亦即本发明的ARCAP的表达、消失、和表达量的多寡，均可被检测得之，来表达个体内生化反应的状态。本发明的ARCAP可以作为一种或多种不正常或疾病、或疾病先驱期的代替指标。
具体实施例方式
定义在本发明中所用的名词＂实质纯化＂，是用于指定的蛋白，也就是该蛋白没有受其他生物性大分子的污染。就以纯度而言，实质纯化的蛋白至少具有75％(或者至少80，85，95，或99％)的纯度。可以利用任何合适的标准方法测量纯度，例如，层析法、电泳法或高效液相层析法等(HPLC)。
“保守氨基酸取代”，是指氨基酸序列中一个氨基酸可被其他具有相似化学侧链的氨基酸所取代。具有相似化学侧链的氨基酸已在本发明中被分类定义包括碱性侧链(例如赖氨酸，精氨酸，组氨酸)，酸性侧链(天冬氨酸，谷氨酸)，非带电的极性侧链(甘氨酸，天冬酰胺，谷氨酰胺，苏氨酸，酪氨酸，半胱氨酸)，无极性侧链(丙氨酸，缬氨酸，亮氨酸，异亮氨酸，脯氨酸，苯丙氨酸，甲硫氨酸，色氨酸)，β-分支侧链(苏氨酸，缬氨酸，异亮氨酸)和芳香族的侧链(酪氨酸，苯丙氨酸，色氨酸，组氨酸)。
杂交反应的＂严格条件＂，指杂交反应在65℃，0.5XSSC缓冲液中进行，接着在45℃，0.1XSSC缓冲液中清洗。
“基因克隆”，指一个核酸结构不同于自然出现的核酸，或不同于基因体内基因的片段。因此，这个名词涵盖者如(a)一个DNA含有自然发生基因体的基因分子序列，同时涵盖其起始及结束的序列，(b)一个核酸被嵌入一个载体或被嵌入原核或真核细胞的基因，所导致的分子不同于任何自然存在的载体或基因，(c)一个单独分子，如重组基因，一个基因体片段，或一个聚合酶链反应(PCR)生成的基因片段，或限制酶反应片段，(d)一个杂交反应的重组基因序列，如一个产生融合蛋白质的基因。
结果
<1>ARCAP的基因克隆ARCAP cDNA全长序列分析本发明以AR作成钓饵(bait)，去筛检肝脏酵母二次杂交文库(Yeasttwo Hybrid library)，得到片段DNA，由于DNA并非全长，因此，以此片段DNA作为探针筛检G2文库，得到较完整的DNA序列。再利用由自行建构的cDNA文库库和RACE(Rapid Amplification ofComplementary cDNA；RACE)方法监定出此特异基因的全长序列(SEQ ID NO1)，同时，也监定出及其相对应的蛋白序列，定名为ARCAP。
方法原理1.酵母二次杂交分析(Yeast two hybrid system)酵母二次杂交分析<Yeast two hybrid system>被用来判定是否ARCAP与AR作用。AR的全长cDNA序列被克隆近于GAL4DBD处，并用其作钓饵，利用杂交反应筛检已商品化的人类肝脏文库(Clontech)His3标记的克隆，可以分析确定细胞内特异ARCAP基因序列。
2.反转录作用(Reverse transcription)利用反转录作用将RNA合成重组DNA(cDNA)。利用硫氰酸胍和苯酚/氯仿制备纯化RNA，并用Douncer将DNA破坏。加入0.4mL的氯仿，用力震荡后，静至于冰中5分钟，藉离心(12,000g，4℃，15min)分开混合物质。将上层离心物含有RNA的液体加入等量的异丙醇使RNA沉淀。
反转录作用是将30μL的反应溶液，包含中RNA和1x的标准缓冲液(10 mM DTT，500μM dNTPs，50 ng/mL寡-dT，和100单位MMLV反转录酶)，在37℃下作用1小时。再于95℃作用5分钟以变性样品，利用RNA合成重组DNA(cDNA)。
3.RACE方法(由5′-RACE和3′-RACE克隆)RACE是一用以扩增cDNA模板的作用过程，此模板片段可以在其任一端带有已知的DNA序列而另一端则带有未知的DNA序列。本实验利用Clontech′s RACE试剂盒完成RACE基本作用过程已详载于发表的文献中(Fronhman et al.，1988，Proc.Natl.Acad.Sci.USA858998-9001)。
依据本发明的ARCAP序列，本实验设计两个探针GSP1和GSP2。人的肝肿瘤细胞株G 2的mRNA用作模板来合成第一链的cDNA。使用探针，3′-CDS(AAGCAGTGGTAACAACGCAGAGTACT30NN)进行3′RACE，或Smart-oligo(T25NN)和5′-CDS(AAGCAGTGGTAACAACGCAGAGTACGCGGG)进行5′RACE。
当第一链cDNA合成之后，利用Smart和GSP1探针进行聚合酶链反应完成5′RACE。利用3′CDS和GSP2探针进行聚合酶链反应完成3′RACE。聚合酶链反应所产生的DNA片段被嵌入pGEM-easy载体(Promega)。经过筛检，带有正确嵌入DNA片段的克隆被挑出，并将DNA纯化出来，因此而得到ARCAP cDNA全长序列。
选取正确的克隆基因，并使用Applied Biosystems 377型测序仪进行测序的工作。再以BLASTN程序分析克隆的序列(Zehetner et al.1994，Nature 367489-491)。
<2>正常人体组织和各种细胞株ARCAP mRNA的表达利用Northern印迹分析法，ARCAP mRNA表达于正常人体组织和各种细胞株<包括肝癌细胞株>已被评估。实验结果显示ARCAP仅少量表达于正常人体的心脏和骨骼肌，却高度表达于肝癌细胞株包括3B，22T，G2，和A2。
从40个患有肝癌的病人取得成对的肿瘤组织和相邻的正常组织。使用Northern印迹分析法，发现ARCAP mRNA高度表达于肿瘤部位，但却几乎不表达于相邻的正常组织。利用ARCAP特异抗体检测该蛋白，同样地确认该蛋白出现于肿瘤部位而非相邻的正常组织。
方法1.Northern印迹分析法利用Northern印迹分析法鉴定组织和细胞的ARCAP mRNA表达型式。从肝、胎儿脑部、和四种肝脏衍生的细胞(HepG2，HepG3，VGH/22T，VGH/59T)、血球细胞株(K562，U932，Ramos，Jurkat)、Hela细胞萃取全长的RNA(各20μg)，经由甲醛凝胶电泳分离，再转移到薄膜上，以ARCAP为探针进行杂交作用。作用反应在5x SSC，5xDenhardt′s，5mg/mL变性鲑精DNA，50％甲酰胺，and 0.1％SDS，42℃进行。接著在室温使用2x SSC/0.1％SDS进行第一次的30分钟清洗步骤，第二次清洗使用前述缓冲液于42℃进行，最后清洗步骤在55℃使用0.2xSSC/0.1％SDS缓冲液进行。含放射薄膜压片于X光片匣72小时，读取结果。
<3>人体肝肿瘤组织ARCAP mRNA的表达原位杂交反应分析结果显示，肝肿瘤组织切片含有大量的ARCAPmRNA的表达，正常组织几乎不表达。因此，有关于ARCAP mRNA和蛋白表达型式的数据指出ARCAP的表达可作为肝癌指标。
方法1.原位杂交反应从病人检体取得肝脏癌症组织切片进行原位杂交反应。利用ARCAP部分克隆和生物素标记产品(NEN)制备ARCAP riboprobe探针。杂交反应和清洗步骤均按照已建立的标准步骤进行。利用已叙述的GST-ARCAP融合蛋白质可以制备抗体检测ARCAP表达。未来这个抗体亦可被用作监定组织切片ARCAP的表达。
<4>ARCAP的细胞分布位置以为了解ARCAP的细胞分布位置，ARCAP的基因与表达绿色荧光蛋白(GFP，green fluorescence protein)的载体形成融合质粒，再转染至人类肝癌A2细胞。此一融合质粒所表达的绿色萤光，经萤光显微镜(Nikon)观察可表达于肝细胞的细胞核内，此结果显示ARCAP为一核蛋白(Fig 5)。
方法1.ARCAP/GFP融合蛋白质制备<ARCAP/GFP fusion proteinpreparation>
ARCAP与pEGFP-N1载体的EGFP(Clontech)蛋白完成融合作用。再将这个质粒转化E.coli(DH5)。利用微量质粒准备及限制酶分析鉴定克隆。被选出的克隆结构再以测序分析确认。当COS7和A2细胞培养至106细胞/100mm培养盘时，利用磷酸钙与Fugene 6试剂(Roche)的方法完成转染作用。30小时后，换入新鲜培养液内含DHT(10nM)。利用萤光显微镜(Nikon)观察细胞蛋白质表达的情形。
<5>ARCAP与AR的结合作用藉由免疫沉淀法和酵母二次杂交分析方法<Yeast two hybridsystem>来证明ARCAP与AR的结合作用。AR的全长基因被转殖入GAL4DBD载体，与ARCAP的GAL4BD载体转化入酵母菌，用其作钓饵，筛检已商品化的人类肝脏文库(Clontech)His3标记的克隆。利用酵母二次杂交分析确定细胞内ARCAP与AR的作用。
进一步的分析，将ARCAP与AR同时被表达于酵母菌，再藉免疫沉淀法，证明可经由AR分离ARCAP，或由ARCAP分离AR。所以，生理性的ARCAP与AR的相互作用因此被确认。
方法1.酵母二次杂交分析(Yeast two hybrid analysis)为了独立克隆ARCAP，AR被用作钓饵，从酵母二次杂交分析文库筛检配合物(Clontech)。简言之，全长AR基因被嵌入pS2-1载体(Clontech)，在利用该质粒筛检一个建立于pACT2的酵母二次杂交文库(Clontech)，并依产品手册指示使用酵母宿主细胞Y187。200,000转化的细胞放置于培养液不含色氨酸，亮氨酸，腺嘌呤但另加入1μM d二氢睾酮(DHT)。腺嘌呤(+)，LacZ(+)，和色氨酸(+)的克隆被分离出来，因而得到质粒DNA，再转化至E.coli。
利用PCR反应和特异于LEU基因的探针来鉴定嵌入pACT2质粒的cDNA。雄激素受体(AR)和PACT2质粒的cDNA相互作用的结果，可藉由比较GAL4DBDAR融合蛋白质或单独GAL4DBD存在情况下液态LacZ的活性而决定。经过测序和检查GenBank数据库(NIH，USA)之后，有一克隆表达ARCAP。
2.免疫沉淀法(Immunoprecipitation)AR的表达质粒，和ARCAP-HA/或ARCAP-Xpress融合蛋白质均由pCDNA III(Invitrogen)制备而来。当它们转化进入COS7细胞，利用体外偶联转录和翻译试剂盒(in vitro-coupled transcription andtranslation kit)，T7-TNT(Promega)，将35S-甲硫氨酸标记于蛋白上。于转化后48小时后，细胞培养中加入10nM DHT并将细胞溶解。溶解混合物与AR，HA，或Xpress抗体作用于冰上60分钟后，加入10μL蛋白A-sepharose珠(Pharmacia)。将反应于4℃连续混合作用16小时，利用离心(2000rpm，4℃，10min)收集免疫沉淀产物。清洗珠三次再与SDS样品缓冲液作用，用8％聚丙烯酰胺凝胶电泳(200v，45min)来解析免疫沉淀的蛋白质样品。
<6>ARCAP对AR生物性功能的影响为了解ARCAP与AR的相互作用是否具有实质生化意义，利用甲胎蛋白(AFP)基因调控区结合荧光素酶基因形成一表达基因。AFP基因被用作模型系统，研究细胞发生学控制基因的表达。AFP在胎儿肝脏中有高度的表达，但于出生后基因转录作用极剧下降，更不易发现于成人体内。然而，AFP基因经常于肝肿瘤或肝受损伤时被致活(Shulman et al.1995，Proc.Natl.Acad.Sci.USA 928288-8292)。AFP基因调控区内含有一雄激素反应部位(ARE)。另一含有变异ARE的荧光素酶对照表达基因也被应用在本研究，检测是否ARE参予ARCAP与AR的调节作用。
原始与对照组的AFP表达基因和(1)对照基因，(2)AR基因，(3)ARCAP基因，或(4)ARCAP与AR基因被转染至细胞。当转染对照基因以照荧光素酶基因时，荧光素酶活性没有改变，然而，使用荧光素酶基因和AR基因时，荧光素酶活性至少增加2倍；同时有ARCAP与AR基因存在细胞时，会导致3-4倍荧光素酶活性的相对增加。这个结果说显示ARCAP增加AR对AFP基因调控区的致活作用。
方法1.细胞转染作用分析<Transfection>
为了分析ARCAP和AR的作用关系，细胞被培养在DMEM培养液内含10％右旋糖涂覆的木炭处理的胎牛血清。利用Fugene 6(Roche)完成转化作用，8小时后，清洗细胞并加入含有胆固醇或对照物的培养液。48小时后收集细胞10小时后，利用合适的培养液清洗细胞两次，并培养在2mL含有胆固醇或对照物的培养液内。48小时后，取出细胞并依据使用手册说明分析荧光素酶活性(Promega)。
<7>激素对ARCAP与AR作用的影响利用AFP基因调控区的实验，检测激素睾酮对ARCAP与AR作用的影响，因此睾酮添加在肝癌A2细胞。为证明以上实验结果是可以影响AFP基因的表达，(1)对照基因，(2)AR基因，(3)ARCAP基因，或(4)ARCAP与AR基因在含有或不含睾酮的情况下转入A2细胞。结果显示，ARCAP增加AR的致活作用，在睾酮存在下，可增强AFP的表达，具有实质的必要性。
方法1.细胞转殖作用分析(Transfection)为了分析ARCAP和AR的作用关系，细胞被培养在DMEM培养液内含10％右旋糖涂覆的木炭处理的胎牛血清。利用Fugene 6(Roche)完成转化作用，8小时后，清洗细胞并加入含有胆固醇或对照物的培养液。48小时后收集细胞10小时后，利用合适的培养液清洗细胞两次，并培养在2 mL含有胆固醇或对照物的培养液内。48小时后，取出细胞并依据使用手册说明分析荧光素酶活性(Promega)。
2.Northern印迹分析法(Northern blotting)利用Northern印迹分析法监定组织和细胞的AFP mRNA表达型式。不同基因表达的肝细胞，萃取全长的RNA(20(g of each)，经由甲醛凝胶电泳分离，再转移到薄膜上，以AFP当探针进行杂交作用。作用反应在5x SSC，5x Denhardt′s，5mg/mL变性鲑精DNA，50％甲酰胺和0.1％SDS，42℃进行。接著在室温使用2x SSC/0.1％SDS进行第一次的30分钟清洗步骤，第二次清洗使用前述缓冲液于42℃进行，最后清洗步骤在55℃使用0.2 x SSC/0.1％SDS缓冲液进行。含放射薄膜压片于X光片匣72小时，读取结果。
本发明已在此被详细叙述，但前述仅是阐明并而非设限本发明，藉著下列附加请求范围以定义说明本发明。其他的方面、利益、修改都涵盖于本发明范围之内。
序列表<110>张泰阶<120>雄激素受体复合物相关蛋白<130>11709-003001<140>US 09/781,693<141>2001-02-12<150>US 60/262,312<151>2001-01-17<160>17<170>FastSEQ for Windows Version 4.0<210>1<211>2580<212>DNA<213>Homo sapiens<400>1atgtctcggg gtggctccta cccacacctg ttgtgggacg tgaggaaaag gtccctcggg 60ctggaggacc cgtcccggct gcggagtcgc tacctgggaa gaagagaatt tatccaaaga 120ttaaaacttg aagcaaccct taatgtgcat gatggttgtg ttaatacaat ctgttggaat 180gacactggag aatatatttt atctggctca gatgacacca aattagtaat tagtaatcct 240tacagcagaa aggttttgac aacaattcgt tcagggcacc gagcaaacat atttagtgca 300aagttcttac cttgtacaaa tgataaacag attgtatcct gctctggaga tggagtaata 360ttttatacca acgttgagca agatgcagaa accaacagac aatgccaatt tacgtgtcat 420tatggaacta cttatgagat tatgactgta cccaatgacc cttacacttt tctctcttgt 480ggtgaagatg gaactgttag gtggtttgat acacgcatca aaactagctg cacaaaagaa 540gattgtaaag atgatatttt aattaactgt cgacgtgctg ccacgtctgt tgctatttgc 600ccaccaatac catattacct tgctgttggt tgttctgaca gctcagtacg aatatatgat 660cggcgaatgc tgggcacaag agctacaggg aattatgcag gtcgagggac tactggaatg 720gttgcccgtt ttattccttc ccatcttaat aataagtcct gcagagtgac atctctgtgt 780tacagtgaag atggtcaaga gattctcgtt agttactctt cagattacat atatcttttt 840gacccgaaag atgatacagc acgagaactt aaaactcctt ctgcggaaga gagaagagaa 900gagttgcgac aaccaccagt taagcgtttg agacttcgtg gtgattggtc agatactgga 960cccagagcaa ggccggagag tgaacgagaa cgagatggag agcagagtcc caatgtgtca 1020ttgatgcaga gaatgtctga tatgttatca agatggtttg aagaagcaag tgaggttgca 1080caaagcaata gaggacgagg aagatctcga cccagaggtg gaacaagtca atcagatatt 1140tcaactcttc ctacggtccc atcaagtcct gatttggaag tgagtgaaac tgcaatggaa 1200gtagatactc cagctgaaca atttcttcag ccttctacat cctctacaat gtcagctcag 1260gctcattcga catcatctcc cacagaaagc cctcattcta ctcctttgct atcttctcca 1320gacagtgaac aaaggcagtc tgttgaggca tctggacacc acacacatca tcagtctgat 1380aacaataatg aaaagctgag ccccaaacca gggacaggtg aaccagtttt aagtttgcac 1440tacagcacag aaggaacaac tacaagcaca ataaaactga actttacaga tgaatggagc 1500agtatagcat caagttctag aggaattggg agccattgca aatctgaggg tcaggaggaa 1560tctttcgtcc cacagagctc agtgcaacca ccagaaggag acagtgaaac aaaagctcct 1620gaagaatcat cagaggatgt gacaaaatat caggaaggag tatctgcaga aaacccagtt 1680gagaaccata tcaatataac acaatcagat aagttcacag ccaagccatt ggattccaac 1740tcaggagaaa gaaatgacct caatcttgat cgctcttgtg gggttccaga agaatctgct 1800tcatctgaaa aagccaagga accagaaact tcagatcaga ctagcactga gagtgctacc 1860aatgaaaata acaccaatcc tgagcctcag ttccaaacag aagccactgg gccttcagct 1920catgaagaaa catccaccag ggactctgct cttcaggaca cagatgacag tgatgatgac 1980ccagtcctga tcccaggtgc aaggtatcga gcaggacctg gtgatagacg ctctgctgtt 2040gcccgtattc aggagttctt cagacggaga aaagaaagga aagaaatgga agaattggat 2100actttgaaca ttagaaggcc gctagtaaaa atggtttata aaggccatcg caactccagg 2160acaatgataa aagaagccaa tttctggggt gctaactttg taatgagtgg ttctgactgt 2220ggccacattt tcatctggga tcggcacact gctgagcatt tgatgcttct ggaagctgat 2280aatcatgtgg taaactgcct gcagccacat ccgtttgacc caattttagc ctcatctggc 2340atagattatg acataaagat ctggtcacca ttagaagagt caaggatttt taaccgaaaa 2400cttgctgatg aagttataac tcgaaacgaa ctcatgctgg aagaaactag aaacaccatt 2460acagttccag cctctttcat gttgaggatg ttggcttcac ttaatcatat ccgagctgac 2520cggttggagg gtgacagatc agaaggctct ggtcaagaga atgaaaatga ggatgaggaa 2580<210>2<211>860<212>PRT<213>Homo sapiens<400>2Met Ser Arg Gly Gly Ser Tyr Pro His Leu Leu Trp Asp Val Arg Lys1 5 10 15Arg Ser Leu Gly Leu Glu Asp Pro Ser Arg Leu Arg Ser Arg Tyr Leu20 25 30Gly Arg Arg Glu Phe Ile Gln Arg Leu Lys Leu Glu Ala Thr Leu Asn35 40 45Val His Asp Gly Cys Val Asn Thr Ile Cys Trp Asn Asp Thr Gly Glu50 55 60Tyr Ile Leu Ser Gly Ser Asp Asp Thr Lys Leu Val Ile Ser Asn Pro65 70 75 80Tyr Ser Arg Lys Val Leu Thr Thr Ile Arg Ser Gly His Arg Ala Asn85 90 95Ile Phe Ser Ala Lys Phe Leu Pro Cys Thr Asn Asp Lys Gln Ile Val100 105 110Ser Cys Ser Gly Asp Gly Val Ile Phe Tyr Thr Asn Val Glu Gln Asp115 120 125Ala Glu Thr Asn Arg Gln Cys Gln Phe Thr Cys His Tyr Gly Thr Thr130 135 140Tyr Glu Ile Met Thr Val Pro Asn Asp Pro Tyr Thr Phe Leu Ser Cys145 150 155 160Gly Glu Asp Gly Thr Val Arg Trp Phe Asp Thr Arg Ile Lys Thr Ser165 170 175Cys Thr Lys Glu Asp Cys Lys Asp Asp Ile Leu Ile Asn Cys Arg Arg180 185 190Ala Ala Thr Ser Val Ala Ile Cys Pro Pro Ile Pro Tyr Tyr Leu Ala195 200 205Val Gly Cys Ser Asp Ser Ser Val Arg Ile Tyr Asp Arg Arg Met Leu210 215 220Gly Thr Arg Ala Thr Gly Asn Tyr Ala Gly Arg Gly Thr Thr Gly Met225 230 235 240Val Ala Arg Phe Ile Pro Ser His Leu Asn Asn Lys Ser Cys Arg Val245 250 255Thr Ser Leu Cys Tyr Ser Glu Asp Gly Gln Glu Ile Leu Val Ser Tyr260 265 270Ser Ser Asp Tyr Ile Tyr Leu Phe Asp Pro Lys Asp Asp Thr Ala Arg275 280 285Glu Leu Lys Thr Pro Ser Ala Glu Glu Arg Arg Glu Glu Leu Arg Gln290 295 300Pro Pro Val Lys Arg Leu Arg Leu Arg Gly Asp Trp Ser Asp Thr Gly305 310 315 320Pro Arg Ala Arg Pro Glu Ser Glu Arg Glu Arg Asp Gly Glu Gln Ser325 330 335Pro Asn Val Ser Leu Met Gln Arg Met Ser Asp Met Leu Ser Arg Trp340 345 350Phe Glu Glu Ala Ser Glu Val Ala Gln Ser Asn Arg Gly Arg Gly Arg355 360 365Ser Arg Pro Arg Gly Gly Thr Ser Gln Ser Asp Ile Ser Thr Leu Pro370 375 380Thr Val Pro Ser Ser Pro Asp Leu Glu Val Ser Glu Thr Ala Met Glu385 390 395 400Val Asp Thr Pro Ala Glu Gln Phe Leu Gln Pro Ser Thr Ser Ser Thr405 410 415Met Ser Ala Gln Ala His Ser Thr Ser Ser Pro Thr Glu Ser Pro His420 425 430Ser Thr Pro Leu Leu Ser Ser Pro Asp Ser Glu Gln Arg Gln Ser Val435 440 445Glu Ala Ser Gly His His Thr His His Gln Ser Asp Asn Asn Asn Glu450 455 460Lys Leu Ser Pro Lys Pro Gly Thr Gly Glu Pro Val Leu Ser Leu His465 470 475 480Tyr Ser Thr Glu Gly Thr Thr Thr Ser Thr Ile Lys Leu Asn Phe Thr485 490 495Asp Glu Trp Ser Ser Ile Ala Ser Ser Ser Arg Gly Ile Gly Ser His500 505 510Cys Lys Ser Glu Gly Gln Glu Glu Ser Phe Val Pro Gln Ser Ser Val515 520 525Gln Pro Pro Glu Gly Asp Ser Glu Thr Lys Ala Pro Glu Glu Ser Ser530 535 540Glu Asp Val Thr Lys Tyr Gln Glu Gly Val Ser Ala Glu Asn Pro Val545 550 555 560Glu Asn His Ile Asn Ile Thr Gln Ser Asp Lys Phe Thr Ala Lys Pro565 570 575Leu Asp Ser Asn Ser Gly Glu Arg Asn Asp Leu Asn Leu Asp Arg Ser580 585 590Cys Gly Val Pro Glu Glu Ser Ala Ser Ser Glu Lys Ala Lys Glu Pro595 600 605Glu Thr Ser Asp Gln Thr Ser Thr Glu Ser Ala Thr Asn Glu Asn Asn610 615 620Thr Asn Pro Glu Pro Gln Phe Gln Thr Glu Ala Thr Gly Pro Ser Ala625 630 635 640His Glu Glu Thr Ser Thr Arg Asp Ser Ala Leu Gln Asp Thr Asp Asp645 650 655Ser Asp Asp Asp Pro Val Leu Ile Pro Gly Ala Arg Tyr Arg Ala Gly660 665 670Pro Gly Asp Arg Arg Ser Ala Val Ala Arg Ile Gln Glu Phe Phe Arg675 680 685Arg Arg Lys Glu Arg Lys Glu Met Glu Glu Leu Asp Thr Leu Asn Ile690 695 700Arg Arg Pro Leu Val Lys Met Val Tyr Lys Gly His Arg Asn Ser Arg705 710 715 720Thr Met Ile Lys Glu Ala Asn Phe Trp Gly Ala Asn Phe Val Met Ser725 730 735Gly Ser Asp Cys Gly His Ile Phe Ile Trp Asp Arg His Thr Ala Glu740 745 750His Leu Met Leu Leu Glu Ala Asp Asn His Val Val Asn Cys Leu Gln755 760 765Pro His Pro Phe Asp Pro Ile Leu Ala Ser Ser Gly Ile Asp Tyr Asp770 775 780Ile Lys Ile Trp Ser Pro Leu Glu Glu Ser Arg Ile Phe Asn Arg Lys785 790 795 800Leu Ala Asp Glu Val Ile Thr Arg Asn Glu Leu Met Leu Glu Glu Thr805 810 815Arg Asn Thr Ile Thr Val Pro Ala Ser Phe Met Leu Arg Met Leu Ala820 825 830Ser Leu Asn His Ile Arg Ala Asp Arg Leu Glu Gly Asp Arg Ser Glu835 840 845Gly Ser Gly Gln Glu Asn Glu Asn Glu Asp Glu Glu
850 855860<210>3<21l>3016<212>DNA<213>Homo sapiens<220><221>CDS<222>(18)...(2597)<400>3ccggctcagg cagagcc atg tct cgg ggt ggc tcc tac cca cac ctg ttg 50Met Ser Arg Gly Gly Ser Tyr Pro His Leu Leu1 5 10tgg gac gtg agg aaa agg tcc ctc ggg ctg gag gac ccg tcc cgg ctg 98Trp Asp Val Arg Lys Arg Ser Leu Gly Leu Glu Asp Pro Ser Arg Leu15 20 25cgg agt cgc tac ctg gga aga aga gaa ttt atc caa aga tta aaa ctt146Arg Ser Arg Tyr Leu Gly Arg Arg Glu Phe Ile Gln Arg Leu Lys Leu30 35 40gaa gca acc ctt aat gtg cat gat ggt tgt gtt aat aca atc tgt tgg194Glu Ala Thr Leu Asn Val His Asp Gly Cys Val Asn Thr Ile Cys Trp45 50 55aat gac act gga gaa tat att tta tct ggc tca gat gac acc aaa tta242Asn Asp Thr Gly Glu Tyr Ile Leu Ser Gly Ser Asp Asp Thr Lys Leu60 65 70 75gta att agt aat cct tac agc aga aag gtt ttg aca aca att cgt tca290Val Ile Ser Asn Pro Tyr Ser Arg Lys Val Leu Thr Thr Ile Arg Ser80 85 90ggg cac cga gca aac ata ttt agt gca aag ttc tta cct tgt aca aat338Gly His Arg Ala Asn Ile Phe Ser Ala Lys Phe Leu Pro Cys Thr Asn95 100 105gat aaa cag att gta tcc tgc tct gga gat gga gta ata ttt tat acc386Asp Lys Gln Ile Val Ser Cys Ser Gly Asp Gly Val Ile Phe Tyr Thr110 115 120aac gtt gag caa gat gca gaa acc aac aga caa tgc caa ttt acg tgt434Asn Val Glu Gln Asp Ala Glu Thr Asn Arg Gln Cys Gln Phe Thr Cys125 130 135cat tat gga act act tat gag att atg act gta ccc aat gac cct tac482His Tyr Gly Thr Thr Tyr Glu Ile Met Thr Val Pro Asn Asp Pro Tyr140 145 150 155act ttt ctc tct tgt ggt gaa gat gga act gtt agg tgg ttt gat aca530Thr Phe Leu Ser Cys Gly Glu Asp Gly Thr Val Arg Trp Phe Asp Thr160 165 170cgc atc aaa act agc tgc aca aaa gaa gat tgt aaa gat gat att tta578Arg Ile Lys Thr Ser Cys Thr Lys Glu Asp Cys Lys Asp Asp Ile Leu175 180 185att aac tgt cga cgt gct gcc acg tct gtt gct att tgc cca cca ata626Ile Asn Cys Arg Arg Ala Ala Thr Ser Val Ala Ile Cys Pro Pro Ile190 195 200cca tat tac ctt gct gtt ggt tgt tct gac agc tca gta cga ata tat 674Pro Tyr Tyr Leu Ala Val Gly Cys Ser Asp Ser Ser Val Arg Ile Tyr205 210 215gat cgg cga atg ctg ggc aca aga gct aca ggg aat tat gca ggt cga 722Asp Arg Arg Met Leu Gly Thr Arg Ala Thr Gly Asn Tyr Ala Gly Arg220 225 230 235ggg act act gga atg gtt gcc cgt ttt att cct tcc cat ctt aat aat 770Gly Thr Thr Gly Met Val Ala Arg Phe Ile Pro Ser His Leu Asn Asn240 245 250aag tcc tgc aga gtg aca tct ctg tgt tac agt gaa gat ggt caa gag 818Lys Ser Cys Arg Val Thr Ser Leu Cys Tyr Ser Glu Asp Gly Gln Glu255 260 265att ctc gtt agt tac tct tca gat tac ata tat ctt ttt gac ccg aaa 866Ile Leu Val Ser Tyr Ser Ser Asp Tyr Ile Tyr Leu Phe Asp Pro Lys270 275 280gat gat aca gca cga gaa ctt aaa act cct tct gcg gaa gag aga aga 914Asp Asp Thr Ala Arg Glu Leu Lys Thr Pro Ser Ala Glu Glu Arg Arg285 290 295gaa gag ttg cga caa cca cca gtt aag cgt ttg aga ctt cgt ggt gat 962Glu Glu Leu Arg Gln Pro Pro Val Lys Arg Leu Arg Leu Arg Gly Asp300 305 310 315tgg tca gat act gga ccc aga gca agg ccg gag agt gaa cga gaa cga 1010Trp Ser Asp Thr Gly Pro Arg Ala Arg Pro Glu Ser Glu Arg Glu Arg320 325 330gat gga gag cag agt ccc aat gtg tca ttg atg cag aga atg tct gat 1058Asp Gly Glu Gln Ser Pro Asn Val Set Leu Met Gln Arg Met Ser Asp335 340 345atg tta tca aga tgg ttt gaa gaa gca agt gag gtt gca caa agc aat 1106Met Leu Ser Arg Trp Phe Glu Glu Ala Ser Glu Val Ala Gln Ser Asn350 355 360aga gga cga gga aga tct cga ccc aga ggt gga aca agt caa tca gat 1154Arg Gly Arg Gly Arg Ser Arg Pro Arg Gly Gly Thr Ser Gln Ser Asp365 370 375att tca act ctt cct acg gtc cca tca agt cct gat ttg gaa gtg agt 1202Ile Ser Thr Leu Pro Thr Val Pro Ser Ser Pro Asp Leu Glu Val Ser380 385 390 395gaa act gca atg gaa gta gat act cca gct gaa caa ttt ctt cag cct 1250Glu Thr Ala Met Glu Val Asp Thr Pro Ala Glu Gln Phe Leu Gln Pro400 405 410tct aca tcc tct aca atg tca gct cag gct cat tcg aca tca tct ccc 1298Ser Thr Ser Ser Thr Met Ser Ala Gln Ala His Ser Thr Ser Ser Pro415 420 425aca gaa agc cct cat tct act cct ttg cta tct tct cca gac agt gaa 1346Thr Glu Ser Pro His Ser Thr Pro Leu Leu Ser Ser Pro Asp Ser Glu
430 435 440caa agg cag tct gtt gag gca tct gga cac cac aca cat cat cag tct 1394Gln Arg Gln Ser Val Glu Ala Ser Gly His His Thr His His Gln Ser445 450 455gat aac aat aat gaa aag ctg agc ccc aaa cca ggg aca ggt gaa cca 1442Asp Asn Asn Asn Glu Lys Leu Ser Pro Lys Pro Gly Thr Gly Glu Pro460 465 470 475gtt tta agt ttg cac tac agc aca gaa gga aca act aca agc aca ata 1490Val Leu Ser Leu His Tyr Ser Thr Glu Gly Thr Thr Thr Ser Thr Ile480 485 490aaa ctg aac ttt aca gat gaa tgg agc agt ata gca tca agt tct aga 1538Lys Leu Asn Phe Thr Asp Glu Trp Ser Ser Ile Ala Ser Ser Ser Arg495 500 505gga att ggg agc cat tgc aaa tct gag ggt cag gag gaa tct ttc gtc 1586Gly Ile Gly Ser His Cys Lys Ser Glu Gly Gln Glu Glu Ser Phe Val510 515 520cca cag agc tca gtg caa cca cca gaa gga gac agt gaa aca aaa gct 1634Pro Gln Ser Ser Val Gln Pro Pro Glu Gly Asp Ser Glu Thr Lys Ala525 530 535cct gaa gaa tca tca gag gat gtg aca aaa tat cag gaa gga gta tct 1682Pro Glu Glu Ser Ser Glu Asp Val Thr Lys Tyr Gln Glu Gly Val Ser540 545 550 555gca gaa aac cca gtt gag aac cat atc aat ata aca caa tca gat aag 1730Ala Glu Asn Pro Val Glu Asn His Ile Asn Ile Thr Gln Ser Asp Lys560 565 570ttc aca gcc aag cca ttg gat tcc aac tca gga gaa aga aat gac ctc 1778Phe Thr Ala Lys Pro Leu Asp Ser Asn Ser Gly Glu Arg Asn Asp Leu575 580 585aat ctt gat cgc tct tgt ggg gtt cca gaa gaa tct gct tca tct gaa 1826Asn Leu Asp Arg Ser Cys Gly Val Pro Glu Glu Ser Ala Ser Ser Glu590 595 600aaa gcc aag gaa cca gaa act tca gat cag act agc act gag agt gct 1874Lys Ala Lys Glu Pro Glu Thr Ser Asp Gln Thr Ser Thr Glu Ser Ala605 610 615acc aat gaa aat aac acc aat cct gag cct cag ttc caa aca gaa gcc 1922Thr Asn Glu Asn Asn Thr Asn Pro Glu Pro Gln Phe Gln Thr Glu Ala620 625 630 635act ggg cct tca gct cat gaa gaa aca tcc acc agg gac tct gct ctt 1970Thr Gly Pro Ser Ala His Glu Glu Thr Ser Thr Arg Asp Ser Ala Leu640 645 650cag gac aca gat gac agt gat gat gac cca gtc ctg atc cca ggt gca 2018Gln Asp Thr Asp Asp Ser Asp Asp Asp Pro Val Leu Ile Pro Gly Ala655 660 665agg tat cga gca gga cct ggt gat aga cgc tct gct gtt gcc cgt att 2066Arg Tyr Arg Ala Gly Pro Gly Asp Arg Arg Ser Ala Val Ala Arg Ile670 675 680cag gag ttc ttc aga cgg aga aaa gaa agg aaa gaa atg gaa gaa ttg 2114Gln Glu Phe Phe Arg Arg Arg Lys Glu Arg Lys Glu Met Glu Glu Leu685 690 695gat act ttg aac att aga agg ccg cta gta aaa atg gtt tat aaa ggc 2162Asp Thr Leu Asn Ile Arg Arg Pro Leu Val Lys Met Val Tyr Lys Gly700 705 710 715cat cgc aac tcc agg aca atg ata aaa gaa gcc aat ttc tgg ggt gct 2210His Arg Asn Ser Arg Thr Met Ile Lys Glu Ala Asn Phe Trp Gly Ala720 725 730aac ttt gta atg agt ggt tct gac tgt ggc cac att ttc atc tgg gat 2258Asn Phe Val Met Ser Gly Ser Asp Cys Gly His Ile Phe Ile Trp Asp735 740 745cgg cac act gct gag cat ttg atg ctt ctg gaa gct gat aat cat gtg 2306Arg His Thr Ala Glu His Leu Met Leu Leu Glu Ala Asp Asn His Val750 755 760gta aac tgc ctg cag cca cat ccg ttt gac cca att tta gcc tca tct 2354Val Asn Cys Leu Gln Pro His Pro Phe Asp Pro Ile Leu Ala Ser Ser765 770 775ggc ata gat tat gac ata aag atc tgg tca cca tta gaa gag tca agg 2402Gly Ile Asp Tyr Asp Ile Lys Ile Trp Ser Pro Leu Glu Glu Ser Arg780 785 790 795att ttt aac cga aaa ctt gct gat gaa gtt ata act cga aac gaa ctc 2450Ile Phe Asn Arg Lys Leu Ala Asp Glu Val Ile Thr Arg Asn Glu Leu800 805 810atg ctg gaa gaa act aga aac acc att aca gtt cca gcc tct ttc atg 2498Met Leu Glu Glu Thr Arg Asn Thr Ile Thr Val Pro Ala Ser Phe Met815 820 825ttg agg atg ttg gct tca ctt aat cat atc cga gct gac cgg ttg gag 2546Leu Arg Met Leu Ala Ser Leu Asn His Ile Arg Ala Asp Arg Leu Glu830 835 840ggt gac aga tca gaa ggc tct ggt caa gag aat gaa aat gag gat gag 2594Gly Asp Arg Ser Glu Gly Ser Gly Gln Glu Asn Glu Asn Glu Asp Glu845 850 855gaa taataaactc tttttggcaa gcacttaaat gttctgaaat ttgtataaga 2647Glu860catttattat atttttttct ttacagagct ttagtgcaat tttaaggtta tggtttttgg2707agtttttccc tttttttggg ataacctaac attggtttgg aatgattgtg tgcatgaatt2767tgggagattg tataaaacaa aactagcaga atgtttttaa aactttttgc cgtgtatgag2827gagtgctaga aaatgcaaag tgcaatattt tccctaacct tcaaatgtgg gagcttggat2887caatgttgaa gaataatttt catcatagtg aaaatgttgg ttcaaataaa tttctacact2947tgccatttgc atgtttgttg ctttctaatt aaagaaactg gttgttttaa aaaaaaaaaa3007aaggaattc3016<210>4<211>20<212>DNA<213>人工序列<220><223>PCR引物<400>4ggaacatttt ggcaaagaca 20<210>5<211>20<212>DNA<213>人工序列<220><223>PCR引物<400>5attcatgatc ttygcgatgc 20<210>6<211>8<212>PRT<213>人工序列<220><223>基序<400>6Asp Tyr Ser Thr Gly Tyr His Tyr1 5<210>7<211>7<212>PRT<213>人工序列<220><221>VARIANT<222>(1)...(7)<223>Xaa＝任何氨基酸<223>基序<400>7Cys Lys Xaa Phe Phe Lys Arg1 5<210>8<211>9<212>PRT<213>人工序列<220><221>VARIANT<222>(1)...(9)<223>Xaa＝任何氨基酸<223>基序<400>8Cys Pro Ala Cys Arg Phe Xaa Lys Cys1 5<210>9<211>16<212>DNA<213>Homo sapiens<400>9tgggtacatt ttgttc16<210>10<211>16<212>DNA<213>人工序列<220><223>突变的核酸序列<400>10tgggtaggtt ttgctc16<210>11<211>27<212>DNA<213>人工序列<220><223>简并引物<221>misc特征<222>7-10，13，19<223>n＝肌苷酸<221>misc特征<222>22<223>n＝A，T，G，or C<400>11rcayttnnnn arnckrcank mnkgrca27<210>12<211>22<212>DNA<213>人工序列<220><223>简并引物<221>misc特征<222>9，12，15，18<22 3>n＝肌苷酸<400>12gayrarkcnw cnggnwrnca yt22<210>13<211>20<212>DNA<213>人工序列<220><223>合成引物<400>13tctggtggtt gcactgagct 20<210>14<211>19<212>DNA<213>人工序列<220><223>合成引物<400>14acaatgtcag ctcaggctc 19<210>15<211>57<212>DNA<213>人工序列<220><223>合成引物<221>misc特征<222>(1)...(57)<223>n＝A，T，C or G<400>15aagcagtggt aacaacgcag agtacttttt tttttttttt tttttttttt tttttnn 57<210>16<211>27<212>DNA<213>人工序列<220><221>misc特征<222>(1)...(27)<223>n＝A，T，C or G<223>合成引物<400>16tttttttttt tttttttttt tttttnn27<210>17<211>30<212>DNA<213>人工序列<220><223>合成引物<400>17aagcagtggt aacaacgcag agtacgcggg 30
权利要求
1.一种实质纯化的雄激素受体复合物相关蛋白，其含有与SEQ IDNO2至少70％相同的氨基酸序列；此蛋白与雄激素受体结合，进而增加雄激素受体致活雄激素反应基因的能力。
2.权利要求1的雄激素受体复合物相关蛋白，其中所述氨基酸序列至少80％相同于SEQ ID NO2。
3.权利要求1的雄激素受体复合物相关蛋白，其中所述氨基酸序列至少90％相同于SEQ ID NO2。
4.权利要求1的雄激素受体复合物相关蛋白，其中所述氨基酸序列至少95％相同于SEQ ID NO2。
5.一种实质纯化的雄激素受体复合物相关蛋白，其含有100％的SEQ IDNO2的氨基酸序列。
6.一种含有SEQ ID NO2的氨基酸序列的实质纯化的雄激素受体复合物相关蛋白，其含有至多30个保守氨基酸的取代，其中所述蛋白与雄激素受体结合，进而增加雄激素受体致活雄激素反应基因的能力。
7.一种实质纯化的雄激素受体复合物相关蛋白，其是由在严格条件下与具有SEQ ID NO1的序列的探针杂交的核酸所编码，其中所述蛋白与雄激素受体结合，进而增加雄激素受体致活雄激素反应基因的能力。
8.一种编码权利要求1的蛋白的分离的核酸。
9.一种编码权利要求5的蛋白的分离的核酸。
10.一种编码权利要求6的蛋白的分离的核酸。
11.一种分离的核酸，其包含在严格条件下与具有SEQ ID NO1和/或SEQ ID NO3或其互补序列的序列的单链探针杂交的一条链。
12.权利要求11的分离的核酸，其中所述核酸编码产生一蛋白，该蛋白与雄激素受体结合，进而增加雄激素受体致活雄激素反应基因的能力。
13.权利要求12的分离的核酸，其中所述蛋白的氨基酸序列包含SEQ ID NO2的氨基酸序列。
14.权利要求11的分离的核酸，其中所述链的长度至少为15个核苷酸。
15.一种包含权利要求8的核酸的载体。
16.一种包含权利要求9的核酸的载体。
17.一种包含权利要求10的核酸的载体。
18.一种包含权利要求11的核酸的载体。
19.一种包含权利要求12的核酸的载体。
20.一种培养宿主细胞，其含有权利要求8的核酸。
21.一种培养宿主细胞，其含有权利要求9的核酸。
22.一种培养宿主细胞，其含有权利要求10的核酸。
23.一种培养宿主细胞，其含有权利要求11的核酸。
24.一种培养宿主细胞，其含有权利要求12的核酸。
25.一种制备蛋白的方法，该方法包括在培养物中培养 20的培养宿主细胞，在该培养宿主细胞中表达所述蛋白，并从培养物中分离所述蛋白。
26.一种诊断癌症的方法，该方法包括用权利要求6的雄激素受体复合物相关蛋白或其片段生产抗体，以诊断癌症细胞雄激素受体复合物相关蛋白的不正常表达。
27.与权利要求1的蛋白特异结合的抗体。
28.与权利要求5的蛋白特异结合的抗体。
29.一种诊断病人检体是否含有癌细胞的方法，该方法包括取得病人检体；和检测该检体细胞中雄激素受体复合物相关蛋白基因的表达；其中所述检体细胞中雄激素受体复合物相关蛋白基因表达水平高于正常细胞中雄激素受体复合物相关蛋白基因表达水平表示该病人检体含有癌细胞。
30.权利要求29的方法，其中癌细胞是肝肿瘤细胞。
31.一种治疗癌症的方法，该方法包括鉴别表达雄激素受体复合物相关蛋白基因的癌症病人；和用一化合物阻断雄激素受体复合物相关蛋白与雄激素受体结合或者降低雄激素受体致活雄激素反应基因的能力。
32.权利要求31的方法，其中癌症是肝癌。
33.权利要求31的方法，其中所述化合物是一种抗体。
34.权利要求32的方法，其中所述化合物是一种抗体。
35.一种诊断癌症的方法，包括用权利要求8的核酸或其片段检测癌症细胞中雄激素受体复合物相关蛋白基因的表达。
36.一种筛检降低雄激素受体介导的致活作用的化合物的方法，该方法包括在候选化合物存在的情形下，将权利要求1的蛋白与一种含有雄激素受体的蛋白质复合物接触；检测所述蛋白和该蛋白质复合物相互作用的程度；和评定是否所述相互作用程度较不存在候选化合物时所述蛋白和该蛋白质复合物相互作用的程度差，其中含有候选化合物时相互作用程度低于不含有候选化合物时相互作用程度表示该候选化合物降低雄激素受体介导的致活作用。
全文摘要
本发明涉及能结合雄激素受体并协助其致活作用的雄激素受体复合物相关蛋白及编码该蛋白的基因。
文档编号A61K38/00GK1375503SQ02101738
公开日2002年10月23日申请日期2002年1月17日优先权日2001年1月17日
发明者张泰阶申请人:台北荣民总医院

2010-2011专利技术

最新回复(0)