吴世容1 ,2 , 李志良1 ,2 ,李根容1 , 杨胜喜1
(1. 重庆大学化学化工学院,重庆400044 ;2. 重庆大学生物工程学院,重庆400044)
摘 要:发展生物质谱是为解决生命科学中有关生物物质分析问题,主要借助软电离质谱技术对生物大分子如蛋白质、核酸和多糖等进行结构分析。生物质谱已成为质谱学中最活跃的研究领域,推动了质谱分析理论和技术的发展。笔者简要介绍了生物质谱的发展,重点讨论因“发明了对生物大分子的质谱分析法”而荣获2002 年诺贝尔化学奖金一半的美国科学家约翰. 芬恩教授(John B. Fenn) 和日本科学家田中耕一工程师(Koichi Tanaka) 分别研发的电喷雾电离质谱(ESI - MS) 和基质辅助激光解吸电离质谱(MALDI - MS) ,特别阐述它们应用于蛋白质、核酸和糖结构分析及基因组学、蛋白质组学、糖组学等生物组学和化学组学中。
2002 年度诺贝尔化学奖授予了三位在生物大分子研究领域作出突出贡献的科学家以表彰他们开创了应用仪器分析法对于生物大分子进行确认和结构分析的方法[1 ] 。其中约翰. 芬恩(John B. Fenn) 和田中耕一(Koichi Tanaka) 各得奖金的1/ 4 (共分享1/ 2) ,主要贡献是“发明了对生物大分子进行确认和结构分析的方法”及“发明了对生物大分子的质谱分析法”。随着生命科学及生物技术的迅速发展,为了解决生命科学过程中的有关生物活性物质的分析问题而发展并推动了生物质谱。生物质谱目前已成为有机质谱中最活跃、最富生命力的前沿研究领域之一[2 - 9 ] 。它的发展强有力地推动了人类基因组计划及其后基因组计划的提前完成和有力实施。生物质谱主要用于解决两个分析问题:精确测量生物大分子,如蛋白质、核苷酸和糖类等的分子量,并提供分子结构信息;对存在于生命复杂体系中的微量或痕量小分子生物活性物质进行定性或定量分析。业已发展了各种新软电离技术及联用技术, 扩展了质谱可测质量范围,特别是色谱- 质谱联用技术和质谱串联技术。在此,主要讨论生物大分子的质谱分析问题。近年来涌现出较成功地用于生物大分子质谱分析的软电离技术主要有下列几种:1) 电喷雾电离质谱;2) 基质辅助激光解吸电离质谱;3) 快原子轰击质谱;4) 离子喷雾电离质谱;5) 大气压电离质谱。在这些软电离技术中,以前面三种近年来研究得最多,应用得也最广泛。笔者主要讨论在生物大分子分析方面的研究与应用。
1 电喷雾电离质谱
电喷雾电离( ESI) 是一种“软”电离技术,起源于1917 年,但它用于质谱乃80 年代事(见图1 电喷雾电离质谱) 。1984 年[3 - 4 ] 美国耶鲁大学化工系教授约翰. 芬恩(John B. Fenn) 研究组等首次发表了ESI - MS实验结果,并于4 年后[5 ]报道首次成功运用ESI - MS分析蛋白质。ESl - MS 既可分析大分子也可分析小分子。对于分子量在1000Da 以下的小分子,会产生[M+ H] + 或[M - N] - 离子,选择相应的正离子或负离子形式进行检测,就可得到分子量。而高达20000Da大分子在ESI - MS 中生成一系列多电荷离子,通过数据处理系统能够得到样品的分子量,准确度优于0.01 %。这些离子(m/ z) 以“表观”质量数出现在谱图,与分子量有密切关系。据报道,ESI - MS 通过多电荷离子已能测出分子量达133 000Da 蛋白质[3 - 5 \ 〗或200000 Da 糖蛋白[3 ,6 ] 。ESI - MS 或与HPLC 联用可进行蛋白质序列和构象分析,酶反应中间体分析,酶抑制剂机理分析、共价或非共价复合体分析等方面均获得应用。有人预测用用ESI 可侧得数MDa 分子量的蛋白质[3 - 6 ] 。
图1 电喷雾电离质谱 略
图2 基质辅助激光解吸离子化质谱 略
2 基质辅助激光解吸离子化质谱激光解吸电离质谱(LDI-MS)
早被作为分析难挥发有机物手段,曾用于分析合成聚合物和热不稳定生物小分子。但K可测分子量均低于3 kDa ,对生物大分子测定受到很大限制。直到1988 年Tanaka[6 ] 和Hil1enkamp[7 ]两个研究组分别提出基质辅助激光解吸电离质谱(MALDI-MS ,见图2 基质辅助激光解吸离子化质谱) 后才使LDI - MS 应用于生物大分子分析得到发展[2 ,6 -7 ] 。MALDl-MS 分析蛋白质的关键是选择合适的基质,首先基质相当于溶剂,样品分子被基质彼此分开,这种分离削弱了样品分子间相互作用; 然后基质从激光脉冲中吸收能量并转化为固溶体系激发能产生瞬间相变,离子形成过程有两临界值:低表面解吸而高本体解吸给出离子信号。基质能量传递机制为质子转移和碱金属加合等。基质必须满足一些共性:在合适溶剂中溶解性能,对激光吸收性能,合适反应活性,首先基质必须在蛋白质溶剂中有好溶解性,常用蛋白质溶剂有盐酸水溶液,水-乙氰/ 乙醇混合物,70 %甲酸。其次必须能很好地吸收激光,以使能量沉积在基质中而非分析物上。另外基质反应活性必须考虑:能对蛋白质或其他分析物起共价修饰或氧化作用的基质不能采用。近期有关基质研究仍很活跃,是一热点。用MALDI - MS 分析多肽及蛋白质时,当基质选择妥当之后即着手准备样品。Tanaka 等[6 ]把待测多肽溶于甘油中,并与很细金属粉未混合,然后把悬浮液滴到探头上,让激光照射,再进入质谱分析。甘油对377nm 激光透明,激光与甘油不发生作用,因此引入金属粉未在溶液中形成吸收中心。Hillenkamp 等[7 ]认为激光解吸时是底物吸收激光,选择合适基质使之与样品混合就可测量大分子物质,并提出“基质辅助激光解吸”名称。直到选用烟酸作为基质才有突破,烟酸和蛋白质混合溶液滴到探头上,干后用激光照射可得蛋白质分子离子信号。Tanaka 法[6 ]灵敏度为10 - 9mol 数量级,受关注则相对不多;Hil1enkamp 法[7 ]灵敏度达10 - 12 mol 量级,信号强且信噪比高因而被广泛采用,高灵敏度优点显著,样量只需1 pmol 甚至更少。
3 快原子轰击质谱
鉴于分析样品一般都偶极矩大的分子,基质表面准分子离子受到Ar 快原子流轰击接受能量,解吸脱离液面溅入气相中。FAB - MS 谱中主要出现准分子离子峰而少出现分子离子峰,且在基质加入酸或碱或盐使相应准分子离子强度增大。当然也不排除在气相中溅出样品分子受轰击产生分子离子,但丰度比准分子离子小得多。由于电离未受加热,所以FAB 电离技术特别适合于热不稳定高极性化合物,如蛋白质,核酸及糖类等,测出的质量数上限已可达到10 - 4Da 。因结构简单而信号持续和重现性好等特点,便于推广,故仍是常用重要的质谱手段。
4 多肽和蛋白质质谱分析
蛋白质是生物体中含量最高功能最重要的生物大分子,存在于所有生物细胞,约占细胞干质量50 %以上,在生命科学中占重要地位。由多个氨基酸组成肽则称为多肽或为数不大时称为寡肽,组成氨基酸单元称为氨基酸残基。多肽广存于自然界,最重要的是作为蛋白质亚单位。蛋自质是一条或多条肽链以特殊方式组合的生物大分子,复杂结构主要包括以肽链为基础的肽链线型序列[称为一级结构]及由肽链卷曲折叠而形成三维[称为二级,三级或四级]结构。目前质谱主要测定蛋自质一级结构包括分子量、肽链氨基酸排序及多肽或二硫键数目和位置。1981 年首先采用FAB 双聚焦质谱测定肽分子量, 分析十一肽(Mr =1318) ,质谱中出现准分子离子[M + 1 ] + = 1319 强峰。谱中出现均为单电荷离子主要包括肽离子,甘油离子和甘油簇离子。FAB 质谱常用氩Ar 作轰击剂,但在某些情况用氙Xe 效果更好一点。FAB 质谱法既可测正离子谱也可测负离子谱,由于蛋白质和多肽分子含多个易质子化部位,所以一般测正离子谱,基质加入酸可增强(M+ l) + 离子强度。分析疏水性肽常用极性较小基质,测定负离子谱时则采用碱性液体作基质。分子量小于6 kDa 肽或小蛋白质合适用FAB 质谱分析,更大分子量的多肽和蛋自质可用MALDI 质谱或ESI质谱分析。用MALDI - TOF 质谱分析蛋自质最早一例是HillenKramp 等于1988 年提出用紫外激光以烟酸为基质在TOF 谱仪上测出质量数高达60 kDa 蛋白质,精确度开始只有0. 5 % ,后改进到0. 1-0. 2 %。MALDI -TOF 质谱所测质量上限高、灵敏、迅速( < 1min) 而广泛用于蛋白质分析。开始MALDI 主要测高质量大分子蛋白质,其实也能很好测定小分子蛋白质。1988 年, Fenn 等首次成功用电喷雾( ESI) 质谱分析蛋白质大分子。质谱出现多电荷离子群,蛋白质单电荷分子离子在谱图中未出现,但多电荷离子表观m/ z 值计算出分子量大大超过了仪器可测上限。一般在ESI 条件下,能与多肽或蛋白质结合质子数即正电荷数由分子中所含碱性氨基酸总数和N - 端氨基决定;电荷数目及分布也受实验条件如溶液pH 值及温度等影响。ESI 由溶液喷射,与HPLC 或毛细管电泳(CZE) 联用最方便。ESI - FT质谱分辨率很高,最近报道其分辨率可达170k ,用于分析两种蛋白质软骨素酶I 和II ,同位素峰分布清晰可辨,测出分子量Mr 数值与DNA 法导出数值最接近,精度优于其他方法。
质谱测定多肽和蛋白质是根据质谱碎片离子推导序列的,质谱出现序列信息碎片主要是通过酰胺键断裂形成。绘制“肽图”是重要测序方法:将蛋白质绘制“肽图”是一重要测列方法:将蛋白质酶解,继用质谱分析,得出各肽段分子量;根据酶解选择性,将各组分与已知结构肽对照或用串联质谱法将各片段肽测序,然后推导整个蛋白质序列[4 - 7 ] 。
5 核酸质谱分析
生物高分子核酸(nucleic acid) 存在于一切活细胞中,构成单位是核苷酸(nucleoticle) 。核酸分为脱氧核糖核酸(DNA) 和核糖核酸(RNA) 两大类。DNA 是遗传信息的载体,RNA 在蛋白质生物合成起重要作用。近来发现质谱是核酸一级结构分析最有利手段。如核酸的核苷酸顺序可表为5′PAPCPGPTPT3′,若仅关心碱基顺序,则可写成5′ACGTT3′。需注意所表示核苷酸顺序是从左至右5′→3′。多核苷酸片段一端为3 - 端,另一端为5′- 端;未端可以是不带有磷酸基核苷3′或5′- 羟基也可是核苷酸3′或5′- 羟基带有磷酸基团。各核苷酸分子及残基沿序排列就是核酸一级结构,种类不多但因核苷酸数目和排序不同而构成多种不同核酸。用质谱测核酸一级结构,相当测定分子量和碱基序。
质谱曾用来测核酸分子量但较困难,其信噪比和分辨率一般较低。20 世纪90 年代初MALDI - TOF 质谱分析核酸只含4~6 个碱基、分子量为数kDa 低级寡核苷酸。后来发现在样品中混入过量铵盐,则可几乎全部取代加合离子而成为铵加合离子,通过转移一个质子给核苷酸中磷酸二酯成为游离磷酸而本身则转变为氨分子逸去,质谱呈现相应尖锐单峰。用MALDI 质谱分析最大分子量为15 ×104 Da[4 - 6 ]含500 个碱基对的双链核酸DNA ,用PCR 扩增噬菌体基因组,基质为吡啶- 2 - 羧酸和3 - 羟基衍生物的混合物,激光波长为266 nm ,加速电压为45 keV ,采用较大加速电压,分子离子停留时间短从而避免裂解。为提高分辨率曾采用“延迟萃取技术”:在1. 3 m 反射式MALDI - TOF 质谱仪分析含12 个碱基寡核苷酸, 分辨率达到了7500[5 ] 。将MALDI 与傅里叶变换质谱联用,可提高分辨率,达136 kPa[6 ] 。ESI 质谱用于分析寡核苷酸不及用于分析蛋白质顺利,同样是两个原因。若调控样品溶液pH 值或加入有机酸碱来抑制多电荷离子形成。用ESI - FTMS 可准确测定长链DNA 分子量可高达108Da[3 ] , 如测定双链64 体DNA 分子量, 误差≤0.5Da[3 - 5 ] 。
用质谱法进行DNA 测序可以采用下列3 种途径:1) Sanger 反应质谱测序法将凝胶电泳分离鉴定改用质谱分析,大大加快了分析速度。但凝胶电泳费时需数小时或更长时间, 而质谱法分析一次只需数分钟。Sanger 反应后溶液是含有各种长度不同,碱基不同的寡核苷酸的混合物,碱基数目可能达百个以上,这就要求质谱可测质量范围需达105 Da 以上并且分辨率至少大于500[4 - 6 ] 。实验结果表明大分子量核苷酸分别单测分子离子峰强度大于混合物,如含36 和40 碱基的寡核苷酸在混合物中因其分子离子峰太弱而无法测出。2) 酶解质谱测序法用专属特异酶在3′或5′位依次切割碱基,继用质谱法测质量差数变化即可推出切去碱基种类,从而获得DNA 序列信息。酶解MALDI-TOF 质谱测序法可分析含化学修饰碱基寡核苷酸,而传统方法不能实现。3) 质谱裂解测序法宜用高分辨MALDI-FT 或ESI-FT 质谱仪,其离子回旋共振腔俘获离子,延长离子停留时间,提供多级串联质谱碰撞,有利于碎片离子形成和鉴定及序列测定。
6 糖类的质谱分析
分子和细胞生物学等发展揭示了许多重要生物活性物质含有糖成分。糖链上结合蛋白质及磷酸脂等成为一类“糖复合物”,它们作为信息分子对于细胞识别、增生、分异以及维持生物体免疫、生殖、神经系统和新陈代谢平衡都具有重要作用,同时寡糖和多糖具增免疫、抗辐射、抗肿瘤活性,可作为药物应用;糖类遂成为继蛋白质和核酸后又一类重要生物大分子。糖结构比蛋白质和核酸复杂得多,糖链由含多元羟基并顺反异构环状己或戊糖通过苷键连接而成,各单糖有五个手性碳且连接位置和构型多种多样。测定糖类结构包括1) 分子量;2) 糖残基种类和数量;3) 糖残基接合位置连接点;4) 构型。质谱是解决糖结构的有效手段:软电离技术都适合于分析高极性、难挥发、热不稳定糖类样品;TOF - MS 和FT - MS 是测大分子糖最佳选择,精度高特别适合糖复合物或多糖降解后单和寡糖残基鉴定和序列测定。当然异构体区分特别是立体结构测定尚待研究完善。糖蛋白或其它糖复合物都含寡糖链,多糖也由寡糖聚合而成,所以解决寡糖结构是关键。可用MALDI-TOF 测寡糖分子量与结构但产生碎片离子较少,提供结构信息不多。近来用源后衰减技术来弥补此缺点[4 - 5 ] 。但最有效方法是MalDI- FTMS/CADMS法[4 - 6 ] ,许多碎片离子通常不出现而出现CAD谱,由此可知MS/MS 技术的重要功能。
糖复合物在质谱分析前先用酶降解,将寡糖链切割用HPLC 分离纯化后,再作质谱分析。因寡糖在一般紫外范围无吸收,需先将寡糖衍生化引入强紫外吸收基团[4 - 5 ] ,质谱毋需衍生就可直接分析[6 ] 。MALDI- MS 常用于糖复合物分析且碎片离子少,如出现多个强峰则暗示样品是混合物,很可能各组分分子离子峰。常用MALDI - FTMS 来测糖复合物酶消解液中分离寡糖,天然糖复合物寡糖键组成有规律,可用于结构判断。如哺乳动物机体中糖复合物所含N - 连结寡糖有三种类型单糖,即己糖、去氧己糖和乙酰氨基己糖。以寡糖质量数可判断结构,但须用其他诸如NMR 等方法核证。
致谢:本文成文过程经过本实验室共同讨论,参加讨论人员有周原副教授,工程师廖春阳硕士、讲师张梦军硕士、硕士生聂金媛、兰玉坤、尹子卉、李伯玉、刘振德等;博士生熊清、孙立力、梅虎等,谨致谢忱!
参考文献:
[1 ] MARKIDES K, GRALUND A. Advanced information on the Nobel Prize in Chemistry 2002 , The Royal Swedish Academy of Sciences[DB/ OL ] . http :/ / www. nobel. se/ chemistry/ laureates/2002/ chemadv. pdf .
[2 ] YIN ZHIHUI , WU SHIRONG, LI SHENGSHI. The analysis of biological macromolecules——Introduction of 2002 Nobel Prize In Chemistry[J ] . Chin J Nature : Ziran Zazhi , 2002 , 24(6) :361 - 366.
[3 ] YAMASHITA M, FENN J B. Electrospray ion source : another variation on the free - jettheme[J ] . J Phys Chem , 1984 , 88 : 4451 - 4 459.
[ 4 ] ALEKSANDROV ML , GALL L N , SHKUROV V A et al. Mass spectrometry with electrospray ionization [J ] . Dokl Akad Nauk SSSR , 1984 , 277 : 379 - 383.
[5 ] FENN J B , MANN M, MENG C K,et al. Electrospray ionisation for mass spectrometry of large biomolecules [J ] . Science , 1989 , 246 : 64 - 68.
[6 ] TANAKA K,WAKI H , IDO Y, et al. Protein and polymeranalysis up to m/ z 100. 000 by laser ionisation time - of - flight mass spectrometry[J ] . Rapid Commun Mass Spectrom , 1988 , (2) :151 - 153.
[7 ] KARAS M, HILLENKAMP F. Laser desorption ionisation of proteins with molecular masses exceeding 10. 000 daltons [J ] . Anal. Chem. ,1988 , 60 : 2 299 - 2 301.
[8 ] WILM M, SHEVCHENKO A , MANN M, et al. Femtomole sequencing of proteins from polyacrylamide gels by nano - electrospray mass spectrometry[J ] . Nature , 1996 , 379 : 466 - 469.
[9 ] CHEN Y. Biological Mass Spectrometry , In : WANG E ed , Analytical Chemistry toward 21 Century[M] . Beijing : Science Press , 1999 , 112 - 159.