Science 版 (精华区)
发信人: emacs (In the Name of Love), 信区: Science
标 题: 蛋白质·氨基酸·分析肽链
发信站: 哈工大紫丁香 (2002年08月03日13:07:58 星期六), 站内信件
分析肽链
发现一种蛋白质的经验式只是工作的一半——实际上远不到
一半,更为艰巨的工作是破译一种蛋白质分子的结构。有充分的
理由相信,每一种蛋白质的性质完全取决于所有那些氨基酸在分
子的链上是怎样(按什么次序)排列的。这就给生物化学家提出
了一个难题。即使每种氨基酸只用一次,19种氨基酸在一条链上
可能的排列方式也有大约12亿亿种。如果你觉得这个数目难以置
信,试求 19×18×17×16×……的值,这就是求有多少种可能
的排列方式的方法。如果你不相信算术,可以找出19个棋子,在
棋子上依次标上1至19,看看你能把它们排列成多少种不同的次
序。我保证,这个游戏你很快就会玩不下去的。
如果你有一个像血清清蛋白那样由500多个氨基酸组成的蛋
白质,那么它可能的排列方式就会有大约1×10600种,即在1的
后面加600个零。这简直是一个大得难以相信的数目,比整个已
知宇宙中亚原子粒子的数目还要大得多。换句话说,就此而言,
即使把这些粒子都压结实,宇宙也远远容纳不下。
虽然在那么多可能的排列方式中,要弄清楚一个血清清蛋白
分子到底属于哪一种,似乎是没有希望的,但是这类问题实际上
已经得到了处理和解决。
1945年,英国生物化学家桑格着手确定一条肽链中氨基酸的
排列次序。他首先试图鉴定出肽链一端(氨基端)的氨基酸。
显然,这一端的氨基酸(称做N末端氨基酸)的氨基是游离
的,就是说,不与另一个氨基酸相连接。桑格使用了一种能够与
游离的氨基结合、但不能与已经跟羧基连接的氨基结合的化学药
品,制取了肽链的一种DNP(二硝基苯酚)衍生物。利用DNP,他
可以标记出N末端氨基酸。因为把DNP结合在一起的键比把链上的
氨基酸结合在一起的键力量大,所以它能够把链分解成单个的氨
基酸,并把带有DNP标记的那一个氨基酸分离出来。碰巧DNP基为
黄色,因此这种特殊的氨基酸同其DNP标记一起,在纸色谱图上
呈现为一个黄色的斑点。
因此,桑格能够分离并鉴定出一条肽链的氨基端的氨基酸。
用同样的方法,他鉴定出链另一端的氨基酸——含有一个游离羟
基的氨基酸,叫做C末端氨基酸。他还多次把一条肽链中的一些
其他氨基酸一个一个地切割下来,并鉴定出它的末端顺序。
桑格进而研究整条肽链。他选用的是胰岛素。这种蛋白质有
两个优点:一是它对人体的功能有非常重要的作用;二是它是一
种比较小的蛋白质,胰岛素的最简式分子量只有 6 000。DNP处
理表明,这种蛋白质分子由两条肽链组成,因为它含有两种不同
的N末端氨基酸。这两条链是由一些胱氨酸分子连接起来的。桑
格用化学的方法断开胱氨酸中两个硫原子之间的键,把胰岛素分
子分成它的两条肽链,每一条都完整无损。其中一条链的N末端
氨基酸为甘氨酸(称之为G链),另一条链的N末端氨基酸是苯丙
氨酸(称之为P链)。现在可以对这两条链分别进行研究了。
桑格和他的同事塔皮首先把G链和P链分解成单个的氨基酸,
从而鉴定出组成G链的21个氨基酸和组成P链的30个氨基酸。接着,
为了了解排列顺序的情况,他们就把G链和P链分解成由2~3个氨
基酸组成的碎片,而不分解为单个的氨基酸。这个任务可以通过
部分水解的方法来完成,水解仅断开链中比较弱的键;也可以通
过用某些消化物质攻击胰岛素的方法来完成,这些消化物质只断
开氨基酸之间的某些键而不损害其他键。
利用这些方法,桑格和塔皮把G链和P链分别分解成许多不同
的片段。例如,把P链分解成48个不同的片段,其中由2个氨基酸
(二肽)组成的片段22个,由3个氨基酸组成的片段14个,由3个
以上的氨基酸组成的片段12个。
经过分离的各种小的肽,用纸色谱法可以再分解成单个的氨
基酸。现在研究者们准备测定这些片段中氨基酸的顺序了。假如
他们有一个由缬氨酸和异亮氨酸组成的二肽。问题会是:顺序是
Val-lleu还是Ileu-Val?换句话说,N末端氨基酸是缬氨酸还
是异亮氨酸?(氨基以及相继的N末端单元,通常认为在一条链
的左端。)对此,DNP标记可以回答这个问题。如果DNP标记出现
在缬氨酸上,那么,缬氨酸就是N末端氨基酸,从而可以确认这
个二肽的排列顺序是Val-Ileu。如果DNP标记出现在异亮氨酸上,
排列顺序则为Ileu-Val。
一个由3个氨基酸组成的片段,其排列顺序也可以确定出来。
假如一个片段的组成是亮氨酸、缬氨酸和谷氨酸。DNP试验可以
首先鉴定出N末端氨基酸。比方说,如果是亮氨酸,那么,排列
顺序不是Leu-Val-Gin就是Leu-Glu-Val。然后人工合成这两
种组合,并分别滴在滤纸上,使成为色谱图上的斑点,再看看哪
一种组合在滤纸上占的位置与被研究的片段所占的位置相同。
对于含有3个以上氨基酸的肽,可以把它们先分解成比较小
的片段,然后再进行分析。
用这种方法把胰岛素分子分成的所有片段的结构确定以后,
下一步就是按照它们在链中的正确次序,把这些片段连接在一起
——就像小孩玩拼板玩具那样。这里有许多线索可寻。例如,已
知G链只含有1个单位的氨基酸——丙氨酸,在从分解G键所得到
的肽混合物中,发现丙氨酸有两种组合方式:丙氨酸-丝氨酸和
胱氨酸-丙氨酸。因此,在完整的G链中,排列次序一定是CyS-
Ala-Ser。
利用这些线索,桑格和塔皮逐渐地把这些片段拼到了一起。
把所有的片段都确认出来,并以完全满意的顺序把它们排列出来,
要花费几年的时间。但是到了1952年,他们就研究出了G链和P链
中所有氨基酸的精确的排列次序,接着他们继续研究两条链是怎
样连接起来的。1953年,他们宣布终于胜利地破译了胰岛素的结
构。一种重要的蛋白质分子的全部结构第一次被研究出来了。由
于这一成就,桑格获得了1958年的诺贝尔化学奖。
生物化学家们立即采用桑格的方法来确定其他蛋白质分子的
结构。1959年,攻克了核糖核酸酶,这是一种由含有124个氨基
酸的单个肽链组成的蛋白质分子;1960年,研究出了含有158个
氨基酸的烟草花叶病毒的蛋白质单位;1964年,破译了一种含有
223个氨基酸的蛋白质——胰蛋白酶;到1967年,这种研究技术
实际上已经自动化了。瑞士血统的美国生物化学家埃德曼设计了
一种顺序分析仪,可以把5毫克纯蛋白质的氨基酸一个一个地分
离和鉴定出来。肌红蛋白链的60个氨基酸就是用这个方法在4天
内鉴定出来的。
人们已经详细地研究出了更长的肽链。到20世纪80年代,任
何蛋白质,不论有多大,其详细结构都可以确定出来。只要不怕
麻烦,就毫无疑问。
总的来说,这些分析表明,大部分蛋白质都能在它们的链上
充分显示出所有(或几乎所有)不同的氨基酸。只有几种比较简
单的纤维状蛋白,如丝中或腱中发现的那些蛋白,偏重于2~3种
氨基酸。
在由全部19种氨基酸组成的那些蛋白质中,单个的氨基酸没
有明显的排列次序,也很少发现有周期性的重复。这些氨基酸是
这样排列的,当链通过在各处形成的氢键而折叠起来的时候,各
种侧链能构成一个含有正确排列次序的原子团或电荷图样的表面,
从而使蛋白质发挥其功能。
【三思言论集】 欢迎给制作人来信:jasper_uk@sina.com
--
What a friend we have in EMACS,
All our text-problems to halt!
What a privilege to keypress
Control-meta-ESC-shift-alt!
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 天外飞仙]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:5.157毫秒