2025 年 Albert Lasker 基础医学研究奖已授予 Dirk Görlich 和 Steven McKnight,以表彰他们发现了蛋白质序列中低复杂性结构域的结构和功能,揭示了细胞内运输和细胞组织的新原理。

真核生物基因组编码的数千种蛋白质中的大多数由 20 种不同类型的氨基酸组成。这些氨基酸的化学多样性,以及它们序列沿蛋白质聚合物长度的变化,产生了深刻的复杂性。正是这种化学复杂性引导蛋白质聚合物折叠成稳定、复杂且独特的 3 维结构。在 1980 年代,从事基因调控领域的科学家发现了在氨基酸序列多样性方面贫乏的蛋白质结构域。这些结构域没有利用正常蛋白质使用的 20 个氨基酸中的大部分,而是由仅几种不同类型氨基酸的胡言乱语的重复组成。在这里,我描述了导致我和我的学员关注这些丑小鸭蛋白的生物学效用的间接途径。

开始

当我在 5 年前开始我的职业生涯时,几乎不需要什么灵感就把我的马车挂在真核基因调控领域。弗朗索瓦·雅各布 (Francois Jacob) 和雅克·莫诺 (Jacques Monod) 描述细菌基因调控逻辑的概念化正在被其他杰出科学家沃尔特·吉尔伯特 (Walter Gilbert) 博士、马克·普塔什内 (Mark Ptashne) 博士和查尔斯·亚诺夫斯基 (Charles Yanofsky) 博士转化为机理敏锐。在选择研究真核细胞的基因调控时,我加入了这个迅速成为一个拥挤的领域。

Steven L. McKnight 博士

我以一种蹒跚的方式做出了一些贡献。我与已故的鲍勃·金斯伯里 (Bob Kingsbury) 一起,使用一种称为接头扫描诱变的方法制作了胸苷激酶 (TK) 基因转录启动子的图谱。1 我和我的学员后来纯化了 CCAAT/增强子结合蛋白 (CEBP) 作为与 TK 基因启动子结合的转录因子之一。通过对这种 CEBP 的研究,Bill Landschulz 博士、Peter Johnson 博士和我设计了亮氨酸拉链的概念来解释蛋白质二聚化和 DNA 结合。2 最后,在对一种名为病毒粒子蛋白 16 (VP16) 的蛋白质的研究中,Steve Treisenberg 博士、Kelly LaMarco 博士和我发现了一个用于激活 RNA 聚合酶 II 转录的蛋白质区域。3

出乎意料的是,我们没有观察到任何迹象表明VP16的激活结构域会表现出稳定的三维结构。它由正常蛋白质使用的 20 种氨基酸的有限库组成。VP16 激活结构域内谷氨酸和天冬氨酸残基的过度代表让人联想到以 Ptashne 为特征的酵母半乳糖 4 (Gal4) 转录因子的激活结构域。4 由于这种酸度和缺乏序列复杂性,已故的医学博士 Paul Sigler 令人回味地将 VP16 和 Gal4 激活结构域描述为酸斑。

这项研究从好时光演变为坏时光,然后又回来了。酸斑在细菌基因调控研究中没有优先权,这很好。这意味着我们可能会遇到一些新的东西。到 1990 年代初期,我们被难住并认输了,这很糟糕。最后,基因组测序揭示了真核生物蛋白质组中数千个低序列复杂性的蛋白质结构域,这是件好事。我们现在了解到,在参与细胞生物学几乎所有方面的蛋白质中都发现了低复杂度结构域——这对生物学领域来说是一个大而广泛的问题。

中间

在 90 年代和以前,我被寻找可以通过调节转录来治疗疾病的药物的愿望分散了注意力。我曾在总部位于旧金山的生物技术公司 Tularik Inc 短暂工作过。1995 年,我搬到了达拉斯的德克萨斯大学西南分校 (UTSW) 医学中心。在合成化学家的帮助下,Rick Bruick 博士、Kevin Gardner 博士和我发现了一种称为缺氧诱导因子 2α (HIF2α) 的转录因子的化学抑制剂。这导致了一家总部位于达拉斯的生物技术公司的成立,该公司优化了 HIF2α 抑制剂并进行了临床试验,最终获得了美国食品和药物管理局 (FDA) 批准该药物。默克公司现在销售 belzutifan 作为治疗冯·希佩尔-林道 (VHL) 病的药物,这是一种由 VHL 基因变异引起的肾癌亚型。

结束

由于已故的彼得·奥唐纳 (Peter O’Donnell) 和伊迪丝·奥唐纳 (Edith O’Donnell) 的慷慨解囊,在过去的 3 年里,捐赠者在我的出版物中总是被承认为匿名的,我被允许作为 UTSW 医疗中心科学家自由地跟随我的鼻子。让我专注于职业生涯的最后阶段的休息是在 2010 年左右。我的同事埃里克·奥尔森博士描述了一种能够促使干细胞分化为心肌细胞的异恶唑化学物质。为了帮助 Olson 找到该化学品的分子靶标,Joe Ready 博士合成了一种生物素化衍生物,用于亲和纯化。令人困惑的是,谢山海博士在我的实验室工作时观察到,生物素化的异恶唑导致数百种不丰度的细胞蛋白同时沉淀。质谱显示这些沉淀物富含 RNA 结合蛋白。

还原论研究产生了 2 个感兴趣的观察结果。首先,生物素化的异恶唑通过在生化裂解物中结晶而发挥其魔力——它是化学物质的结晶形式,共沉淀了数百种 RNA 结合蛋白。其次,沉淀所必需的和足够的蛋白质决定因素总是结构无序的。经过 3 年的转移,我又开始研究低复杂性领域——这个问题在 1980 年代难倒了我。

最易受异恶唑晶体沉淀影响的蛋白质是肉瘤融合蛋白(FUS)RNA结合蛋白。当我们开始与 FUS 合作时,杜新林博士和加藤正人博士惊讶地发现,该蛋白质的纯化样品被相分离成凝胶状状态。我们想起了 Dirk Görlich 博士的有趣研究,该研究显示了核孔蛋白中无序的、富含苯丙氨酸:甘氨酸 (FG) 的低复杂性结构域的纯化样品的凝胶化。5

FUS 的相分离为我们提供了第一个用于研究离散低复杂性结构域的生化测定。使用相分离测定,我们确定了介导自缔合所需的 FUS 区域。这些信息,加上与美国国立卫生研究院的Robert Tycko博士合作进行的结构研究,使我们能够认识到有利于相分离的能量学在很大程度上是由主链氢键造成的。

我们现在了解到,某些低复杂性结构域可以通过主链氢键的短网络与分子特异性合并。这种形式的蛋白质与蛋白质的相互作用,我们称之为跨β自缔合,是微弱的。成对的β链遵循 Linus Pauling 博士的结构生物学规则,但它们的稳定性处于热力学平衡的阈值。

Görlich 的工作表明,无序的 FG 结构域如何合并形成核孔中央通道内的过滤屏障。5 我们自己的工作已经证明了 RNA 结合蛋白的低复杂性结构域对于介导核和细胞质 RNA 颗粒的动态组织的重要性。6 不稳定的低复杂性域自关联的概念已经发展到代表一个可推广的事实,这一事实已被过去十年发表的数百项独立研究所证实。7

2016 年,Yi Lin 博士和 Kato 意外发现中间丝蛋白的组装依赖于氨基末端低复杂性结构域的自缔合。在被这一发现转移注意力后,周晓明博士意识到人类遗传学研究,这些研究查明了神经丝光基因低复杂性域中致病的变异。这些错义变异是夏科-玛丽-图斯病的病因,总是会改变神经丝轻蛋白第 8 位或第 22 位的脯氨酸残基。脯氨酸是唯一不向多肽主链贡献氨基 (NH) 基团的氨基酸,这意味着它不能参与跨β氢键的形成。了解了这一点,周想知道与 Charcot-Marie-Tooth 相关的错义变异(所有这些都会导致通过替代脯氨酸向多肽主链添加单个 NH 基团)是否会促使异常稳定的交叉β结构的形成。

这一假设很容易得到证实。8 将神经丝轻亚基组装成中间丝要求低复杂度结构域相互作用处于适当平衡的热力学稳定性水平。在神经丝光低复杂性结构域内取代脯氨酸 8 或 22 通过指定将单个氢键添加到其他平衡的分子结构中来导致独特的神经系统疾病。以大致相同的方式,细胞质 tau 蛋白内脯氨酸残基 301 或 hnRNPA2 蛋白的脯氨酸残基 298 的单错义替换分别会导致额颞叶痴呆或佩吉特病。8

通过破译低复杂性结构域自关联的试管研究与夏科-玛丽-图斯病、额颞叶痴呆或佩吉特病的孟德尔遗传学之间的联系,我以强调我所说的软弱的美德来结束这篇短文。通过进化设计,低复杂性域旨在形成不稳定的相互作用。数以千计的低复杂性域不断进出结构组织的弱束缚状态。这个概念描绘了一幅比我学生时代学到的更动态的细胞组织图景。它还为年轻科学家提供了未来几十年的无限机会,让他们发挥他们的想象力来了解这种活力如何支撑细胞生物学。

文章信息

通讯作者:Steven L. McKnight 博士,德克萨斯大学西南医学中心生物化学系,5323 Harry Hines Blvd,达拉斯,德克萨斯州 75390 (steven.mcknight@utsouthwestern.edu)。

在线发布:2025 年 9 月 11 日。土井:10.1001/jama.2025.14912