在首届年度研究综述中,《美国医学会杂志医学新闻》(JAMA Medical News)邀请该杂志的几位资深编辑提名他们最喜爱的、过去一年发表在 《美国医学会杂志》 上的研究——他们认为这些文章最具影响力、最有新闻价值、最具创新性——并阐述了他们的选择理由。主编 Kirsten Bibbins-Domingo 博士、医学博士、公共卫生硕士和执行主编 Gregory Curfman 医学博士从这些提名中精心挑选出了最终入选名单。

该列表涵盖了 9 项研究和临床试验,这些研究和试验于 2024 年 10 月至今年 9 月期间首次在线发表,涉及一系列医疗保健主题,从心脏病到痴呆症再到人工智能 (AI)。

“这些文章探讨了当前研究的热点领域,以及对患者、临床医生和公共卫生界都至关重要的临床问题,”比宾斯-多明戈在谈到这组文章时说。“它们也展现了研究人员为解答重要问题而采用的各种方法。”

我们在此介绍 JAMA 年度最佳研究。

GLP-1 类药物可降低心力衰竭死亡率

射血分数保留型心力衰竭(HFpEF)已成为最常见的心力衰竭类型,部分原因是全球肥胖和 2 型糖尿病的增加。尽管 HFpEF 与高死亡率相关,但据副主编玛丽·麦克德莫特医学博士称,“目前已知的能够预防 HFpEF 患者住院或死亡的疗法寥寥无几”。

现在,一项探索胰高血糖素样肽-1 (GLP-1) 受体激动剂在降低 HFpEF 风险中的作用的研究带来了希望和新的临床进展方向。

研究人员利用美国医疗保健索赔数据对几项队列研究进行了分析,发现患有肥胖相关 HFpEF 和 2 型糖尿病的患者,如果开始使用 GLP-1 药物索马鲁肽或替拉肽,其因心力衰竭住院或全因死亡的风险比使用西格列汀(一种降血糖药物,用作安慰剂)的患者低 40% 以上。

尽管之前的研究在减轻体重方面支持替拉肽,但本研究对两种 GLP-1 药物进行了直接比较,发现双重葡萄糖依赖性促胰岛素多肽/GLP-1 受体激动剂在降低心力衰竭风险方面并没有比索玛鲁肽带来显著优势。

麦克德莫特表示,GLP-1 药物除了减肥之外,还在“极大地影响着医疗实践和公共卫生”。

她表示,这项观察性研究“表明,这些药物还与住院率和死亡率的降低有关”。“这项研究的结果将对数百万 HFpEF 患者产生广泛的影响。”

这项研究纳入了超过 58000 名参与者,其设计使得研究对象群体比临床试验更为庞大且更加多样化,充分展现了真实世界证据如何能够有效地补充随机试验的结果。作者指出,这项研究也进一步强化了 GLP-1 疗法在“不断发展的心血管代谢疾病管理中,超越既往已确立的益处”的作用。

带状疱疹疫苗的额外益处

今年 4 月,一项涉及澳大利亚 10 万多人的观察性研究发表,为带状疱疹疫苗可以降低患痴呆症风险的观点注入了新的动力。

截至12月初,这篇文章的浏览量已超过7万次,其研究结果已被约100家新闻媒体报道。麦克德莫特指出,这项研究“非常及时且切合实际”,尤其是在人们对疫苗日益增长的怀疑态度背景下。

由于存在健康接种者偏差 ,疫苗的观察性试验很难进行。健康接种者偏差指的是,选择接种疫苗的人往往比不接种疫苗的人更健康。如果发现接种带状疱疹疫苗的人患痴呆症的风险较低,那么在临床试验之外,很难确定究竟是疫苗本身,还是其他与预防痴呆症相关的习惯(例如限制饮酒或保持健康体重)才是主要原因。

这项研究的研究人员利用了自然随机化。澳大利亚国家免疫计划于 2016 年 11 月 1 日开始为 70 至 79 岁的人群免费提供减毒活带状疱疹疫苗(Zostavax)。1936 年 11 月 2 日及之后出生的人符合接种条件,而 1936 年 11 月 2 日之前出生的人则不符合。

研究人员并没有直接比较接种疫苗者和未接种疫苗者,而是以出生日期为依据进行比较,具体来说,就是比较该日期是否符合接种带状疱疹疫苗的条件。除了接种带状疱疹疫苗的概率存在显著差异外,预计在接种资格截止日期前不久出生的人与在截止日期后不久出生的人在健康行为和其他特征方面并无显著差异。

在带状疱疹疫苗上市后的大约7年里,符合接种条件的人群中新确诊痴呆症的概率比不符合接种条件的人群低近2个百分点,且未发现该疫苗对其他疾病具有保护作用。结合其他研究的类似发现,作者总结道,这些结果表明,带状疱疹疫苗接种“是一种低成本、高回报的干预措施,有助于减轻痴呆症的负担”。

副主编普雷蒂·马拉尼医学博士表示,这项研究“引发了关于病毒感染作用的各种问题”,其研究结果“又多了一个接种疫苗的理由”。

评估医疗保健人工智能工具的研究不足

近年来,大型语言模型(LLM)在医学领域的应用研究呈爆炸式增长,但这些研究提出的问题是否切中要害?这项系统性综述发现,目前对 LLM 在医疗保健领域的评估“分散且不足”,仅有 5%的研究使用了真实患者数据。

研究人员查阅了 2022 年至 2024 年初发表的 500 多项研究,总结了 LLM 评估的特点。他们发现,这些测试方法可能并未侧重于最有用的医疗保健应用。

大多数研究都集中在评估医学知识方面,例如回答执业资格考试题和做出临床诊断。而对于法学硕士申请人在行政任务方面的表现——例如开处方和转诊单、分配计费代码以及记录临床笔记——则关注较少。这些行政任务需要体力劳动,容易导致医生职业倦怠。

大多数 LLM 评估主要侧重于准确性,但其他关键特征,例如部署考虑因素、公平性、偏倚和毒性,则很少被评估。而且,大多数研究并非采用真实的患者护理数据,而是依赖于医学检查问题、专家提出的问题和临床医生设计的案例描述等混合数据。

副主编琳达·布鲁贝克医学博士称该分析“对临床工作流程中的 LLM 评估进行了非常及时的评估”,并表示未来的研究应该“优先考虑评估中真实的患者护理数据,以确保与现实世界的情况保持一致”。

基于研究结果,作者得出结论:需要采用基于共识的方法来评估医疗保健领域的逻辑逻辑模型(LLM)。他们指出了现有研究的六大主要缺陷,并提出了未来改进的建议,包括使用真实患者数据、量化偏差以及优先处理高价值的管理任务。展望未来,该指南有助于指导在医疗保健环境中开展逻辑逻辑模型测试的关键工作。

新生儿基因组测序离临床应用更近一步

在美国,大约每 300 名新生儿中就有 1 名被诊断出患有某种疾病,而这种疾病最初是通过新生儿筛查发现的。虽然目前已推荐约 60 种疾病进行筛查,但基因组测序可以识别数百种疾病,特别是那些缺乏标准筛查方法所需血液生物标志物的遗传性疾病。

一项前瞻性研究的早期结果表明,针对特定基因组进行变异的靶向基因组测序分析不仅可行,而且比标准筛查更能及早发现更广泛的可治疗健康状况和疾病,从而改善健康结果。

针对所有新生儿罕见病的基因组统一筛查研究(GUARDIAN)是首批采用 DNA 分析方法的大规模观察性研究之一 ,最初 4000 名患者的中期研究结果表明,该研究“可以识别出患有某些疾病的新生儿,这些疾病在出现症状之前可能在临床上无法检测到”。布鲁贝克说。

该研究纳入了纽约市 6 家医院中不同种族和民族的婴儿,这些婴儿在 2022 年 9 月至 2023 年 7 月期间接受了基因组测序的扩展筛查。筛查的接受度很高:72% 的受访者同意参与研究,91% 的参与者同意接受额外的神经发育障碍可选筛查。

近 4%的新生儿筛查结果呈阳性,在 120 名确诊阳性的新生儿中,92%被确诊患有标准新生儿筛查未涵盖的疾病。这些仅通过基因组测序才能发现的可治疗疾病包括长 QT 综合征、威尔逊病和重症联合免疫缺陷病,其中一例重症联合免疫缺陷病患者成功接受了骨髓移植。

布鲁贝克指出,这种筛查方法可以帮助儿童更早地获得挽救生命的治疗。该研究的作者承认,还需要开展后续研究来评估他们的研究结果是否适用于其他人群。不过,鉴于 DNA 测序成本的下降以及父母接受度的提高,布鲁贝克认为新生儿基因组测序“正接近其潜在的临床应用价值”。

正在进行的 GUARDIAN 研究计划在未来几年内招募 10 万名婴儿。

针对痴呆风险人群的生活方式干预

芬兰有 FINGER ,现在美国有 POINTER——这两项临床试验都旨在评估生活方式干预(例如运动和社交活动)对有痴呆风险的老年人认知轨迹的益处。

美国 POINTER 试验在 5 个临床中心招募了约 2100 名参与者,并将他们随机分配到两个组中的一组。两组参与者都被鼓励增加身体和认知活动、社交参与和心血管健康监测,并采取更健康的饮食习惯。

但其中一组几乎完全依靠自身力量进行变革,两年内仅参加了6次由专人引导的同伴互助小组会议,以及一些公开的教育资料。另一组则接受了更系统、更深入的干预——共进行了38次小组会议——并且参与者被要求承担更高的责任。

在为期两年的研究中,两组参与者的认知功能均有所改善,但结构化干预组的改善程度显著高于自主干预组。试验开始时认知能力较低的参与者从干预中获益更多,但对于携带 APOE ε4(阿尔茨海默病的主要遗传风险因素)基因的个体和非携带者而言,认知获益程度相同。

由于试验规模较小,无法评估参与者最终是否出现认知障碍或痴呆,作者得出结论,需要进一步研究以了解其发现的临床意义。他们还指出,由于缺乏无干预对照组,他们无法排除参与者认知能力改善的其他可能解释,例如重复认知测​​试带来的练习效应以及参与试验本身带来的益处。

尽管如此,副主编克里斯托弗·穆斯医学博士表示:“这项试验意义重大,因为它证实了结构化的多领域生活方式干预对美国有认知能力下降或痴呆风险的老年人群的益处,其中包括那些在痴呆症临床试验中经常被忽视的种族和民族群体。”

确定脑损伤患者的输血阈值

急性脑损伤患者常伴有贫血,而贫血会增加发病率和死亡率。虽然输注红细胞可以缓解贫血,但输注红细胞也可能导致继发感染和肺损伤等并发症。既往关于非危及生命出血情况下输血的研究结果不一,目前尚无明确的最佳血红蛋白阈值用于急性脑损伤患者的输血。

急性脑损伤患者输血策略 (TRAIN) 随机临床试验的结果支持放宽红细胞输注阈值以改善神经系统预后。

“在 TRAIN 研究之前,神经重症监护中的输血阈值是基于有限的或推断的数据,而对于脑损伤患者的最佳治疗方案,由于小型研究和荟萃分析的结果相互矛盾,因此存在争议,”高级编辑 Philip Greenland 医学博士说。

这项多中心 3 期临床试验纳入了约 800 名急性脑损伤患者,这些患者在受伤后 10 天内血红蛋白水平低于 9 g/dL。研究人员将患者随机分配到两组:一组采用宽松输血策略(血红蛋白低于 9 g/dL 即开始输血),另一组采用限制性输血策略(仅当血红蛋白降至 7 g/dL 以下时才进行输血)。6 个月后,宽松输血组中有 63%的患者出现不良神经系统预后,而限制性输血组的这一比例为 73%。限制性输血组中约有 14%的患者至少发生过 1 次脑缺血事件,而宽松输血组的这一比例为 9%。

研究结果表明,对于急性脑损伤患者,当血红蛋白水平在 9 g/dL 时开始输血,与在 7 g/dL 时开始输血相比,出现长期不良预后的可能性更低。考虑到该研究的发现及其高引用率,格陵兰预测 TRAIN 研究可能会“真正改变临床实践”。

避免低风险乳腺癌患者接受手术

导管原位癌(DCIS)是导致乳腺癌过度诊断的主要原因之一——如果不治疗,它可能永远不会造成危害。尽管有证据表明并非所有 DCIS 都会发展为浸润性癌,但治疗通常包括手术,并可能联合辅助放疗或内分泌治疗。

考虑到不必要的癌症治疗带来的不良影响, COMET 试验的研究人员开展了一项非劣效性研究,比较了积极监测与符合指南的治疗方案。该试验纳入了近 1000 名年龄在 40 岁及以上的女性,她们均被新诊断为激素受体(HR)阳性、ERBB2 受体阴性、低风险的导管原位癌(DCIS)。随机分配至标准医疗组的女性接受了常规治疗,包括保乳手术和乳房切除术;而积极监测组的女性则定期接受体格检查和影像学检查,并根据需要进行手术干预。

两年后,积极监测组同侧浸润性癌的累积发生率为4.2%,而遵循指南治疗组为5.9%,两组疗效不劣于后者。两组浸润性肿瘤的特征无显著差异。

COMET 是首个报告低风险导管原位癌 (DCIS) 管理中,遵循指南的治疗与积极监测疗效比较的随机临床试验,结果表明积极监测并不逊于常规治疗。接受标准治疗的患者中约有 10% 接受了乳房切除术,而积极监测组的这一比例不到 2%。

“多年来,医生和患者一直担心导管原位癌(DCIS)治疗过度,导致不必要的并发症和费用,”《美国医学会肿瘤学杂志 》(JAMA Oncology) 副主编兼主编玛丽·L·迪西斯医学博士表示。新的数据“表明,对于一些患有 DCIS 的女性来说,积极监测可能是一种选择,可以避免更广泛的手术和药物治疗。”

更适合艾滋病毒感染者的乙肝疫苗

免疫功能低下者,例如艾滋病病毒感染者,可能无法对传统的乙肝疫苗产生足够的免疫反应。乙肝仍然是全球性的健康问题,也是导致肝脏相关死亡的主要原因之一。但在一项随机临床试验中,研究人员发现,用胞嘧啶磷酸鸟嘌呤佐剂替代传统的氢氧化铝佐剂,可以为最初对疫苗无反应的艾滋病病毒感染者提供更佳的血清保护作用。

BEe-HIVe 试验纳入了来自 10 个国家 41 个地点的近 600 名 HIV 感染成人,这些患者此前接种过乙型肝炎疫苗但无应答,并且正在接受抗逆转录病毒治疗。参与者被随机分配接受 2 剂或 3 剂含胞嘧啶磷酸鸟嘌呤佐剂的乙肝疫苗(HepB-CpG 疫苗),或 3 剂含氢氧化铝佐剂的常规乙肝疫苗(HepB-alum 疫苗)。

研究人员发现,接种两剂 HepB-CpG 疫苗的参与者中有 93%产生了针对该病毒的保护性抗体,而接种三剂的参与者中有 99%产生了保护性抗体。这两种接种方案均优于三剂 HepB-alum 疫苗,后者仅对 81%的人提供血清保护。此外,这种新型疫苗比传统疫苗起效更快。

尽管三期临床试验主要针对艾滋病毒感染者,但据马拉尼称,该试验“为在其他对一系列乙肝疫苗无反应的患者中尝试这种方法提供了证据”。如果成功,这种方法可以将保护范围扩大到更多免疫功能低下的人群,以及老年人、吸烟者、糖尿病患者或肥胖症患者等可能无法对传统疫苗产生足够反应的人群。

治疗难治性高血压的新希望

对于全球数百万血压即便服用多种药物仍居高不下的患者而言,一项 3 期随机临床试验的结果可能提供一种新的治疗选择。洛伦德司他(Lorundrostat)是一种首创的醛固酮合成酶抑制剂,研究表明,将其添加到现有药物治疗方案中可显著降低血压。

这项国际研究招募了 1000 多名高血压控制不佳的成年患者,其中许多人对现有降压药物治疗无效,且已服用 2 至 5 种处方降压药。参与者随机接受洛伦德司他(每日 50 毫克,部分患者根据疗效逐渐增加至 100 毫克)或安慰剂治疗,疗程为 12 周。

Launch-HTN 试验的结果令人鼓舞:6 周后,洛伦德司他使收缩压降低了 16.9 mmHg,具有临床意义,而安慰剂组仅降低了 7.9 mmHg。

该药物耐受性良好,安全性高。虽然与安慰剂组相比,洛伦德司他组低钠血症、高钾血症和肾功能下降的发生率更高,但因这些不良事件而停药的比例低于1%。

对于柯夫曼来说,这项研究之所以特别重要,是因为它关注的是高血压患者的这一特定群体。

“这种药物为治疗难治性高血压开辟了新的途径,这种高血压可能会影响高达 40% 的患者,”他说。

它还可以满足那些已经用尽常规治疗方案的难治性高血压患者的未满足需求。

迄今为止,尽管这些患者面临着较高的心血管风险,包括心肌梗死、中风或慢性肾病,但他们的选择仍然有限。

洛伦德司他针对的是过量醛固酮的生成,而醛固酮是高血压的根本原因之一。与现有的通过阻断醛固酮受体发挥作用的醛固酮阻滞剂不同,洛伦德司他直接抑制产生醛固酮的酶,从而提供了一种全新的作用机制。

文章信息

在线发表日期: 2025 年 12 月 12 日。doi:10.1001/jama.2025.20503

利益冲突披露: McDermott 博士报告称,他曾担任由 tirzepatide 生产商礼来公司开展的一项无关试验的指导委员会成员,并申请了一项由研究者发起的、旨在研究礼来公司 tirzepatide 的研究基金。未报告其他利益冲突。