癌症临床试验怎么找,为什么明明有新药研究,患者却总是“够不着”?对晚期、复发、转移或标准治疗选择有限的癌症患者来说,临床试验可能意味着更早接触前沿药物、联合治疗或精准治疗方案。但现实中,临床试验入组并不是简单搜索“癌症新药试验”就能完成:病理类型、分期、既往治疗线数、基因突变、肝肾功能、用药时间间隔、脑转移状态,都可能决定能不能入组。
一项覆盖3804例转移性或进展期恶性肿瘤患者的前瞻性真实世界评估显示,神经符号、多智能体AI系统可显著提高肿瘤临床试验匹配效率:传统人工筛查约需120分钟,而AI辅助后中位筛查时间降至约30分钟;系统共筛查23912组“患者—试验”配对,并找到17912个经肿瘤医生确认的匹配机会。它给患者最直接的启发是:临床试验入组难,核心不是“有没有试验”,而是“有没有能力把你和正确试验快速、准确地匹配起来”。
为什么临床试验这么难找?
成人癌症患者参加临床试验的比例长期偏低,部分研究提示不足5%。这并不代表临床试验少,而是匹配过程非常复杂。一个患者能否入组,通常要同时回答几十甚至上百个问题:
- 疾病是否匹配:肺癌、乳腺癌、结直肠癌、胃癌、肝癌等不同癌种,甚至同一癌种的不同病理亚型,入组条件完全不同。
- 分子分型是否匹配:EGFR、ALK、ROS1、BRAF、HER2、KRAS、MSI-H、TMB、NTRK等基因或生物标志物,常常决定试验方向。
- 治疗史是否匹配:是否接受过化疗、免疫治疗、靶向治疗、抗体偶联药物、放疗,治疗线数是否符合要求。
- 时间窗口是否匹配:末次治疗距离多久、手术后多久、放疗结束多久、影像学进展发生在何时,都会影响资格。
- 身体条件是否匹配:白细胞、血小板、肝功能、肾功能、心功能、体能评分、感染状态等必须达标。
- 排除条件是否存在:活动性脑转移、自身免疫病、间质性肺病、未控制感染、近期血栓或出血风险,可能导致无法入组。
这些信息往往散落在门诊病历、住院记录、病理报告、基因检测报告、影像报告、出院小结、用药清单和PDF扫描件中。人工逐条核对不仅耗时,也容易漏掉关键细节。对患者而言,错过一个时间窗口,可能就错过一次潜在治疗机会。
AI匹配不是简单聊天机器人
很多患者听到“AI找临床试验”,容易想到把病情发给聊天机器人,让它直接推荐试验。但在肿瘤临床研究中,这种做法风险很高。原因很简单:临床试验入排标准是严格的医学逻辑,不是模糊建议。
普通大语言模型擅长阅读和总结病历,却不天然擅长执行精确规则。例如,“既往接受过含铂化疗后进展”“放疗结束至少14天”“肌酐清除率大于某个阈值”“未经某类靶向药治疗”这些条件,既涉及时间顺序,也涉及否定、例外和医学概念标准化。若AI直接从自由文本中“猜”结果,就可能出现误判。
更可靠的方向,是把AI分成两层:第一层负责从复杂病历中提取信息;第二层用可审计的医学知识图谱和确定性规则判断是否符合条件。这类模式被称为神经符号AI:神经网络负责理解文本,符号系统负责执行规则。
神经符号AI到底强在哪?
这项真实世界评估中的AI平台由4个核心模块组成:肿瘤领域大语言模型负责提取和标准化病历信息;肿瘤知识图谱负责承载试验入排逻辑;推荐引擎负责排序可能匹配的试验;专家标注数据集用于训练和验证。关键点在于:AI提取的信息不会被直接拿来推荐,而是必须映射到标准肿瘤概念,并通过知识图谱规则校验。
这对患者尤其重要。临床试验匹配不能只追求“看起来聪明”,更要追求“为什么推荐、依据是什么、医生能不能复核”。一个合格的AI辅助系统,至少应满足三点:可追溯、可解释、可由医生最终确认。
| 匹配方式 | 核心特点 | 主要风险 | 患者价值 |
|---|---|---|---|
| 人工筛查 | 医生或研究协调员逐条阅读病历和方案 | 耗时长、依赖人力、容易受病历分散影响 | 医学把关强,但覆盖范围有限 |
| 普通大语言模型 | 可快速理解自由文本,生成候选建议 | 可能误解时间、否定句和复杂排除条件 | 可提高初筛速度,但不能单独作为入组依据 |
| 神经符号AI | 文本理解加知识图谱规则校验 | 依赖数据完整性和知识库维护 | 兼顾效率、可解释性和安全性 |
真实世界数据表现如何?
该系统在157367页临床文档中接受评估,文本规模约8650万token,资料类型包括结构化病历、扫描PDF和传真病理报告。这种环境更接近真实医院,而不是“干净”的研究数据集。评估标准采用双肿瘤医生一致确认的金标准,医生间一致性Cohen’s κ为0.92,说明参照标准较可靠。
结果显示,完整神经符号AI系统在患者—试验层面的F1分数为0.82,95%置信区间为0.81至0.83,敏感性和特异性均约0.84。相比之下,GPT-4零样本提示的F1为0.47,链式思维提示提升至0.67,GPT-4o为0.47。这里的F1分数可以理解为综合衡量“找得到真正合适患者”和“不过度推荐不合适患者”的指标。
| 模型或方法 | F1分数 | 临床含义 |
|---|---|---|
| GPT-4零样本提示 | 0.47 | 直接让模型判断匹配,可靠性不足 |
| GPT-4链式思维提示 | 0.67 | 加入推理步骤后改善,但仍缺少确定性校验 |
| GPT-4o | 0.47 | 在该任务中未显示更高匹配可靠性 |
| 完整神经符号AI系统 | 0.82 | 文本提取加知识图谱规则验证,表现最佳 |
进一步分析也支持这一结论:去掉知识图谱校验后,F1从0.82降至0.79;去掉多智能体任务拆分后,F1降至0.78。这说明肿瘤临床试验匹配的关键,不只是“模型更大”,而是要把患者资料转化为标准化医学信息,再用确定性规则执行入排判断。
筛查时间缩短意味着什么?
传统人工筛查每位患者约需120分钟。AI辅助后,中位筛查时间降至约30分钟,其中包括自动处理和医生验证;从资料进入系统到形成推荐的中位时间少于7天。对晚期癌症患者来说,时间本身就是治疗资源。
筛查提速的价值至少体现在三个层面:
- 减少错过窗口:部分试验要求末次治疗、手术或放疗后满足特定时间间隔,延误筛查可能直接失去资格。
- 扩大试验覆盖:医生不可能人工记住所有进行中的研究,AI可帮助快速扫描更大范围的试验机会。
- 把医生时间还给患者:减少行政性病历检索,让医生更多投入治疗决策、风险沟通和方案解释。
但必须强调:AI匹配不等于一定能入组。匹配只是第一步,后续还要经历研究中心复核、知情同意、筛查检查、保险或费用沟通、交通安排以及患者本人意愿确认。
哪些错误最容易发生?
这项评估对错误来源做了分类,结果非常贴近真实诊疗场景。时间推理错误占32%,缺失结构化数据占28%,歧义和否定表达占18%,OCR识别问题占12%,医学本体映射不一致占10%。
| 错误来源 | 占比 | 患者可能遇到的情况 | 应对建议 |
|---|---|---|---|
| 时间推理 | 32% | “去年做过化疗”“近期进展”等描述不精确 | 整理明确日期:诊断日、手术日、每线治疗起止日、进展日期 |
| 缺失结构化数据 | 28% | 报告里没写清基因结果、用药剂量或肝肾功能 | 补齐原始报告,不只提供口头描述或截图 |
| 歧义和否定 | 18% | “未见明确转移”“不排除进展”容易被误读 | 让主治医生解释关键结论,必要时补充复查 |
| OCR识别问题 | 12% | 扫描件模糊、传真件变形,数字或药名被识别错误 | 尽量提供清晰PDF或原始电子版报告 |
| 本体映射不一致 | 10% | 同一种疾病或基因突变有多种写法 | 保留病理和基因检测报告原文,避免自行改写 |
这组数据提醒患者:想提高临床试验匹配成功率,最有效的动作之一不是盲目搜索,而是先把资料整理完整。资料越完整,AI和医生越能准确判断机会。
患者该准备哪些资料?
如果正在考虑癌症临床试验,建议尽早建立一份“入组资料包”。这不仅方便医生判断,也能显著减少反复补材料带来的时间损失。
- 病理资料:初诊病理报告、复发或转移灶病理报告、免疫组化结果。
- 基因检测:NGS报告、单基因检测报告、MSI/MMR、PD-L1、TMB、HER2、BRCA等相关结果。
- 影像资料:CT、MRI、PET-CT报告,最好保留DICOM影像光盘或云链接。
- 治疗时间轴:每一线治疗方案、起止日期、最佳疗效、进展日期、停药原因。
- 实验室检查:近期血常规、肝肾功能、凝血功能、尿常规、心电图等。
- 合并疾病和用药:自身免疫病、乙肝/丙肝、糖尿病、心血管病、抗凝药、激素或免疫抑制剂使用情况。
- 体能状态:ECOG评分、体重变化、疼痛、营养状态、是否能独立活动。
- 特殊病灶:脑转移、骨转移、胸腹水、间质性肺病、感染、出血或血栓风险。
资料整理的核心原则是:不要只写“用过靶向药”“做过化疗”,而要写清具体药物、日期、疗效和进展证据。临床试验判断最怕信息模糊。
公平性问题不能忽视
该研究还评估了不同人口学亚组之间的AI匹配公平性。结果显示,没有任何亚组超过预设的10个百分点F1差异阈值;观察到的最大差距约7个百分点,出现在白人患者与黑人或非裔美国患者之间。研究分析认为,这种差异主要与上游病历资料缺失、就医记录分散、结构化数据不足有关,而不完全是模型本身偏倚。
这对中国患者同样有启发。跨院就医、异地治疗、不同医院系统互不连通、纸质报告丢失,都会降低匹配准确性。尤其是多线治疗后的患者,如果没有完整治疗时间轴,即便存在合适试验,也可能因为信息不完整而被系统或研究中心暂时排除。
因此,临床试验公平性不只是算法问题,也是医疗信息可及性问题。对患者和家属而言,越早建立完整病历档案,越有机会在关键治疗节点获得更多选择。
AI推荐后还要医生确认吗?
答案是必须确认。该系统被定位为面向医生的决策支持工具,而不是替代医生的自动决策工具。约25%的病例会被分流给人工复核,所有输出都需要提供透明的证据链和推荐理由。这一点非常关键。
癌症临床试验涉及疗效不确定性、潜在副作用、往返研究中心成本、随机分组可能性、安慰剂或对照治疗设置、退出机制等问题。患者不应只问“我能不能入组”,还要问:
- 这个试验处于Ⅰ期、Ⅱ期还是Ⅲ期?主要目标是安全性、有效性,还是与标准治疗比较?
- 研究药物或治疗方式的作用机制是什么?与我目前突变或病理类型是否真正相关?
- 是否可能随机到对照组?对照组治疗是否符合当前指南?
- 需要多久复查一次?是否必须频繁跨城就医?
- 研究用药、检查、住院和交通费用分别由谁承担?
- 如果治疗无效或副作用无法耐受,退出后还有哪些后续方案?
AI可以帮助发现机会,但最终是否参与,应由患者、家属和专业肿瘤医生共同决策。
入组不成功还有哪些选择?
很多患者把临床试验视为“最后希望”,但没有入组并不等于没有路。常见原因包括不符合入排标准、研究中心名额已满、地理距离过远、实验室指标不达标、既往治疗不符合要求等。此时可以考虑以下方向:
- 重新评估标准治疗:是否存在未使用过的指南推荐方案,是否需要更换治疗线。
- 补做或更新基因检测:肿瘤进展后可能出现新的耐药机制,重新活检或液体活检有时能发现新靶点。
- 寻找其他地区试验:同一机制药物可能在不同国家或研究中心有不同入排标准。
- 关注已获批新药:部分前沿药物可能已在海外获批,但国内可及性、上市时间和医保覆盖存在差异。
- 申请多学科会诊:复杂病例可结合肿瘤内科、放疗科、介入科、影像科、病理科共同评估。
尤其对罕见突变、耐药后进展、标准治疗耗尽或国内新药尚未上市的患者,全球范围内的信息检索和药物可及性评估,往往决定下一步能否及时衔接。
怎样提高匹配成功率?
患者和家属可以把临床试验匹配当成一个系统工程,而不是一次临时搜索。以下做法更务实:
- 在每次进展时主动询问:影像确认进展后,不要只等待下一线治疗,也要同步询问是否有临床试验。
- 保留原始报告:不要只保留手机照片,尽量保存PDF、DICOM影像和纸质原件。
- 建立治疗时间轴:用表格记录诊断、手术、放疗、每线药物、疗效和进展时间。
- 明确基因检测版本:记录检测公司、样本类型、检测日期、覆盖基因范围和关键阴性结果。
- 不要隐瞒合并疾病:自身免疫病、肺炎、乙肝、血栓、心脏病等会影响安全性判断。
- 提前评估现实成本:交通、住宿、陪护、请假、频繁复查,都会影响能否坚持完成研究。
- 寻求专业解读:试验名称相似不代表适合,入排标准必须逐条核对。
真正有价值的匹配,不是把所有试验列表发给患者,而是筛掉明显不适合的项目,保留医学上可解释、现实中可执行的机会。
临床试验与海外新药如何衔接?
临床试验、海外已获批药物、国内标准治疗,并不是互相排斥的选项。对很多晚期癌症患者来说,治疗决策常常需要同时比较三件事:国内指南方案是否还有空间,海外是否已有获批新药,是否存在合适临床试验。
患者最容易遇到的痛点包括:不知道某个新药在哪些国家获批;不知道适应症是否与自己的癌种、突变和治疗线一致;不知道国内是否上市或纳入医保;不知道海外药物能否合规获取;不知道药物说明书、临床数据和自身病情之间如何对应。
这也是MedFind持续关注全球抗癌资讯、权威指南和前沿药物可及性的原因。对患者而言,信息差可能带来治疗时差;而治疗时差,在肿瘤进展期往往非常昂贵。
MedFind能帮患者做什么?
面对癌症临床试验、海外新药和复杂治疗方案,患者最需要的不是更多碎片信息,而是一套可执行的判断路径。MedFind由癌症患者家属发起,长期追踪全球抗癌药物、诊疗指南、临床研究和药物可及性信息,帮助患者把“看不懂、找不到、来不及”的问题拆解清楚。
如果正在寻找临床试验或评估下一步治疗,MedFind可协助完成三类关键工作:
- 辅助问诊与方案解读:基于病理、基因检测、治疗史和影像进展,梳理当前治疗位置,帮助患者理解医生建议、临床试验机会和潜在风险。
- 前沿药物信息核查:追踪全球获批进展、适应症、关键临床数据、用药条件和常见副作用,减少因信息滞后错过选择。
- 抗癌药品跨境直邮支持:对于海外已获批、患者符合用药逻辑且经医生评估需要的抗癌药物,提供合规可及性信息与跨境直邮服务支持,帮助患者更稳妥地衔接治疗。
临床试验匹配正在被AI重塑,但真正决定患者获益的,仍是完整资料、专业判断、及时行动和可靠药物可及性。把病历整理好,把问题问清楚,把全球治疗选择看完整,很多看似关闭的门,才可能重新出现缝隙。
【参考文献】
1. Monreal I, Chappell H, Kiss R, et al. Understanding the barriers to clinical trial referral and enrollment among oncology providers within the Veterans Health Administration. Mil Med. 2025;190(3-4):e891-e898. doi:10.1093/milmed/usae441.
2. Eldridge L, Goodman NR, Chtourou A, et al. Barriers and opportunities for cancer clinical trials in low- and middle-income countries. JAMA Netw Open. 2025;8(4):e257733. doi:10.1001/jamanetworkopen.2025.7733.
3. Loaiza-Bonilla A, Yost C, Kurnaz S, et al. Transforming oncology clinical trial matching through neuro-symbolic, multi-agent AI and an oncology-specific knowledge graph: a prospective evaluation in 3804 patients. ESMO Real World Data Digit Oncol. 2026;12. doi:10.1016/j.esmorw.2026.100706.
4. Wornow M, Lozano A, Dash D, et al. Zero-shot clinical trial patient matching with LLMs. NEJM AI. 2025;2(1):AIcs2400360. doi:10.1056/AIcs2400360.
5. Jin Q, Wang Z, Floudas CS, et al. Matching patients to clinical trials with large language models. Nat Commun. 2024;15:9074. doi:10.1038/s41467-024-53081-z.
6. Gallifant J, Afshar M, Ameen S, et al. The TRIPOD-LLM reporting guideline for studies using large language models. Nat Med. 2025;31:60-69. doi:10.1038/s41591-024-03425-5.
7. Pittell H, Calip GS, Pierre A, et al. Racial and ethnic inequities in US oncology clinical trial participation from 2017 to 2022. JAMA Netw Open. 2023;6(7):e2322515. doi:10.1001/jamanetworkopen.2023.22515.
8. Oyer RA, Hurley P, Boehmer L, et al. Increasing racial and ethnic diversity in cancer clinical trials: an American Society of Clinical Oncology and Association of Community Cancer Centers joint research statement. J Clin Oncol. 2022;40(19):2163-2171. doi:10.1200/JCO.22.00754.
