目前,估计癌症患者的生存率主要取决于他们的癌症分期。研究人员表示,除了分期标准之外,还有许多其他因素可能会影响患者的生存。
团队使用机器学习方法,创建了称为“癌症生存计算器”的原型工具,并在大型数据集上对其进行了测试。初步测试估计了乳腺癌、甲状腺癌和胰腺癌患者的5年生存率。
研究人员此次收集了部分年份诊断出的乳腺癌、甲状腺癌和胰腺癌患者的相关资讯。收集到的3/4数据用于训练机器学习演算法,以识别诊断特征与患者5年生存率之间的模式,然后依照对生存影响最大的因素进行排序。利用剩余的数据,团队使用统计方法来测试原型估计生存率的准确性。
该团队纳入了25万9485名乳腺癌患者、7万6624名甲状腺癌患者和8万4514名胰腺癌患者的数据。按癌症部位划分,影响患者诊断后5年是否存活4大因素分别如下:乳腺癌(患者是否接受过癌症手术、患者诊断时的年龄、肿瘤大小以及从诊断到治疗的时间);甲状腺癌(诊断时的年龄、肿瘤大小、治疗时间以及淋巴结受累情况);胰腺癌(癌症手术、癌症的组织学或显微镜分析、肿瘤大小以及诊断时的年龄)。
尽管肿瘤大小等一些预测因素是癌症分期的一部分,但研究结果表明,还有更多因素影响癌症患者在疾病阶段之后的生存。
研究人员报告称,验证测试表明,该计算器对于所有3个癌症部位的生存率估算都“高度准确”。同时,这一“癌症生存计算器”的优势在于数据集更全面,而且使用了新的机器学习数据模型,处理速度更快,风险预测也更准◆