​谷歌 AI 研究推出 DeepSomatic:新型癌细胞基因变异识别模型

研究团队与加州大学圣克鲁兹分校的研究人员联合推出了 DeepSomatic,这是一种创新的模型,旨在识别癌细胞中的基因变异。在与儿童医疗中心的合作研究中,DeepSomatic 成功发现了其他工具未能识别的 10 种小儿白血病细胞变异。

DeepSomatic 采用了一种针对癌症基因组的小型变异调用器,能够兼容 Illumina 短读段、PacBioHiFi 长读段和 OxfordNanopore 长读段。这一方法在 DeepVariant 的基础上进行了扩展,能够检测单核苷酸变异 (SNV) 和小插入缺失 (indels),支持肿瘤-正常和肿瘤单一工作流程,包括福尔马林固定石蜡包埋 (FFPE) 模型。

DeepSomatic 的工作原理是将对齐后的读段转换为图像般的张量,这些张量编码了堆叠情况、基础质量和对齐上下文。通过卷积神经网络,模型对候选位点进行分类,判定其为体细胞变异或非变异,最终生成 VCF 或 gVCF 文件。这种设计使得 DeepSomatic 在技术平台上具有高度的适应性,因为该张量能够总结不同技术间的局部单倍型和错误模式。

在数据集和基准测试方面,DeepSomatic 使用 CASTLE(癌症标准长读段评估) 数据集进行训练和评估。该数据集包含 6 对匹配的肿瘤和正常细胞系,使用 Illumina、PacBioHiFi 和 OxfordNanopore 进行了全基因组测序。研究团队发布了基准集和访问权限,以便其他研究者进行重用,这填补了多技术体细胞训练和测试资源的空白。

结果显示,DeepSomatic 在单核苷酸变异和小插入缺失的检测上都优于目前广泛使用的方法。例如,在 Illumina 测序的插入缺失方面,DeepSomatic 达到了约 90% 的 F1 分数,而其他方法仅为 80%; 在 PacBio 测序中,DeepSomatic 的 F1 分数超过 80%。研究团队还报告了 329,011 个体细胞变异的发现,进一步验证了 DeepSomatic 在插入缺失检测方面的强大能力。

研究:https://research.google/blog/using-ai-to-identify-genetic-variants-in-tumors-with-deepsomatic/

划重点:

🌟DeepSomatic 能够识别多种癌细胞基因变异,涵盖多种测序平台。

🔍该模型采用卷积神经网络,将读取信息转化为图像张量,确保准确性与一致性。

📊在基准测试中,DeepSomatic 的检测精度明显优于现有主流方法,尤其是在插入缺失的检测上。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

AI 模型 「炒股」 比拼!DeepSeek 收益超 14%,Gemini2.5Pro 惨亏四成

2025-10-22 1:20:58

AI 资讯

美团 LongCat 团队推出 VitaBench: 全新智能体评测基准

2025-10-22 1:21:16

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索