本数据库通过收集和整理最新科研文献信息而得,供了解领域前沿进展之用。数据源自 PubMed Data ,每日自动更新(使用关键词“['deep learning']”过滤),已收录文献数量参见 统计表格。表格内容由 GPT 自动整理,可能存在错误或遗漏,请使用时务必注意核实!
如有建议或合作意向,欢迎联系 linlin.yan(AT)bioinfo.app 或 微信 yanlinlin82。本项目遵循 MIT 许可 发布,欢迎下载 源码 自行修改使用。如觉得不错,还请不吝 给我打赏,你的支持是我继续创新的重要动力!


除通过在线浏览外,为方便用户离线查阅,本站也提供 付费下载(定价19.9元)。之所以考虑收费,是因为批量扫描这些文献并整理也是有一定成本的,还请理解并多多支持。本站数据会持续更新,而仅需一次付费,未来就可以随时重新下载到最新版本数据。
| 序号 | 推送日期 | 文章 | 类型 | 简述 | 创新点 | 不足 | 研究目的 | 研究对象 | 领域 | 病种 | 技术 | 模型 | 数据类型 | 样本量 | 算法框架 | 模型架构 | 性能指标 | 计算资源 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 6601 | 2026-03-30 |
DNA data storage for biomedical images using HELIX
2025-05, Nature computational science
IF:12.0Q1
DOI:10.1038/s43588-025-00793-x
PMID:40360759
|
研究论文 | 本文提出了一种名为HELIX的基于DNA的生物医学图像存储系统,旨在解决生物医学图像大规模长期存储的需求 | HELIX系统针对生物医学图像特性设计了专用压缩算法,并引入了无需索引的错误校正编码,同时结合深度学习进行图像修复,提高了存储密度和解码速度 | 仅通过体外实验存储了两幅时空基因组学图像进行验证,样本规模较小,未涉及更广泛的生物医学图像类型 | 开发适用于生物医学图像的DNA数据存储系统 | 生物医学图像,特别是时空基因组学图像 | 数字病理学 | NA | DNA数据存储,深度测序 | 深度学习 | 图像 | 两幅时空基因组学图像 | NA | NA | 图像质量(97.20%),测序深度(7×覆盖度) | NA |
| 6602 | 2026-03-30 |
Comprehensive prediction and analysis of human protein essentiality based on a pretrained large language model
2025-03, Nature computational science
IF:12.0Q1
DOI:10.1038/s43588-024-00733-1
PMID:39604646
|
研究论文 | 本研究开发了一个基于序列的深度学习模型PIC,通过微调预训练蛋白质语言模型,全面预测和分析人类蛋白质必需性 | PIC模型不仅显著优于现有方法预测人类必需蛋白质,还能提供跨人类、细胞系和小鼠三个层次的全面预测结果,并定义了蛋白质必需性评分以量化人类蛋白质必需性 | NA | 开发计算模型以预测人类必需蛋白质,并量化蛋白质必需性 | 人类蛋白质,包括617,462个人类微蛋白质 | 自然语言处理 | 乳腺癌 | 深度学习,预训练蛋白质语言模型 | 深度学习模型 | 蛋白质序列 | 617,462个人类微蛋白质 | NA | 预训练蛋白质语言模型 | NA | NA |
| 6603 | 2026-03-30 |
Leveraging pharmacovigilance data to predict population-scale toxicity profiles of checkpoint inhibitor immunotherapy
2025-03, Nature computational science
IF:12.0Q1
DOI:10.1038/s43588-024-00748-8
PMID:39715829
|
研究论文 | 本研究提出了一种名为DySPred的动态图卷积网络深度学习框架,利用大规模真实世界药物警戒数据来预测免疫检查点抑制剂在人群水平的毒性谱 | 引入动态图卷积网络来映射和预测免疫检查点抑制剂的毒性谱,能够准确预测不同人口队列和癌症类型的毒性风险,并在小样本场景中表现出韧性,同时揭示毒性随时间变化的趋势 | NA | 预测免疫检查点抑制剂在人群水平的毒性谱,以支持主动毒性监测和及时调整治疗与干预策略 | 免疫检查点抑制剂疗法及其诱导的毒性 | 机器学习 | 癌症 | 药物警戒数据分析 | 动态图卷积网络 | 药物警戒数据 | 大规模真实世界数据 | NA | 动态图卷积网络 | NA | NA |
| 6604 | 2026-03-30 |
Deep learning large-scale drug discovery and repurposing
2024-08, Nature computational science
IF:12.0Q1
DOI:10.1038/s43588-024-00679-4
PMID:39169261
|
研究论文 | 本文提出了一种基于线粒体表型变化进行药物作用机制识别的方法,并开发了名为MitoReID的深度学习模型 | 利用时间分辨的线粒体成像数据,首次将重识别框架应用于药物作用机制识别,为大规模药物发现和再利用提供了自动化、低成本的新途径 | 模型仅基于线粒体表型变化进行识别,可能无法覆盖所有药物作用机制;测试集仅包含6种未训练药物的验证 | 开发一种自动化、高通量的药物作用机制识别方法,以加速大规模药物发现和再利用 | 美国食品药品监督管理局批准的1,068种药物及其处理的细胞 | 计算机视觉 | NA | 时间分辨线粒体成像 | CNN | 图像 | 570,096张单细胞图像,覆盖1,068种药物 | NA | Inflated 3D ResNet | Rank-1准确率, 平均精度均值 | NA |
| 6605 | 2026-03-30 |
Discrete latent embedding of single-cell chromatin accessibility sequencing data for uncovering cell heterogeneity
2024-05, Nature computational science
IF:12.0Q1
DOI:10.1038/s43588-024-00625-4
PMID:38730185
|
研究论文 | 本文提出了一种基于向量量化变分自编码器的深度生成模型CASTLE,用于从单细胞染色质可及性测序数据中提取离散潜在嵌入,以揭示细胞异质性 | CASTLE模型采用离散潜在嵌入,克服了传统变分自编码器中高斯假设与真实数据不符的局限性,并能有效整合大规模参考数据集信息 | 未明确说明模型在处理极稀疏数据或特定细胞类型时的具体限制 | 开发一种深度生成模型,以改善单细胞表观基因组数据的下游分析,特别是细胞类型识别和可视化 | 单细胞染色质可及性测序数据 | 机器学习 | NA | 单细胞染色质可及性测序 | 变分自编码器, 深度生成模型 | 表观基因组数据 | NA | NA | 向量量化变分自编码器 | 细胞类型识别准确性, 可视化合理性 | NA |
| 6606 | 2026-03-30 |
Automated discovery of symbolic laws governing skill acquisition from naturally occurring data
2024-05, Nature computational science
IF:12.0Q1
DOI:10.1038/s43588-024-00629-0
PMID:38811819
|
研究论文 | 本文提出了一种两阶段算法,从大规模训练日志数据中自动发现技能习得的符号定律 | 开发了一种结合深度学习与符号回归的两阶段算法,以解决认知状态不可观测和搜索空间爆炸问题,并发现了两种新的技能习得定律形式 | 未明确说明算法在噪声范围外的泛化能力,且可能依赖于特定数据源(如Lumosity) | 从自然发生的大规模数据中挖掘技能学习的普遍定律 | 技能习得过程,特别是从训练日志数据中提取的认知状态与学习规律 | 机器学习 | NA | 深度学习,符号回归 | 深度学习模型,符号回归算法 | 训练日志数据 | 大规模Lumosity训练数据(具体数量未提供) | NA | NA | 拟合度 | NA |
| 6607 | 2026-03-30 |
Discovery of novel TACE inhibitors using graph convolutional network, molecular docking, molecular dynamics simulation, and Biological evaluation
2024, PloS one
IF:2.9Q1
DOI:10.1371/journal.pone.0315245
PMID:39729480
|
研究论文 | 本研究采用集成深度学习模型结合传统药物筛选方法,从FDA批准药物库中筛选出新型TACE抑制剂,并通过分子对接、分子动力学模拟和生物学评估验证了Vorinostat的抑制潜力 | 首次将图卷积网络(GCN)模型应用于TACE抑制剂的虚拟筛选,并结合分子对接、动力学模拟和细胞实验进行多维度验证,成功将抗癌药物Vorinostat重新定位为潜在的抗炎靶点抑制剂 | 研究仅使用DUD-E数据库的参考数据集,可能未覆盖所有TACE相关化合物;生物学验证仅在RAW 264.7细胞系中进行,缺乏体内实验数据 | 开发一种基于深度学习的药物重定位方法,以发现针对TACE(TNF-α转换酶)的新型抑制剂 | FDA批准药物库中的化合物,重点关注TACE(ADAM17)酶及其抑制剂 | 机器学习 | 类风湿关节炎 | 分子对接、分子动力学模拟、细胞生物学评估 | 图卷积网络(GCN) | 分子结构数据(化学信息学特征) | DUD-E数据库中TACE特异性活性化合物和诱饵化合物数据集,以及FDA批准药物库 | DeepChem, RDKit | GraphConvMol | NA | NA |
| 6608 | 2026-03-30 |
Using sequences of life-events to predict human lives
2024-01, Nature computational science
IF:12.0Q1
DOI:10.1038/s43588-023-00573-5
PMID:38177491
|
研究论文 | 本文通过将人类生活事件序列类比为语言结构,利用自然语言处理技术预测人类生活轨迹,包括早期死亡率和个性特征等多样结果 | 首次将人类生活事件序列表示为类似语言的结构,并应用NLP技术进行生活轨迹预测,在多个预测任务上大幅超越现有最优模型 | 研究基于丹麦的登记数据集,可能受限于特定文化和社会制度,泛化性需进一步验证 | 探索人类生活事件的演变规律和可预测性,开发个性化干预的可能性 | 丹麦多年人口登记数据中的个体生活事件序列 | 自然语言处理 | NA | 自然语言处理技术,事件序列嵌入 | 深度学习模型 | 结构化事件序列数据 | 丹麦多年全国人口登记数据集 | NA | NA | NA | NA |
| 6609 | 2026-03-30 |
Unbiased organism-agnostic and highly sensitive signal peptide predictor with deep protein language model
2024-01, Nature computational science
IF:12.0Q1
DOI:10.1038/s43588-023-00576-2
PMID:38177492
|
研究论文 | 本文介绍了一种基于深度学习的新型信号肽预测方法USPNet,用于解决信号肽分类和切割位点预测问题 | USPNet是一种无偏且不依赖物种信息的信号肽预测器,通过深度蛋白质语言模型处理极端数据不平衡问题,无需额外蛋白质组信息 | NA | 开发一种高灵敏度、无偏的信号肽预测工具,以改进信号肽的识别和发现 | 信号肽(SPs)及其在跨膜和分泌蛋白定位中的作用 | 自然语言处理 | NA | 深度学习,蛋白质语言模型 | 深度学习模型 | 原始氨基酸序列 | NA | NA | USPNet | 分类性能提升10%,序列一致性,模板建模分数 | NA |
| 6610 | 2026-03-29 |
Dual-channel self-supervised multi-task learning for spectral detection of soluble solids content and firmness in Korla fragrant pears
2026-Jul-05, Spectrochimica acta. Part A, Molecular and biomolecular spectroscopy
DOI:10.1016/j.saa.2026.127684
PMID:41797164
|
研究论文 | 本研究提出了一种结合多源光谱数据、自监督学习和多任务学习的深度学习框架,用于库尔勒香梨的可溶性固形物含量和硬度的光谱检测 | 提出了一种结合多源光谱数据、自监督学习和多任务学习的深度学习框架,以降低水果品质检测中标记数据的成本,并提高小样本情况下的预测性能 | NA | 提高库尔勒香梨可溶性固形物含量和硬度的光谱检测性能,并降低对标记数据的依赖 | 库尔勒香梨 | 机器学习 | NA | 可见光/近红外和近红外光谱数据采集 | CNN | 光谱数据 | 仅使用700个样本进行训练 | NA | 卷积神经网络 | 预测相关系数, 均方根误差 | NA |
| 6611 | 2026-03-29 |
Development and validation of a deep learning markerless system for lower-limb kinematics in hip and knee osteoarthritis population
2026-May, Journal of biomechanics
IF:2.4Q3
DOI:10.1016/j.jbiomech.2026.113238
PMID:41793837
|
研究论文 | 本研究开发并验证了一种用于髋膝骨关节炎患者下肢运动学的四摄像头无标记系统 | 使用患者数据集开发无标记系统,而非健康人群数据,提高了在患者群体中的泛化能力 | 横断面和额状面的关节角度波形ICC较低(分别为0.50和0.34),表明在这些平面上的预测精度有待提升 | 开发并验证适用于骨关节炎患者的下肢运动学无标记测量系统 | 髋或膝骨关节炎患者 | 计算机视觉 | 骨关节炎 | 深度学习 | NA | 视频 | 150名患者(训练集120人,测试集30人) | NA | NA | 均方根误差, 组内相关系数 | NA |
| 6612 | 2026-03-29 |
Efficient Vision Mamba for MRI Super-Resolution via Hybrid Selective Scanning
2026-Mar-07, ArXiv
PMID:41479458
|
研究论文 | 本研究提出了一种基于多头选择性状态空间模型和轻量级通道多层感知器的高效MRI超分辨率框架,旨在提升图像分辨率的同时保持低计算开销 | 提出了一种结合多头选择性状态空间模型、深度卷积和门控通道混合的MambaFormer块,并采用混合扫描策略来捕获长程依赖关系,在保持高精度的同时显著降低了模型参数和计算量 | 研究仅在脑部和前列腺两个特定MRI数据集上进行验证,未涵盖更多解剖部位或成像模态,且临床实际工作流集成效果有待进一步评估 | 开发一种高效且准确的深度学习框架,用于MRI超分辨率,以在临床工作流中实现高保真图像重建 | 7T脑部T1 MP2RAGE图像(142名受试者)和1.5T前列腺T2加权MRI图像(334名受试者) | 计算机视觉 | NA | MRI | 基于Mamba的状态空间模型 | 医学图像 | 脑部数据集142名受试者,前列腺数据集334名受试者 | NA | MambaFormer, 多头选择性状态空间模型, 轻量级通道多层感知器 | 结构相似性, 峰值信噪比, 学习感知图像块相似度, 梯度幅度相似性偏差 | NA |
| 6613 | 2026-03-29 |
Regulatory grammar in human promoters uncovered by MPRA-based deep learning
2026-Mar, Nature
IF:50.5Q1
DOI:10.1038/s41586-025-10093-z
PMID:41639451
|
研究论文 | 本研究提出了一种基于MPRA数据的深度学习模型PARM,用于从DNA序列预测人类启动子活性并揭示其调控语法 | 开发了轻量级细胞类型特异性深度学习模型PARM,仅从DNA序列即可可靠预测全基因组自主启动子活性,并能设计纯合成强启动子 | 未明确说明模型在不同细胞类型间的泛化能力及对非编码变异的解释局限性 | 构建从调控元件序列准确预测全基因组基因表达的计算模型 | 人类启动子序列 | 计算生物学 | NA | 大规模平行报告基因检测(MPRA) | 深度学习模型 | DNA序列数据 | NA | NA | PARM | NA | NA |
| 6614 | 2026-03-29 |
NeuroMDAVIS: Visualization of Single-Cell Multi-Omics Data under Deep Learning Framework
2026-Mar, Journal of computational biology : a journal of computational molecular cell biology
IF:1.4Q2
DOI:10.1177/15578666261423965
PMID:41744270
|
研究论文 | 本文提出了一种名为NeuroMDAVIS的新型无监督深度神经网络模型,用于单细胞多组学数据的联合可视化 | NeuroMDAVIS是首个为多模态生物数据集提供联合可视化能力的模型,能够同时捕获模态特定信息和跨模态共同信息 | 未在摘要中明确提及 | 解决单细胞多组学数据的高维可视化挑战,实现数据的降维和联合可视化 | 单细胞多组学数据 | 机器学习 | NA | 单细胞技术 | 深度神经网络 | 多组学数据 | NA | NA | NA | 准确率, 精确率, 召回率, F1分数, 聚类有效性指数 | NA |
| 6615 | 2026-03-29 |
DP-OTG: A Feature-Free Deep Learning Model for Accurate Prediction of Human O-Linked Threonine Glycosylation Sites
2026-Mar, Journal of computational biology : a journal of computational molecular cell biology
IF:1.4Q2
DOI:10.1177/15578666261424278
PMID:41762162
|
研究论文 | 本研究提出了一种名为DP-OTG的免特征深度学习模型,用于准确预测人类蛋白质O-连接苏氨酸糖基化位点 | 提出了一种免特征、端到端的深度学习框架,无需手动特征工程,通过混合架构自动从原始蛋白质序列中学习序列模式 | 未明确说明模型在跨物种预测或处理极低丰度糖基化位点方面的泛化能力 | 开发一种高效的计算工具来预测人类蛋白质O-连接苏氨酸糖基化位点,以替代昂贵且耗时的实验检测方法 | 人类蛋白质序列及其O-连接苏氨酸糖基化位点 | 生物信息学 | 癌症, 神经系统疾病 | 深度学习 | CNN, BiLSTM | 蛋白质序列(文本数据) | 未明确说明具体样本数量,但使用了平衡和不平衡测试集进行验证 | 未明确说明,但代码已开源 | 多核卷积神经网络, 双向长短期记忆网络, 可训练嵌入层 | 准确率, 马修斯相关系数 | 未明确说明 |
| 6616 | 2026-03-29 |
Artificial intelligence in preterm birth prediction: a narrative review of current approaches and clinical applicability
2026-Mar, Obstetrics & gynecology science
IF:2.0Q2
DOI:10.5468/ogs.26043
PMID:41775248
|
综述 | 本文是一篇关于人工智能在早产预测中应用现状、方法学质量及临床适用性的叙述性综述 | 系统性地评估了不同数据模态下AI预测早产的方法学质量和临床适用性,并指出了当前研究在方法学严谨性上的普遍不足 | 综述本身不产生新数据,且指出纳入的研究普遍存在样本量不足、缺乏外部验证、未报告校准指标以及高偏倚风险等局限性 | 评估人工智能在早产预测领域的应用现状、方法学质量及临床适用性 | 用于预测自发性早产的机器学习模型及相关研究 | 机器学习 | 早产 | 电子健康记录分析、超声图像分析、宫颈纹理和影像组学特征提取、弹性成像参数、多组学整合 | 深度学习, Transformer | 电子健康记录, 超声图像, 多组学数据 | NA | NA | Transformer | 受试者工作特征曲线下面积 | NA |
| 6617 | 2026-03-29 |
Parameter Estimation from Phylogenetic Trees Using Neural Networks and Ensemble Learning
2026-Feb-25, Systematic biology
IF:6.1Q1
DOI:10.1093/sysbio/syaf060
PMID:40899780
|
研究论文 | 本文提出了一种新的集成神经网络方法,用于从系统发育树中估计物种多样化参数 | 利用多种神经网络(密集神经网络、图神经网络和长短期记忆循环网络)的集成方法,同时从系统发育树的图表示、分支时间和汇总统计中学习,提高了参数估计的效率和准确性 | 与最大似然估计方法类似,该方法在延展的出生-死亡过程下仍无法精确恢复参数 | 估计物种多样化参数,包括物种形成和灭绝速率 | 时间校准的系统发育树 | 机器学习 | NA | 深度学习 | DNN, GNN, LSTM | 图数据、时间序列数据、汇总统计数据 | NA | NA | 密集神经网络、图神经网络、长短期记忆循环网络 | 估计速度、偏差、对树大小的敏感性 | NA |
| 6618 | 2026-03-29 |
Deep models of protein evolution in time generate realistic evolutionary trajectories and functional proteins
2026-Feb-20, bioRxiv : the preprint server for biology
DOI:10.64898/2026.02.19.706898
PMID:41757065
|
研究论文 | 本文介绍了一种名为PEINT的深度学习框架,用于模拟蛋白质序列随时间演变的过程,并生成具有功能性的蛋白质 | PEINT框架突破了传统模型中位点独立演化的简化假设,能够学习位点间复杂相互作用,直接从原始序列学习插入缺失动态,并准确模拟自然进化特征 | NA | 开发一个能够模拟蛋白质真实进化轨迹并生成功能性蛋白质的深度学习模型 | 蛋白质序列及其进化过程 | 机器学习 | NA | 深度学习 | 深度学习模型 | 蛋白质序列数据 | 数百万个跨越不同折叠家族的蛋白质序列 | NA | NA | NA | NA |
| 6619 | 2026-03-29 |
Deep learning-based battery health prediction for enhancing electric vehicle performance
2026-Feb-19, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-026-39911-8
PMID:41714349
|
研究论文 | 本研究提出了一种混合深度学习框架,用于智能电动汽车电池健康诊断,以提高电池诊断的可靠性和可持续性 | 提出了一种集成了1D-CNN、TCN、LSTM层和注意力机制的混合深度学习框架,用于电池健康状态预测,在精度、推理延迟和能耗方面均优于传统基线模型 | 未明确提及 | 通过智能电池健康诊断,提升电动汽车性能,并支持可持续发展目标7(经济适用的清洁能源) | 电动汽车电池的健康状态 | 机器学习 | NA | 差分电压分析、差分电流分析、增量容量分析 | CNN, LSTM, TCN | 电池充放电循环数据 | 来自NASA PCoE、牛津和CALCE电池退化数据集的超过10,000个充放电循环 | NA | 1D-CNN, TCN, LSTM | 准确率, RMSE | NA |
| 6620 | 2026-03-29 |
AI accelerate the identification of druggable targets by 3D structures of proteins and compounds
2026-Feb-14, NPJ precision oncology
IF:6.8Q1
DOI:10.1038/s41698-026-01310-7
PMID:41691035
|
综述 | 本文综述了人工智能在肿瘤药物开发中的应用,特别是在靶点识别、虚拟筛选和从头分子设计方面的进展 | 系统性地总结了AI如何通过预测蛋白质三维结构、评估靶点成药性、加速虚拟筛选和从头药物设计来革新肿瘤药物开发流程 | 讨论了AI药物开发面临的主要挑战,包括数据质量、模型可解释性、计算资源限制以及伦理和监管问题 | 概述人工智能技术在加速肿瘤药物开发,特别是靶点识别和化合物筛选方面的应用与挑战 | 蛋白质三维结构、化合物库、药物-靶点相互作用、分子性质 | 机器学习 | 肿瘤 | 机器学习,深度学习 | 神经网络 | 分子结构数据,蛋白质结构数据,化学库数据 | NA | NA | NA | NA | NA |