本数据库通过收集和整理最新科研文献信息而得,供了解领域前沿进展之用。数据源自 PubMed Data ,每日自动更新(使用关键词“['deep learning']”过滤),已收录文献数量参见 统计表格。表格内容由 GPT 自动整理,可能存在错误或遗漏,请使用时务必注意核实!
如有建议或合作意向,欢迎联系 linlin.yan(AT)bioinfo.app 或 微信 yanlinlin82。本项目遵循 MIT 许可 发布,欢迎下载 源码 自行修改使用。如觉得不错,还请不吝 给我打赏,你的支持是我继续创新的重要动力!


除通过在线浏览外,为方便用户离线查阅,本站也提供 付费下载(定价19.9元)。之所以考虑收费,是因为批量扫描这些文献并整理也是有一定成本的,还请理解并多多支持。本站数据会持续更新,而仅需一次付费,未来就可以随时重新下载到最新版本数据。
| 序号 | 推送日期 | 文章 | 类型 | 简述 | 创新点 | 不足 | 研究目的 | 研究对象 | 领域 | 病种 | 技术 | 模型 | 数据类型 | 样本量 | 算法框架 | 模型架构 | 性能指标 | 计算资源 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 5321 | 2026-02-02 |
LHAT-YOLO: Study on intelligent monitoring algorithm for helmets at construction sites
2026, PloS one
IF:2.9Q1
DOI:10.1371/journal.pone.0339993
PMID:41604405
|
研究论文 | 本研究提出了一种基于深度学习理论的土木工程施工现场头盔佩戴智能监测方法,通过改进YOLOv11模型构建了轻量化的LHAT-YOLO模型 | 使用GSConv改进YOLOv11的卷积模块,并添加了轻量级检测头FCD,在降低模型复杂度的同时保持了高精度 | NA | 实现土木工程施工现场头盔佩戴的高效、智能实时监测 | 施工现场工作人员的头盔佩戴情况 | 计算机视觉 | NA | 深度学习 | CNN | 图像 | 训练集19,780张图像,验证集2,473张图像,测试集2,473张图像 | NA | YOLOv11, LHAT-YOLO | Precision, Recall, mAP50, mAP50-95 | NA |
| 5322 | 2026-02-02 |
Functional fingerprinting for the developing brain using deep metric learning
2026, Imaging neuroscience (Cambridge, Mass.)
DOI:10.1162/IMAG.a.1112
PMID:41614047
|
研究论文 | 本文提出了一种名为Metric-BolT的深度学习框架,用于大脑功能指纹识别,并利用纵向神经影像数据刻画儿童期和青春早期的独特发育轨迹 | 开发了基于深度度量学习的新型大脑功能指纹识别框架,首次将大脑指纹与认知能力及遗传关联进行系统性关联分析 | 研究主要基于特定年龄段的纵向数据,未涵盖更广泛的生命周期或病理状态 | 通过大脑功能指纹识别技术探究个体神经发育的独特性及其与认知、遗传的关联 | 儿童期和青春早期个体的纵向神经影像数据 | 机器学习 | NA | 神经影像学 | 深度度量学习 | 神经影像数据 | 基于纵向神经影像数据的个体样本(具体数量未明确说明) | NA | Metric-BolT | 识别准确率 | NA |
| 5323 | 2026-02-02 |
PSoSOQY: A Deep Learning-Driven Singlet Oxygen Quantum Yield Prediction Platform for Expediting Photosensitizer Development
2026-Jan, ChemMedChem
IF:3.6Q2
DOI:10.1002/cmdc.202500766
PMID:41619309
|
研究论文 | 本研究开发了一个名为PSoSOQY的深度学习平台,用于预测光敏剂的单线态氧量子产率,以加速光动力疗法中光敏剂的开发 | 提出了结合双向长短期记忆网络和注意力机制的BA-SOQY预测模型,并引入了基于SMILES的子结构掩码解释策略,形成了集准确预测与可解释性于一体的综合平台 | 未明确提及模型在更大规模或更复杂分子数据集上的泛化能力限制,也未讨论计算资源需求 | 开发一个能够高效预测光敏剂单线态氧量子产率并加速光敏剂理性设计的平台 | 光敏剂分子 | 机器学习 | NA | NA | BiLSTM, 注意力机制 | 序列数据(SMILES字符串) | 未明确说明具体样本数量,但提及构建了综合数据集并在ESOL和FreeSolv数据集上进行了验证 | NA | BiLSTM + Attention | 相关系数R | NA |
| 5324 | 2026-02-02 |
Mitigating the Vanishing Gradient Problem Using a Pseudo-Normalizing Method
2025-Dec-31, Entropy (Basel, Switzerland)
DOI:10.3390/e28010057
PMID:41593963
|
研究论文 | 本文提出一种伪归一化方法,通过放大梯度来缓解深度神经网络中的梯度消失问题,并在图像分类任务中验证其有效性 | 引入伪归一化技术,通过定期除以均方根来放大梯度,避免梯度消失同时防止梯度爆炸,且发现网络主要利用图像轮廓信息进行分类 | 方法仅在双曲正切激活函数的图像分类网络中验证,未涉及其他激活函数或任务类型 | 解决深度神经网络训练中的梯度消失问题,提升训练稳定性和性能 | 深度神经网络及其训练过程 | 机器学习 | NA | 伪归一化方法 | 深度神经网络 | 图像 | NA | NA | NA | NA | NA |
| 5325 | 2026-02-02 |
Enhancing crayfish sex identification with Kolmogorov-Arnold networks and stacked autoencoders
2025-Dec-30, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-34095-z
PMID:41469793
|
研究论文 | 本研究利用传统机器学习和深度学习模型,对具有不平衡类别分布的表格和图像数据集进行小龙虾性别二分类,提出了一种基于堆叠自编码器的新架构,并验证了Kolmogorov-Arnold网络在分类任务中的有效性 | 提出了一种基于堆叠自编码器的新架构,用于增强特征提取,并首次将Kolmogorov-Arnold网络应用于小龙虾性别分类任务,展示了其在所有指标上的最佳性能 | 研究中使用的数据集存在类别不平衡问题,且部分模型在性能提升后出现下降,未详细讨论模型的可解释性或泛化能力到其他物种 | 提高小龙虾性别分类的准确性,以支持淡水生态系统的人口结构分析 | 小龙虾 | 机器学习 | NA | 图像组合、特征提取 | Kolmogorov-Arnold网络, 自编码器, 支持向量机, 多层感知器, 朴素贝叶斯 | 表格数据, 图像数据 | NA | NA | 堆叠自编码器 | 准确率 | NA |
| 5326 | 2026-02-02 |
Advancing Medical Decision-Making with AI: A Comprehensive Exploration of the Evolution from Convolutional Neural Networks to Capsule Networks
2025-Dec-30, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010017
PMID:41590902
|
综述 | 本文是一篇关于卷积神经网络(CNN)和胶囊网络(CapsNet)在医学图像分析中应用的文献综述,旨在通过比较两者来辅助医疗决策支持 | 对CNN和CapsNet在医学图像分析中的应用进行了结构化比较,并提出了未来可解释、高效混合深度学习系统的研究方向 | 作为一篇综述文章,其局限性在于主要基于2018年至2025年发表的文献进行分析,可能未涵盖最新进展 | 分析比较CNN和CapsNet在医学图像分析中的性能,以支持医疗决策 | 医学图像分析领域的深度学习架构 | 计算机视觉 | NA | NA | CNN, CapsNet | 图像 | 基于基准数据集BraTS、INbreast、ISIC和COVIDx | NA | 卷积神经网络, 胶囊网络 | NA | NA |
| 5327 | 2026-02-02 |
A painting art rendering system by deep learning framework and machine translation
2025-Dec-29, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-34058-4
PMID:41461861
|
研究论文 | 本研究提出了一种基于深度学习和机器翻译的绘画艺术渲染系统,旨在解决民族大学绘画教学中的技术传承、跨语言障碍和个性化不足等问题 | 提出了一个集“技术传承-风格渲染-文化解读-个性化指导”于一体的协作教学框架,并引入了改进的生成对抗网络和视觉上下文Transformer模块,实现了八种民族绘画风格的自动渲染和跨民族语言绘画术语的语义映射 | 未明确说明系统在更广泛绘画风格或语言中的泛化能力,以及计算资源需求的具体细节 | 开发一个集成系统,以促进民族绘画技术的数字保存和跨文化交流,提升绘画教学效果 | 民族绘画艺术作品和跨民族语言的绘画术语 | 计算机视觉, 自然语言处理 | NA | 深度学习, 机器翻译 | GAN, Transformer | 图像, 文本 | 包含12,000件艺术作品和5,000条术语条目的多模态数据集 | NA | 改进的生成对抗网络, 视觉上下文Transformer | F1分数, 语义匹配率 | NA |
| 5328 | 2026-02-02 |
An enhanced deep learning framework for intrusion classification enterprise network using multi-branch CNN-attention architecture
2025-Dec-29, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-34166-1
PMID:41461889
|
研究论文 | 本文提出了一种面向部署的企业网络入侵检测框架,结合了多分支CNN注意力架构与微调决策树分类器 | 提出了一种结合多分支CNN通道注意力机制与微调决策树分类器的部署导向型入侵检测框架,在保证高精度的同时提供可解释的规则,并展示了跨数据集的泛化能力 | NA | 开发一个高精度、可解释且适合实际部署的企业网络入侵检测系统 | 企业网络流量数据 | 机器学习 | NA | NA | CNN, 决策树 | 网络流量数据 | CIC-IDS2017数据集包含超过200万个带标签的网络流(80+个特征),NSL-KDD数据集包含125,000个连接记录(41个特征) | NA | 多分支CNN注意力架构 | 准确率, ROC-AUC, 宏F1分数 | NA |
| 5329 | 2026-02-02 |
Interpretable multimodal deep learning improves postoperative risk stratification in intrahepatic cholangiocarcinoma in multicentre cohorts
2025-Dec-29, NPJ digital medicine
IF:12.4Q1
DOI:10.1038/s41746-025-02282-x
PMID:41466129
|
研究论文 | 开发了一种基于Transformer的可解释多模态深度学习框架,用于肝内胆管癌患者的术后风险分层 | 首次将临床变量、影像组学特征和全切片病理图像通过预训练编码器与Transformer网络融合,并利用空间转录组学和蛋白质组学进行生物学验证,揭示了模型注意力机制与肿瘤侵袭性的关联 | 未明确说明模型在更广泛人群或不同医疗中心间的泛化能力,以及计算资源需求的具体细节 | 提高肝内胆管癌患者术后风险分层的准确性 | 肝内胆管癌患者 | 数字病理学 | 肝内胆管癌 | 空间转录组学, 空间蛋白质组学 | Transformer | 临床变量, 影像组学特征, 全切片病理图像 | 三个独立验证队列(具体样本数未提供) | NA | Transformer | AUC | NA |
| 5330 | 2026-02-02 |
Adaptive Normalization Enhances the Generalization of Deep Learning Model in Chest X-Ray Classification
2025-Dec-28, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010014
PMID:41590899
|
研究论文 | 本研究通过对比分析不同归一化方法,提出了一种自适应预处理流程,旨在提升深度学习模型在胸部X光分类中的泛化能力 | 提出了一种结合百分位ROI裁剪和直方图标准化的自适应预处理流程,并通过系统性基准测试验证其在多数据集和模型架构下的有效性 | 在采集异质性强的MIMIC-CXR数据集上性能提升有限 | 提升深度学习模型在胸部X光分类中的跨数据集鲁棒性和可靠性 | 胸部X光图像 | 计算机视觉 | NA | NA | CNN | 图像 | 四个公共胸部X光数据集 | NA | 三种卷积神经网络架构 | 准确率, F1分数 | NA |
| 5331 | 2026-02-02 |
Automated deep learning pipeline for callosal angle quantification
2025-Dec-27, Fluids and barriers of the CNS
IF:5.9Q1
DOI:10.1186/s12987-025-00750-w
PMID:41456015
|
研究论文 | 本文开发了一个全自动深度学习框架,用于从原始T1 MPRAGE扫描中量化胼胝体角,以辅助常压性脑积水的诊断 | 提出了一个结合BrainSignsNET进行关键解剖标志点检测和基于UNet的分割网络的全自动、鲁棒性框架,可直接从原始MRI扫描中测量胼胝体角,性能优于报告的人工观察者间变异性 | 未明确提及,但可能包括对特定MRI序列(T1 MPRAGE)的依赖以及需要进一步的外部验证 | 开发一个全自动、可靠的深度学习框架,用于量化胼胝体角,以改善常压性脑积水的早期检测和诊断 | 常压性脑积水患者的MRI扫描图像 | 数字病理学 | 常压性脑积水 | T1 MPRAGE MRI扫描 | 深度学习 | 3D MRI图像 | 训练和内部验证使用BLSA和BIOCARD数据集;外部验证使用来自约翰霍普金斯湾景医院和PENS试验的376个临床MRI扫描 | NA | BrainSignsNET, UNet with EfficientNetB0 encoder | 相关系数, 平均绝对误差 | NA |
| 5332 | 2026-02-02 |
A Hybrid Vision Transformer-BiRNN Architecture for Direct k-Space to Image Reconstruction in Accelerated MRI
2025-Dec-26, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010011
PMID:41590896
|
研究论文 | 提出了一种结合Vision Transformer和双向循环神经网络的混合双域深度学习架构,用于加速MRI中的k空间到图像的直接重建 | 首次将ViT自编码器与BiRNN结合,协同处理图像域和k空间域信息,直接利用k空间数据的序列特性来抑制混叠伪影 | 研究仅在神经MRI的回顾性欠采样数据上进行评估,未涉及其他解剖部位或前瞻性数据 | 解决加速MRI中因k空间欠采样导致的病态逆问题,实现高质量图像重建 | 加速磁共振成像(MRI)中的图像重建 | 计算机视觉 | NA | 磁共振成像(MRI) | Vision Transformer, BiRNN | 图像, k空间数据 | NA | NA | Vision Transformer autoencoder, BiRNN, UNet | NA | NA |
| 5333 | 2026-02-02 |
Accurate Segmentation of Vegetation in UAV Desert Imagery Using HSV-GLCM Features and SVM Classification
2025-Dec-25, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010009
PMID:41590895
|
研究论文 | 本文提出了一种结合HSV颜色空间和GLCM纹理特征,并采用SVM分类器的机器学习方法,用于无人机沙漠图像中植被的准确分割 | 结合HSV颜色空间与GLCM纹理特征,并采用SVM分类器,在具有挑战性的沙漠环境中实现了鲁棒的植被分割,显著优于传统光谱指数方法和现代深度学习基线 | 处理速度为每张图像25秒,训练时间28分钟,在强调处理速度的应用中可能受限 | 实现无人机沙漠图像中植被的准确分割,以支持精准农业应用 | 阿联酋沙漠农田的120张高分辨率无人机图像 | 计算机视觉 | NA | 无人机成像 | SVM | 图像 | 120张高分辨率无人机图像 | NA | NA | 准确率, 精确率, 召回率, F1分数, 交并比 | NA |
| 5334 | 2026-02-02 |
Empirical Mode Decomposition-Based Deep Learning Model Development for Medical Imaging: Feasibility Study for Gastrointestinal Endoscopic Image Classification
2025-Dec-22, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010004
PMID:41590889
|
研究论文 | 本研究提出了一种基于二维经验模态分解的深度学习框架,用于提升医学图像分类性能,并在胃肠道内窥镜图像分类任务中验证其有效性 | 将二维经验模态分解技术集成到深度学习流程中,通过分解图像为内在模态函数来增强图像特征,从而显著提高模型性能 | 仅使用公开的Kvasir数据集进行验证,未在其他医学图像领域或更大规模数据集上测试,且未详细讨论计算复杂度增加的问题 | 开发一种基于二维经验模态分解的深度学习模型,以提升多类图像分类任务的性能,并探索其在医疗影像中早期疾病检测的潜力 | 胃肠道内窥镜图像 | 计算机视觉 | 胃肠道疾病 | 二维经验模态分解 | CNN, Transformer | 图像 | Kvasir数据集,包含8类胃肠道图像,每类1000张,共8000张图像 | NA | ResNet152, VGG19bn, MobileNetV3L, SwinTransformerV2S | 准确率, F1分数, AUC | NA |
| 5335 | 2026-02-02 |
Development of a Multispectral Image Database in Visible-Near-Infrared for Demosaicking and Machine Learning Applications
2025-Dec-20, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010002
PMID:41590887
|
研究论文 | 本研究开发了一个可见光-近红外多光谱图像数据库,用于去马赛克技术和机器学习应用 | 利用基于滤光片阵列技术的高端多光谱相机,创建了一个包含高分辨率多光谱图像、标注图像和掩码的免费可访问数据库 | 数据库依赖于特定平台(PImRob)的相机技术,且多光谱相机技术相对较新,可用性有限 | 为多光谱图像的去马赛克技术、分割算法和深度学习研究提供数据支持 | 不同植物和杂草的多光谱图像 | 计算机视觉 | NA | 多光谱成像,滤光片阵列技术 | NA | 多光谱图像 | NA | NA | NA | NA | NA |
| 5336 | 2026-02-02 |
Deep learning-enabled accurate assessment of gait impairments in Parkinson's disease using smartphone videos
2025-Dec-13, NPJ digital medicine
IF:12.4Q1
DOI:10.1038/s41746-025-02150-8
PMID:41390840
|
研究论文 | 本文提出了一种基于深度学习的框架,利用智能手机录制的视频评估帕金森病患者的步态障碍 | 该框架能够以高精度预测帕金森病严重程度,并有效区分药物对步态障碍的综合疗效,特别是能够检测到超出统一帕金森病评定量表分辨率的药物诱导的细粒度步态变化 | 未在摘要中明确说明 | 评估帕金森病患者的步态障碍,并分析药物疗效 | 帕金森病患者的步态 | 计算机视觉 | 帕金森病 | 智能手机视频录制 | 深度学习 | 视频 | NA | NA | NA | AUC, F1分数, 精确度 | NA |
| 5337 | 2026-02-02 |
Artificial Intelligence in Medicine: Moving From "Prediction" to "Patient-Centric Decision Intelligence"
2025-Dec, Cureus
DOI:10.7759/cureus.100323
PMID:41613711
|
评论 | 本文讨论了人工智能在医疗领域从预测模型向以患者为中心的决策智能的转变 | 提出了从预测性AI向决策智能医疗系统(DIHS)的过渡,强调整合多模态患者数据以支持个性化临床决策 | 未提及具体实施案例或实证研究结果 | 推动人工智能在医疗中从预测功能转向支持个性化、可操作的临床决策 | 临床AI系统、多模态患者数据、决策智能医疗系统 | 机器学习 | NA | 多模态深度学习 | 深度学习平台 | 结构化数据、图像、自由文本临床记录、语音生物标志物、可穿戴传感器输出、社会健康决定因素、环境暴露、医生推理 | NA | NA | NA | NA | NA |
| 5338 | 2026-02-02 |
Autonomous Closed-Loop Control for Robotic Soft Tissue Electrosurgery Using RGB-D Image Guidance
2025-Aug, IEEE transactions on medical robotics and bionics
IF:3.4Q2
DOI:10.1109/tmrb.2025.3583169
PMID:41613948
|
研究论文 | 本文提出了一种利用RGB-D图像引导的自主闭环机器人软组织电外科手术系统,旨在通过三维组织跟踪和基于图像的反馈控制来提高手术精度 | 开发了一种结合基于深度学习的无标记跟踪模型(CoTracker)和工具遮挡算法的三维组织跟踪器,无需先验组织模型知识即可实现组织变形跟踪,并采用模糊逻辑控制器动态调整切割速度以最小化切割误差 | 研究仅在离体猪舌组织上进行验证,尚未在活体或临床环境中测试;样本量较小(闭环N=6,开环N=3) | 提高口腔癌电外科手术中肿瘤切除的精度和一致性,以减少癌症复发的可能性 | 口腔癌的肿瘤切除手术,具体使用离体猪舌组织作为实验对象 | 计算机视觉 | 口腔癌 | RGB-D(红绿蓝-深度)传感,电外科手术 | 深度学习模型 | RGB-D图像 | 离体猪舌组织,闭环操作6次,开环操作3次 | NA | CoTracker | 平均切割误差 | NA |
| 5339 | 2026-02-02 |
Fewer medullary pyramids in the living kidney donor are associated with graft failure in the recipient
2025-Jul, American journal of transplantation : official journal of the American Society of Transplantation and the American Society of Transplant Surgeons
IF:8.9Q1
DOI:10.1016/j.ajt.2025.01.041
PMID:39892790
|
研究论文 | 本研究通过CT和病理学分析,探讨了活体供肾的结构特征与受体移植肾失败之间的关联 | 首次将CT图像中的肾髓质金字塔数量作为预测移植肾失败的生物标志物,并结合深度学习模型进行量化分析 | 研究为回顾性分析,可能受限于样本选择和随访时间,且未考虑所有潜在混杂因素 | 识别与活体供肾受体移植肾失败相关的肾实质结构特征 | 活体供肾移植的受体及其捐赠的肾脏 | 数字病理学 | 肾脏疾病 | CT成像,组织形态学分析 | 深度学习模型 | CT图像,组织切片 | 3098名受体,随访中位数为5年,包含346例移植肾失败事件 | NA | NA | 移植肾失败发生率(每100人年),估计肾小球滤过率 | NA |
| 5340 | 2026-02-02 |
Neural Spectral Prediction for Structure Elucidation with Tandem Mass Spectrometry
2025-Jun-01, bioRxiv : the preprint server for biology
DOI:10.1101/2025.05.28.656653
PMID:40501725
|
研究论文 | 提出了一种名为ICEBERG的几何深度学习模型,用于模拟质谱中的碰撞诱导解离,以生成化学上合理的碎片及其相对强度,并利用其预测通过比对候选结构的预测MS/MS谱与实验MS/MS谱的相似性来促进结构解析 | 开发了首个能够模拟碰撞诱导解离并考虑碰撞能量和极性的几何深度学习模型,实现了对未知分子结构的快速、低成本鉴定 | 未明确说明模型在处理极端复杂混合物或非常规分子结构时的性能限制 | 解决代谢组学、药物发现和反应筛选中区分同量异位素分子碎片模式的挑战,实现快速分子注释 | 未知分子结构、候选化学结构 | 机器学习 | 抑郁症、结核性脑膜炎 | 串联质谱(MS/MS) | 几何深度学习模型 | 质谱数据 | NIST'20 [M+H]加合子集 | NA | ICEBERG | top-1准确率, top-10预测准确率 | NA |