本数据库通过收集和整理最新科研文献信息而得,供了解领域前沿进展之用。数据源自 PubMed Data ,每日自动更新(使用关键词“['deep learning']”过滤),已收录文献数量参见 统计表格。表格内容由 GPT 自动整理,可能存在错误或遗漏,请使用时务必注意核实!
如有建议或合作意向,欢迎联系 linlin.yan(AT)bioinfo.app 或 微信 yanlinlin82。本项目遵循 MIT 许可 发布,欢迎下载 源码 自行修改使用。如觉得不错,还请不吝 给我打赏,你的支持是我继续创新的重要动力!


除通过在线浏览外,为方便用户离线查阅,本站也提供 付费下载(定价19.9元)。之所以考虑收费,是因为批量扫描这些文献并整理也是有一定成本的,还请理解并多多支持。本站数据会持续更新,而仅需一次付费,未来就可以随时重新下载到最新版本数据。
| 序号 | 推送日期 | 文章 | 类型 | 简述 | 创新点 | 不足 | 研究目的 | 研究对象 | 领域 | 病种 | 技术 | 模型 | 数据类型 | 样本量 | 算法框架 | 模型架构 | 性能指标 | 计算资源 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1481 | 2026-02-02 |
Direct deep learning analysis of three-dimensional automated breast ultrasound videos with reading mode optimization for breast cancer diagnosis
2026-Jan, Ultrasonography (Seoul, Korea)
DOI:10.14366/usg.25096
PMID:41566994
|
研究论文 | 本研究开发并评估了一种直接分析三维自动乳腺超声视频的深度学习模型,以辅助乳腺癌诊断,并探讨了临床实施中的最佳阅片模式 | 首次提出直接分析三维自动乳腺超声视频的深度学习模型,无需图像选择或手动标注,并比较了不同阅片模式对诊断性能和工作效率的影响 | 回顾性研究设计,样本量相对有限(547名患者),未在外部验证集上测试模型泛化能力 | 开发并评估用于乳腺癌诊断的深度学习模型,优化临床阅片工作流程 | 乳腺癌患者的三维自动乳腺超声视频数据 | 计算机视觉 | 乳腺癌 | 三维自动乳腺超声 | CNN | 视频 | 547名患者(285例良性,262例恶性),训练集437例,测试集110例 | NA | ResNet50 | AUC, 敏感性, 特异性 | NA |
| 1482 | 2026-02-02 |
A predicted structural interactome reveals binding interference from intrinsically disordered regions
2026-Jan, PLoS computational biology
IF:3.8Q1
DOI:10.1371/journal.pcbi.1013899
PMID:41570036
|
研究论文 | 本研究利用AlphaFold2 Multimer预测了果蝇中的蛋白质-蛋白质相互作用,并强调了内在无序区域在预测高置信度相互作用中的重要性 | 结合物理和功能数据集,通过深度学习预测果蝇蛋白质相互作用,并首次系统分析内在无序区域在其中的作用 | 研究主要基于预测模型,缺乏实验验证,且仅限于果蝇物种 | 预测果蝇中的蛋白质-蛋白质相互作用,并探究内在无序区域在相互作用中的角色 | 果蝇的蛋白质相互作用网络 | 机器学习 | NA | AlphaFold2 Multimer | 深度学习模型 | 蛋白质序列和结构数据 | NA | AlphaFold2 | AlphaFold2 Multimer | 高置信度预测 | NA |
| 1483 | 2026-02-02 |
Object Detection on Road: Vehicle's Detection Based on Re-Training Models on NVIDIA-Jetson Platform
2026-Jan-01, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010020
PMID:41590905
|
研究论文 | 本研究基于NVIDIA Jetson平台,通过重新训练SSD模型,在利马城市交通视频数据上实现车辆检测,旨在优化嵌入式系统在拥堵环境中的准确性与计算负载平衡 | 在NVIDIA Jetson Orin NX平台上对比训练三种SSD模型(MobileNetV1-SSD、MobileNetV2-SSD-Lite、VGG16-SSD),并通过对比度调整的数据增强方法提升少数类别(如Tuk-tuk和摩托车)的检测性能,为拥堵城市环境中的ADAS嵌入式系统提供最佳精度与计算负载平衡方案 | 研究仅基于利马城市的交通视频数据,可能缺乏对其他城市或交通环境的泛化能力;手动标注过程可能引入主观误差;未详细探讨模型在实时部署中的延迟或功耗表现 | 在计算成本和响应时间受限的嵌入式设备上,通过深度学习技术优化车辆检测模型,以应对高交通拥堵的城市场景 | 利马城市交通视频中的车辆,包括Tuk-tuk、摩托车等少数类别 | 计算机视觉 | NA | 深度学习,数据增强(对比度调整) | SSD | 视频 | 从利马城市交通视频中采集并手动标注的数据集(具体数量未在摘要中说明) | TensorFlow, PyTorch(摘要未明确指定,但基于常见实践推测可能使用其中之一或类似框架) | MobileNetV1-SSD, MobileNetV2-SSD-Lite, VGG16-SSD | 平均精度(mAP) | NVIDIA Jetson Orin NX 16 GB平台 |
| 1484 | 2026-02-02 |
LHAT-YOLO: Study on intelligent monitoring algorithm for helmets at construction sites
2026, PloS one
IF:2.9Q1
DOI:10.1371/journal.pone.0339993
PMID:41604405
|
研究论文 | 本研究提出了一种基于深度学习理论的土木工程施工现场头盔佩戴智能监测方法,通过改进YOLOv11模型构建了轻量化的LHAT-YOLO模型 | 使用GSConv改进YOLOv11的卷积模块,并添加了轻量级检测头FCD,在降低模型复杂度的同时保持了高精度 | NA | 实现土木工程施工现场头盔佩戴的高效、智能实时监测 | 施工现场工作人员的头盔佩戴情况 | 计算机视觉 | NA | 深度学习 | CNN | 图像 | 训练集19,780张图像,验证集2,473张图像,测试集2,473张图像 | NA | YOLOv11, LHAT-YOLO | Precision, Recall, mAP50, mAP50-95 | NA |
| 1485 | 2026-02-02 |
Functional fingerprinting for the developing brain using deep metric learning
2026, Imaging neuroscience (Cambridge, Mass.)
DOI:10.1162/IMAG.a.1112
PMID:41614047
|
研究论文 | 本文提出了一种名为Metric-BolT的深度学习框架,用于大脑功能指纹识别,并利用纵向神经影像数据刻画儿童期和青春早期的独特发育轨迹 | 开发了基于深度度量学习的新型大脑功能指纹识别框架,首次将大脑指纹与认知能力及遗传关联进行系统性关联分析 | 研究主要基于特定年龄段的纵向数据,未涵盖更广泛的生命周期或病理状态 | 通过大脑功能指纹识别技术探究个体神经发育的独特性及其与认知、遗传的关联 | 儿童期和青春早期个体的纵向神经影像数据 | 机器学习 | NA | 神经影像学 | 深度度量学习 | 神经影像数据 | 基于纵向神经影像数据的个体样本(具体数量未明确说明) | NA | Metric-BolT | 识别准确率 | NA |
| 1486 | 2026-02-02 |
PSoSOQY: A Deep Learning-Driven Singlet Oxygen Quantum Yield Prediction Platform for Expediting Photosensitizer Development
2026-Jan, ChemMedChem
IF:3.6Q2
DOI:10.1002/cmdc.202500766
PMID:41619309
|
研究论文 | 本研究开发了一个名为PSoSOQY的深度学习平台,用于预测光敏剂的单线态氧量子产率,以加速光动力疗法中光敏剂的开发 | 提出了结合双向长短期记忆网络和注意力机制的BA-SOQY预测模型,并引入了基于SMILES的子结构掩码解释策略,形成了集准确预测与可解释性于一体的综合平台 | 未明确提及模型在更大规模或更复杂分子数据集上的泛化能力限制,也未讨论计算资源需求 | 开发一个能够高效预测光敏剂单线态氧量子产率并加速光敏剂理性设计的平台 | 光敏剂分子 | 机器学习 | NA | NA | BiLSTM, 注意力机制 | 序列数据(SMILES字符串) | 未明确说明具体样本数量,但提及构建了综合数据集并在ESOL和FreeSolv数据集上进行了验证 | NA | BiLSTM + Attention | 相关系数R | NA |
| 1487 | 2026-02-02 |
Mitigating the Vanishing Gradient Problem Using a Pseudo-Normalizing Method
2025-Dec-31, Entropy (Basel, Switzerland)
DOI:10.3390/e28010057
PMID:41593963
|
研究论文 | 本文提出一种伪归一化方法,通过放大梯度来缓解深度神经网络中的梯度消失问题,并在图像分类任务中验证其有效性 | 引入伪归一化技术,通过定期除以均方根来放大梯度,避免梯度消失同时防止梯度爆炸,且发现网络主要利用图像轮廓信息进行分类 | 方法仅在双曲正切激活函数的图像分类网络中验证,未涉及其他激活函数或任务类型 | 解决深度神经网络训练中的梯度消失问题,提升训练稳定性和性能 | 深度神经网络及其训练过程 | 机器学习 | NA | 伪归一化方法 | 深度神经网络 | 图像 | NA | NA | NA | NA | NA |
| 1488 | 2026-02-02 |
Enhancing crayfish sex identification with Kolmogorov-Arnold networks and stacked autoencoders
2025-Dec-30, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-34095-z
PMID:41469793
|
研究论文 | 本研究利用传统机器学习和深度学习模型,对具有不平衡类别分布的表格和图像数据集进行小龙虾性别二分类,提出了一种基于堆叠自编码器的新架构,并验证了Kolmogorov-Arnold网络在分类任务中的有效性 | 提出了一种基于堆叠自编码器的新架构,用于增强特征提取,并首次将Kolmogorov-Arnold网络应用于小龙虾性别分类任务,展示了其在所有指标上的最佳性能 | 研究中使用的数据集存在类别不平衡问题,且部分模型在性能提升后出现下降,未详细讨论模型的可解释性或泛化能力到其他物种 | 提高小龙虾性别分类的准确性,以支持淡水生态系统的人口结构分析 | 小龙虾 | 机器学习 | NA | 图像组合、特征提取 | Kolmogorov-Arnold网络, 自编码器, 支持向量机, 多层感知器, 朴素贝叶斯 | 表格数据, 图像数据 | NA | NA | 堆叠自编码器 | 准确率 | NA |
| 1489 | 2026-02-02 |
Advancing Medical Decision-Making with AI: A Comprehensive Exploration of the Evolution from Convolutional Neural Networks to Capsule Networks
2025-Dec-30, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010017
PMID:41590902
|
综述 | 本文是一篇关于卷积神经网络(CNN)和胶囊网络(CapsNet)在医学图像分析中应用的文献综述,旨在通过比较两者来辅助医疗决策支持 | 对CNN和CapsNet在医学图像分析中的应用进行了结构化比较,并提出了未来可解释、高效混合深度学习系统的研究方向 | 作为一篇综述文章,其局限性在于主要基于2018年至2025年发表的文献进行分析,可能未涵盖最新进展 | 分析比较CNN和CapsNet在医学图像分析中的性能,以支持医疗决策 | 医学图像分析领域的深度学习架构 | 计算机视觉 | NA | NA | CNN, CapsNet | 图像 | 基于基准数据集BraTS、INbreast、ISIC和COVIDx | NA | 卷积神经网络, 胶囊网络 | NA | NA |
| 1490 | 2026-02-02 |
A painting art rendering system by deep learning framework and machine translation
2025-Dec-29, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-34058-4
PMID:41461861
|
研究论文 | 本研究提出了一种基于深度学习和机器翻译的绘画艺术渲染系统,旨在解决民族大学绘画教学中的技术传承、跨语言障碍和个性化不足等问题 | 提出了一个集“技术传承-风格渲染-文化解读-个性化指导”于一体的协作教学框架,并引入了改进的生成对抗网络和视觉上下文Transformer模块,实现了八种民族绘画风格的自动渲染和跨民族语言绘画术语的语义映射 | 未明确说明系统在更广泛绘画风格或语言中的泛化能力,以及计算资源需求的具体细节 | 开发一个集成系统,以促进民族绘画技术的数字保存和跨文化交流,提升绘画教学效果 | 民族绘画艺术作品和跨民族语言的绘画术语 | 计算机视觉, 自然语言处理 | NA | 深度学习, 机器翻译 | GAN, Transformer | 图像, 文本 | 包含12,000件艺术作品和5,000条术语条目的多模态数据集 | NA | 改进的生成对抗网络, 视觉上下文Transformer | F1分数, 语义匹配率 | NA |
| 1491 | 2026-02-02 |
An enhanced deep learning framework for intrusion classification enterprise network using multi-branch CNN-attention architecture
2025-Dec-29, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-34166-1
PMID:41461889
|
研究论文 | 本文提出了一种面向部署的企业网络入侵检测框架,结合了多分支CNN注意力架构与微调决策树分类器 | 提出了一种结合多分支CNN通道注意力机制与微调决策树分类器的部署导向型入侵检测框架,在保证高精度的同时提供可解释的规则,并展示了跨数据集的泛化能力 | NA | 开发一个高精度、可解释且适合实际部署的企业网络入侵检测系统 | 企业网络流量数据 | 机器学习 | NA | NA | CNN, 决策树 | 网络流量数据 | CIC-IDS2017数据集包含超过200万个带标签的网络流(80+个特征),NSL-KDD数据集包含125,000个连接记录(41个特征) | NA | 多分支CNN注意力架构 | 准确率, ROC-AUC, 宏F1分数 | NA |
| 1492 | 2026-02-02 |
Interpretable multimodal deep learning improves postoperative risk stratification in intrahepatic cholangiocarcinoma in multicentre cohorts
2025-Dec-29, NPJ digital medicine
IF:12.4Q1
DOI:10.1038/s41746-025-02282-x
PMID:41466129
|
研究论文 | 开发了一种基于Transformer的可解释多模态深度学习框架,用于肝内胆管癌患者的术后风险分层 | 首次将临床变量、影像组学特征和全切片病理图像通过预训练编码器与Transformer网络融合,并利用空间转录组学和蛋白质组学进行生物学验证,揭示了模型注意力机制与肿瘤侵袭性的关联 | 未明确说明模型在更广泛人群或不同医疗中心间的泛化能力,以及计算资源需求的具体细节 | 提高肝内胆管癌患者术后风险分层的准确性 | 肝内胆管癌患者 | 数字病理学 | 肝内胆管癌 | 空间转录组学, 空间蛋白质组学 | Transformer | 临床变量, 影像组学特征, 全切片病理图像 | 三个独立验证队列(具体样本数未提供) | NA | Transformer | AUC | NA |
| 1493 | 2026-02-02 |
Adaptive Normalization Enhances the Generalization of Deep Learning Model in Chest X-Ray Classification
2025-Dec-28, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010014
PMID:41590899
|
研究论文 | 本研究通过对比分析不同归一化方法,提出了一种自适应预处理流程,旨在提升深度学习模型在胸部X光分类中的泛化能力 | 提出了一种结合百分位ROI裁剪和直方图标准化的自适应预处理流程,并通过系统性基准测试验证其在多数据集和模型架构下的有效性 | 在采集异质性强的MIMIC-CXR数据集上性能提升有限 | 提升深度学习模型在胸部X光分类中的跨数据集鲁棒性和可靠性 | 胸部X光图像 | 计算机视觉 | NA | NA | CNN | 图像 | 四个公共胸部X光数据集 | NA | 三种卷积神经网络架构 | 准确率, F1分数 | NA |
| 1494 | 2026-02-02 |
Automated deep learning pipeline for callosal angle quantification
2025-Dec-27, Fluids and barriers of the CNS
IF:5.9Q1
DOI:10.1186/s12987-025-00750-w
PMID:41456015
|
研究论文 | 本文开发了一个全自动深度学习框架,用于从原始T1 MPRAGE扫描中量化胼胝体角,以辅助常压性脑积水的诊断 | 提出了一个结合BrainSignsNET进行关键解剖标志点检测和基于UNet的分割网络的全自动、鲁棒性框架,可直接从原始MRI扫描中测量胼胝体角,性能优于报告的人工观察者间变异性 | 未明确提及,但可能包括对特定MRI序列(T1 MPRAGE)的依赖以及需要进一步的外部验证 | 开发一个全自动、可靠的深度学习框架,用于量化胼胝体角,以改善常压性脑积水的早期检测和诊断 | 常压性脑积水患者的MRI扫描图像 | 数字病理学 | 常压性脑积水 | T1 MPRAGE MRI扫描 | 深度学习 | 3D MRI图像 | 训练和内部验证使用BLSA和BIOCARD数据集;外部验证使用来自约翰霍普金斯湾景医院和PENS试验的376个临床MRI扫描 | NA | BrainSignsNET, UNet with EfficientNetB0 encoder | 相关系数, 平均绝对误差 | NA |
| 1495 | 2026-02-02 |
A Hybrid Vision Transformer-BiRNN Architecture for Direct k-Space to Image Reconstruction in Accelerated MRI
2025-Dec-26, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010011
PMID:41590896
|
研究论文 | 提出了一种结合Vision Transformer和双向循环神经网络的混合双域深度学习架构,用于加速MRI中的k空间到图像的直接重建 | 首次将ViT自编码器与BiRNN结合,协同处理图像域和k空间域信息,直接利用k空间数据的序列特性来抑制混叠伪影 | 研究仅在神经MRI的回顾性欠采样数据上进行评估,未涉及其他解剖部位或前瞻性数据 | 解决加速MRI中因k空间欠采样导致的病态逆问题,实现高质量图像重建 | 加速磁共振成像(MRI)中的图像重建 | 计算机视觉 | NA | 磁共振成像(MRI) | Vision Transformer, BiRNN | 图像, k空间数据 | NA | NA | Vision Transformer autoencoder, BiRNN, UNet | NA | NA |
| 1496 | 2026-02-02 |
Accurate Segmentation of Vegetation in UAV Desert Imagery Using HSV-GLCM Features and SVM Classification
2025-Dec-25, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010009
PMID:41590895
|
研究论文 | 本文提出了一种结合HSV颜色空间和GLCM纹理特征,并采用SVM分类器的机器学习方法,用于无人机沙漠图像中植被的准确分割 | 结合HSV颜色空间与GLCM纹理特征,并采用SVM分类器,在具有挑战性的沙漠环境中实现了鲁棒的植被分割,显著优于传统光谱指数方法和现代深度学习基线 | 处理速度为每张图像25秒,训练时间28分钟,在强调处理速度的应用中可能受限 | 实现无人机沙漠图像中植被的准确分割,以支持精准农业应用 | 阿联酋沙漠农田的120张高分辨率无人机图像 | 计算机视觉 | NA | 无人机成像 | SVM | 图像 | 120张高分辨率无人机图像 | NA | NA | 准确率, 精确率, 召回率, F1分数, 交并比 | NA |
| 1497 | 2026-02-02 |
Empirical Mode Decomposition-Based Deep Learning Model Development for Medical Imaging: Feasibility Study for Gastrointestinal Endoscopic Image Classification
2025-Dec-22, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010004
PMID:41590889
|
研究论文 | 本研究提出了一种基于二维经验模态分解的深度学习框架,用于提升医学图像分类性能,并在胃肠道内窥镜图像分类任务中验证其有效性 | 将二维经验模态分解技术集成到深度学习流程中,通过分解图像为内在模态函数来增强图像特征,从而显著提高模型性能 | 仅使用公开的Kvasir数据集进行验证,未在其他医学图像领域或更大规模数据集上测试,且未详细讨论计算复杂度增加的问题 | 开发一种基于二维经验模态分解的深度学习模型,以提升多类图像分类任务的性能,并探索其在医疗影像中早期疾病检测的潜力 | 胃肠道内窥镜图像 | 计算机视觉 | 胃肠道疾病 | 二维经验模态分解 | CNN, Transformer | 图像 | Kvasir数据集,包含8类胃肠道图像,每类1000张,共8000张图像 | NA | ResNet152, VGG19bn, MobileNetV3L, SwinTransformerV2S | 准确率, F1分数, AUC | NA |
| 1498 | 2026-02-02 |
Development of a Multispectral Image Database in Visible-Near-Infrared for Demosaicking and Machine Learning Applications
2025-Dec-20, Journal of imaging
IF:2.7Q3
DOI:10.3390/jimaging12010002
PMID:41590887
|
研究论文 | 本研究开发了一个可见光-近红外多光谱图像数据库,用于去马赛克技术和机器学习应用 | 利用基于滤光片阵列技术的高端多光谱相机,创建了一个包含高分辨率多光谱图像、标注图像和掩码的免费可访问数据库 | 数据库依赖于特定平台(PImRob)的相机技术,且多光谱相机技术相对较新,可用性有限 | 为多光谱图像的去马赛克技术、分割算法和深度学习研究提供数据支持 | 不同植物和杂草的多光谱图像 | 计算机视觉 | NA | 多光谱成像,滤光片阵列技术 | NA | 多光谱图像 | NA | NA | NA | NA | NA |
| 1499 | 2026-02-02 |
Deep learning-enabled accurate assessment of gait impairments in Parkinson's disease using smartphone videos
2025-Dec-13, NPJ digital medicine
IF:12.4Q1
DOI:10.1038/s41746-025-02150-8
PMID:41390840
|
研究论文 | 本文提出了一种基于深度学习的框架,利用智能手机录制的视频评估帕金森病患者的步态障碍 | 该框架能够以高精度预测帕金森病严重程度,并有效区分药物对步态障碍的综合疗效,特别是能够检测到超出统一帕金森病评定量表分辨率的药物诱导的细粒度步态变化 | 未在摘要中明确说明 | 评估帕金森病患者的步态障碍,并分析药物疗效 | 帕金森病患者的步态 | 计算机视觉 | 帕金森病 | 智能手机视频录制 | 深度学习 | 视频 | NA | NA | NA | AUC, F1分数, 精确度 | NA |
| 1500 | 2026-02-02 |
Artificial Intelligence in Medicine: Moving From "Prediction" to "Patient-Centric Decision Intelligence"
2025-Dec, Cureus
DOI:10.7759/cureus.100323
PMID:41613711
|
评论 | 本文讨论了人工智能在医疗领域从预测模型向以患者为中心的决策智能的转变 | 提出了从预测性AI向决策智能医疗系统(DIHS)的过渡,强调整合多模态患者数据以支持个性化临床决策 | 未提及具体实施案例或实证研究结果 | 推动人工智能在医疗中从预测功能转向支持个性化、可操作的临床决策 | 临床AI系统、多模态患者数据、决策智能医疗系统 | 机器学习 | NA | 多模态深度学习 | 深度学习平台 | 结构化数据、图像、自由文本临床记录、语音生物标志物、可穿戴传感器输出、社会健康决定因素、环境暴露、医生推理 | NA | NA | NA | NA | NA |