本数据库通过收集和整理最新科研文献信息而得,供了解领域前沿进展之用。数据源自 PubMed Data ,每日自动更新(使用关键词“['deep learning']”过滤),已收录文献数量参见 统计表格。表格内容由 GPT 自动整理,可能存在错误或遗漏,请使用时务必注意核实!
如有建议或合作意向,欢迎联系 linlin.yan(AT)bioinfo.app 或 微信 yanlinlin82。本项目遵循 MIT 许可 发布,欢迎下载 源码 自行修改使用。如觉得不错,还请不吝 给我打赏,你的支持是我继续创新的重要动力!


除通过在线浏览外,为方便用户离线查阅,本站也提供 付费下载(定价19.9元)。之所以考虑收费,是因为批量扫描这些文献并整理也是有一定成本的,还请理解并多多支持。本站数据会持续更新,而仅需一次付费,未来就可以随时重新下载到最新版本数据。
| 序号 | 推送日期 | 文章 | 类型 | 简述 | 创新点 | 不足 | 研究目的 | 研究对象 | 领域 | 病种 | 技术 | 模型 | 数据类型 | 样本量 | 算法框架 | 模型架构 | 性能指标 | 计算资源 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 241 | 2026-04-27 |
Optimized YOLOv8s framework with deformable convolution for underwater object detection
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-28989-1
PMID:41309854
|
研究论文 | 提出一种优化YOLOv8s框架(O-YOLOv8s-DC),融合可变形卷积与多尺度注意力机制,用于水下目标检测 | 创新集成可变形卷积特征模块(C2f_DC)、深度加权双向特征金字塔(DeepBiFPN)、内容感知特征重组(CARAFE)和高效多尺度注意力(EMA),有效提升小目标与遮挡目标检测性能 | 未提及在极端浑浊水质或极高密度目标场景下的性能表现,且仅使用两个数据集进行验证 | 解决水下目标检测中小目标、遮挡目标、形态多变及低图像质量等关键挑战 | 水下环境中的目标物体 | 计算机视觉 | NA | 可变形卷积、深度学习 | YOLOv8s(优化框架) | 图像 | 两个数据集:LFIW和OI数据集 | PyTorch | YOLOv8s, C2f_DC, DeepBiFPN, CARAFE, EMA | AP@[0.50:0.05:0.95], AP@0.75, 消融实验指标 | 未提及具体计算资源,但可推断需GPU支持训练 |
| 242 | 2026-04-27 |
A novel spatiotemporal transformer network with multivariate fusion for short-term precipitation forecasting
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29415-2
PMID:41309915
|
研究论文 | 提出一种新颖的时空Transformer网络并结合多变量融合技术进行短期降水预测 | 设计了基于全维动态卷积的多变量融合模块,并结合Transformer与多尺度卷积模块构建编码器-解码器框架,有效整合温度、湿度、风速等多种气象变量信息进行降水预测 | NA | 解决现有降水预测模型依赖单一数据源而忽视降水形成多因素特性的问题,提高短期降水预测精度 | 多气象变量时间序列数据,包括温度、湿度、风速等,用于预测未来12小时和24小时的累积降水量 | 机器学习 | NA | NA | VAE、Transformer | 时序数据 | 包含多种气象变量的累积数据,涵盖过去12小时和过去24小时的时间范围 | PyTorch | Transformer, 多尺度卷积模块(Omni-Dimensional Dynamic Convolution) | POD, CSI | NA |
| 243 | 2026-04-27 |
A smart assistive system for visually challenged people through efficient object detection using deep learning with tunicate swarm algorithm
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29947-7
PMID:41309919
|
research paper | 提出了一种基于深度学习和海鞘群算法的智能辅助系统,用于视觉障碍人群的物体检测 | 结合YOLOV8、CapsNet、深度信念网络和海鞘群算法,通过参数优化提升物体检测精度 | 仅在室内物体检测数据集上验证,未测试室外场景和实时性能 | 开发一种自动物体检测系统,辅助视觉障碍者完成日常任务 | 视觉障碍者 | computer vision | NA | median filtering, object detection, deep learning | YOLOV8, CapsNet, DBN, TSA | image | 使用Indoor Object Detection数据集,具体数量未提及 | NA | YOLOV8, CapsNet, Deep Belief Network | accuracy | NA |
| 244 | 2026-04-27 |
Quantitative and longitudinal monitoring of cancer cell invasion in a three-dimensional in vitro model of oral cancer using optical coherence tomography
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-28471-y
PMID:41309958
|
研究论文 | 应用光学相干断层扫描与深度学习结合,实现对三维口腔癌模型中癌细胞侵袭的定量纵向监测 | 首次将光学相干断层扫描与深度学习相结合,用于非侵入性、定量和纵向监测三维口腔癌模型中的癌细胞侵袭行为 | NA(摘要未提及局限性) | 评估光学相干断层扫描与深度学习结合在三维口腔癌模型中定量纵向监测癌细胞侵袭的适用性和可行性 | 三维口腔鳞状细胞癌器官型培养模型中的癌细胞侵袭行为 | 计算机视觉, 深度学习 | 口腔癌 | 光学相干断层扫描 | 深度学习模型 | 图像 | NA(未明确样本数量) | NA | NA | NA(文中提及与组织形态计量数据强相关但未指定具体指标) | NA |
| 245 | 2026-04-27 |
Tri branch attention enhanced 3DUNet for remote sensing based hyperspectral image classification
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29357-9
PMID:41309972
|
研究论文 | 提出了一种三分支注意力增强的3DUNet用于遥感高光谱图像分类 | 采用三分支结构分别处理光谱、空间及两者结合的特征,并引入特定注意力机制,以解决传统U-Net在高分辨率高光谱图像中类别不平衡和分辨率退化的问题 | 未提及计算资源消耗或实际部署中的效率问题 | 提高高光谱图像分类的准确性和鲁棒性 | 高光谱遥感图像 | 计算机视觉 | 不适用 | 高光谱成像 | 3DUNet, 注意力机制 | 图像 | 三个基准数据集(Indian Pines, Pavia University, Houston-2018) | 不适用 | 三分支3DUNet(光谱分支、空间分支、结合分支) | 平均精度(AA), 总体精度(OA) | 不适用 |
| 246 | 2026-04-27 |
Feature centric based deep learning approach for music mood recognition with HuBERT transformer model
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29200-1
PMID:41309989
|
研究论文 | 本研究使用HuBERT等深度学习与Transformer模型进行音乐情绪分类,实现95%的最高准确率 | 首次将HuBERT Transformer模型应用于音乐情绪识别任务,并取得了优于传统深度学习和预训练模型的分类性能 | 未提及模型的计算成本或泛化能力验证,数据集仅包含五种情绪标签且类别平衡,未探讨数据不平衡或更细粒度情绪分类的挑战 | 探索先进深度学习与Transformer模型在音乐情绪分类中的有效性,提升AI驱动的情感分析能力 | 音乐音频文件中的情绪内容识别与分类 | 机器学习、自然语言处理 | NA | NA | HuBERT, ConvFormer, LSTM, YAMNet | 音频 | 2500个音频文件,每个类别(Aggressive, Happy, Dramatic, Sad, Romantic)500个样本 | NA | HuBERT, ConvFormer, LSTM, YAMNet | 准确率 | NA |
| 247 | 2026-04-27 |
Modifier guided resilient CNN inference enables fault-tolerant edge collaboration for IoT
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-28454-z
PMID:41310049
|
研究论文 | 提出一种无需云端参与的边缘分布式CNN架构,通过轻量级修饰模块实现容错推理,适用于资源受限的物联网场景 | 设计轻量级修饰模块,利用故障模拟训练机制实时生成失效设备的预测结果,避免模型复制或云端回退,实现完全边缘侧容错 | 仅在MNIST和CIFAR-10数据集上验证,未在更复杂的真实物联网数据上测试;对超过五个设备同时故障的场景未充分评估 | 实现资源受限物联网场景下鲁棒且准确的分布式深度学习推理,消除对云端的依赖 | 物联网环境中的边缘设备及其分布式CNN推理过程 | 机器学习 | NA | NA | CNN | 图像 | MNIST和CIFAR-10数据集,实验中最多模拟五个设备同时故障 | NA | CNN | 准确率、错误率 | NA |
| 248 | 2026-04-27 |
EnCTN: an enhanced AI-enabled deep learning framework for security enhancement in blockchain transactions
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29160-6
PMID:41310051
|
研究论文 | 提出一种增强型卷积时间网络,用于提升基于AI的区块链交易安全 | 将区块链与深度学习结合,通过增强型卷积时间网络和自动编码器技术实现交易分析中的异常检测,同时采用扩张卷积捕获长期依赖关系 | 文中未明确说明局限性 | 提升区块链交易的安全性和异常检测能力,解决数据机密性和匿名性问题 | 区块链网络中的交易数据 | 机器学习 | NA | NA | 增强型卷积时间网络 | 时间序列数据 | 使用NSL-KDD数据集进行评估 | Python | 增强型卷积时间网络, 自动编码器 | 异常分类准确率 | NA |
| 249 | 2026-04-27 |
Integration of corpus linguistics and deep learning techniques for enhanced semantic-driven emotion detection on textual data
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-28929-z
PMID:41310067
|
research paper | 提出一种基于集成词向量表示和多模型深度神经网络的文本情感检测方法(EDTIWVR-MDNN),以提升自然语言中的情感理解 | 融合TF-IDF、BERT和GloVe技术进行词嵌入,并采用基于注意力的时间卷积网络与双向门控循环单元的混合模型(AM-T-BiG)进行情感分类 | 未在多种数据集上验证泛化能力,可能对特定领域或非英语文本的适应性有限 | 开发有效的文本情感识别方法,增强情感分析、社交媒体监控、心理健康评估和人机交互等应用的理解能力 | 文本数据中的情感表达 | natural language processing | NA | 词嵌入(TF-IDF, BERT, GloVe), 深度神经网络 | 时间卷积网络(TCN), 门控循环单元(GRU) | 文本 | 基于文本情感检测数据集,具体样本数量未提及 | NA | AM-T-BiG(注意力机制时间卷积网络与双向GRU) | 准确率 | NA |
| 250 | 2026-04-27 |
Deep learning-based AI model for predicting academic success and engagement among physical higher education students
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29000-7
PMID:41310101
|
研究论文 | 提出基于深度学习的HybridStackNet堆叠集成模型,用于预测体育高等教育学生的学业成功与参与度 | 构建结合随机森林和支持向量机作为基学习器、逻辑回归作为元学习器的堆叠集成模型,并引入偏依赖图和LIME实现可解释性分析 | 基于500条公开数据集进行训练,样本规模有限可能影响泛化能力;未提及跨机构或纵向数据的验证 | 开发可解释的机器学习模型以早期识别体育教育学生的学业风险 | 体育高等教育学生的学业表现与参与行为 | 机器学习 | 不适用 | SMOTE过采样、随机森林特征选择 | 堆叠集成模型(HybridStackNet) | 结构化表格数据 | 500个实例,包含学业、行为和身体属性 | Scikit-learn | 随机森林、支持向量机、逻辑回归 | 准确率、精确率、召回率、F1分数、AUC、Jaccard系数、Kappa系数、Hamming损失 | 未提及 |
| 251 | 2026-04-27 |
Improved multiscale attention based deep learning approach for automated sugarcane leaf disease detection using BSRI data
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-28947-x
PMID:41310119
|
研究论文 | 提出一种基于多尺度注意力密集残差网络(MADRN)的深度学习框架,用于自动检测甘蔗叶片病害 | 首次将多尺度注意力机制与密集残差学习结合,构建MADRN架构,并利用孟加拉甘蔗作物研究所(BSRI)真实场景数据增强模型泛化能力 | 未提及模型在极端光照或复杂田间环境下的鲁棒性测试,且样本规模受限可能影响模型泛化性 | 实现甘蔗叶片病害的早期精准检测,提升农业生产效率并减少经济损失 | 甘蔗叶片病害(如赤腐病、环斑病等) | 计算机视觉 | 植物病害(甘蔗相关) | 深度学习图像分类 | 卷积神经网络(CNN) | 图像数据 | Kaggle公开数据集及BSRI混合数据集(具体样本数未提及) | TensorFlow, Keras | 多尺度注意力密集残差网络(MADRN)、CNN、VGG16、MobileNetV2、XceptionNet | 准确率、精确率、召回率、F1分数 | 未提及具体GPU类型,但开发了网页端应用支持实时部署 |
| 252 | 2026-04-27 |
The remote sensing method for large-scale asphalt pavement aging assessment with automated sample generation and deep learning
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29966-4
PMID:41290981
|
研究论文 | 提出一种结合多端元混合像元分解、自动样本生成和深度学习的创新框架,用于大范围沥青路面老化快速评估 | 首次将多端元混合像元分解、自动化样本生成与一维卷积神经网络结合,并采用无监督零样本迁移方法实现大范围沥青路面老化评估 | NA | 实现大范围沥青路面老化的快速准确评估,为道路养护和交通安全预警提供支持 | 基于WorldView-3遥感数据的大面积沥青路面老化状态 | 计算机视觉 | NA | 遥感成像(WorldView-3)、多端元混合像元分解 | 一维卷积神经网络(1D-CNN) | 遥感图像 | 多个研究区域,包括武汉经济技术开发区中南部和北部区域 | NA | 1D-CNN,结合无监督零样本迁移方法 | 总体分类准确率、Kappa系数 | NA |
| 253 | 2026-04-27 |
Mental health assessment model for college students based on facial expression recognition
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29461-w
PMID:41298755
|
研究论文 | 提出一种结合面部表情识别与深度学习技术的大学生心理健康评估模型 | 采用双分支结构,通过分层滑动窗口Transformer提取动态特征,MobileViT提取静态峰值帧特征,并利用交叉注意力模块实现特征融合 | NA | 提高大学生心理健康评估的准确性和效率,支持情感识别驱动的心理干预 | 大学生的面部表情和心理健康状态 | 计算机视觉 | 心理健康问题 | NA | Transformer, MobileViT | 面部表情图像 | NA | NA | 分层滑动窗口Transformer, MobileViT, 交叉注意力模块 | 准确率, F1值, AUC, 平均响应时间, 训练时间 | NA |
| 254 | 2026-04-27 |
Traditional cloud pattern classification algorithm based on semi-supervision with Random Line Augment
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29225-6
PMID:41298891
|
研究论文 | 提出一种基于半监督学习的传统云纹图案分类算法,结合随机线条增强策略,以少量标签实现高精度分类 | 提出半监督学习框架和随机线条增强数据增强策略,并引入WideResNet作为骨干网络以增强局部细节特征捕捉能力 | 仅针对线条特征明显的云纹图案,对其他类型图案的泛化能力未知 | 解决同一类别下不同类型图案的精细分类难题,实现传统云纹图案的高效数字化保护 | 传统云纹图案 | 计算机视觉 | NA | NA | 半监督学习模型、WideResNet | 图像 | NA | PyTorch | WideResNet | 准确率 | NA |
| 255 | 2026-04-27 |
Software cost estimation using TabNet and Harris Hawks Optimization
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29908-0
PMID:41298997
|
研究论文 | 提出一种结合TabNet与哈里斯鹰优化(HHO)的混合模型,用于软件成本估算 | 将TabNet深度学习架构与HHO特征工程相结合,并利用SHAP进行可解释性分析 | 未明确说明局限性 | 提高软件成本估算的准确性和鲁棒性 | 软件项目开发过程中的成本数据 | 机器学习 | NA | NA | TabNet | 表格数据 | 多个标准数据集,包括COCOMO、NASA、Desharnais、China、Albrecht | NA | TabNet | 均方误差, 均方根误差, 平均绝对误差, 中位数相对误差, 预测准确率 | NA |
| 256 | 2026-04-27 |
Deep learning classification of INSV-associated weeds in Monterey county using a curated RGB image dataset
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29552-8
PMID:41299059
|
研究论文 | 提出首个针对加州蒙特雷县与INSV相关的杂草的高分辨率RGB图像数据集,并比较三种CNN模型进行分类 | 首次构建了针对加州蒙特雷县INSV相关杂草的区域性高分辨率图像数据集,填补了全球数据集中此类区域的空白 | NA | 利用深度学习实现INSV相关杂草的准确识别,为精准农业中的实时检测和可持续杂草管理提供支持 | 蒙特雷县中与INSV相关的两种杂草:Sonchus oleraceus(一年生苦苣菜)和Malva parviflora(小锦葵) | 计算机视觉 | 植物病害(INSV,菊花坏死斑点病毒) | RGB成像 | 卷积神经网络 | 图像(RGB) | 由温室条件下拍摄的高分辨率RGB图像构成的数据集,具体数量未明确 | PyTorch | ResNet-50, ResNet-101, DenseNet-121 | 分类准确率, Cohen's Kappa, F1-score, AUC | NA |
| 257 | 2026-04-27 |
A deep learning pipeline for detecting vestibular schwannoma patients with unilateral vestibular loss based on kinematic data
2025-Nov-25, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29776-8
PMID:41291198
|
研究论文 | 使用深度学习管道基于运动学数据检测前庭神经鞘瘤伴单侧前庭功能丧失患者 | 首次在术前患者中利用深度学习从惯性测量单元数据检测早期代偿性运动模式,并发现腕部和躯干传感器在传统评估未强调的区域具有关键特征 | 数据集规模有限,传感器放置位置和任务设计可能未覆盖所有相关运动特征,且模型尚未在真实临床环境中验证 | 开发基于深度学习的分类器,从步态运动学数据中区分前庭神经鞘瘤患者与健康对照,以在传统临床评分正常时检测前庭功能损害 | 前庭神经鞘瘤患者和年龄匹配的健康对照组 | 机器学习 | 前庭神经鞘瘤 | NA | 卷积神经网络 | 运动学数据(惯性测量单元信号) | 前庭神经鞘瘤患者和健康对照者的步态数据,具体样本量未在摘要中提及 | NA | 卷积神经网络 | 准确率 | NA |
| 258 | 2026-04-27 |
A novel hybrid approach for multi stage kidney cancer diagnosis using RCC ProbNet
2025-Nov-24, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29742-4
PMID:41276585
|
研究论文 | 提出一种名为RCC-ProbNet的混合深度学习模型,用于肾细胞癌的多阶段诊断 | 首次结合特征提取与概率特征建模,形成混合深度学习方法,并通过Logistic回归分类器实现高精度分期诊断 | 未提及模型在真实临床环境中的泛化能力及外部数据集验证结果 | 提高肾细胞癌早期诊断和分期的精确性 | 肾细胞癌患者医学影像数据 | 机器学习, 数字病理学 | 肾癌 | 医学影像分析 | 混合深度学习模型(RCC-ProbNet + LR) | 医学图像 | 未明确说明 | NA | RCC-ProbNet, Logistic回归 | 准确率 | NA |
| 259 | 2026-04-27 |
Advanced COVID-19 detection using cough signals with space reconstruction and 3D deep convolutional neural networks
2025-Nov-24, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-29633-8
PMID:41286001
|
研究论文 | 提出一种通过咳嗽音频信号结合相位空间重构和3D深度卷积神经网络检测新冠肺炎的新方法 | 将相位空间重构与3D深度卷积神经网络结合,用于咳嗽信号分析,将原始声信号转换为多维特征空间并编码为三维张量表示 | 未在本文中说明 | 通过咳嗽音频信号实现非侵入性、可扩展的新冠肺炎快速可靠筛查 | 新冠肺炎阳性、有症状非新冠肺炎个体和健康对照者的咳嗽音频信号 | 深度学习, 计算机听觉 | 新冠肺炎 | 相位空间重构, 咳嗽信号分析 | 3D深度卷积神经网络 | 音频信号 | 超过8,400个咳嗽录音(来自不同人群的COUGHVID数据集) | NA | 自定义3D DCNN(5个卷积层和最大池化操作) | 准确率, 召回率, 特异度 | NA |
| 260 | 2026-04-27 |
Deep Learning-Driven Early Diagnosis of Respiratory Diseases using CNN-RNN Fusion on Lung Sound Data
2025-Nov-24, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-28832-7
PMID:41286281
|
研究论文 | 提出一种结合CNN和RNN的深度学习算法,用于肺音分析以实现呼吸系统疾病的早期诊断 | 利用CNN-RNN融合架构整合空间和时间特征,并结合Grad-CAM提供可解释的可视化解释和置信度估计,增强临床可信度 | NA | 通过深度学习肺音分析提高呼吸系统疾病早期检测的准确性 | 呼吸系统疾病患者及健康个体的肺音数据 | 数字病理学 | 肺炎、哮喘、慢性阻塞性肺疾病 | 肺音记录、高通滤波、Mel谱图 | CNN-RNN融合模型 | 音频 | Coswara和ICBHI数据集 | TensorFlow, PyTorch | CNN, LSTM | 准确率、敏感性、特异性、F1分数 | NA |