本数据库通过收集和整理最新科研文献信息而得,供了解领域前沿进展之用。数据源自 PubMed Data ,每日自动更新(使用关键词“['deep learning']”过滤),已收录文献数量参见 统计表格。表格内容由 GPT 自动整理,可能存在错误或遗漏,请使用时务必注意核实!
如有建议或合作意向,欢迎联系 linlin.yan(AT)bioinfo.app 或 微信 yanlinlin82。本项目遵循 MIT 许可 发布,欢迎下载 源码 自行修改使用。如觉得不错,还请不吝 给我打赏,你的支持是我继续创新的重要动力!


除通过在线浏览外,为方便用户离线查阅,本站也提供 付费下载(定价19.9元)。之所以考虑收费,是因为批量扫描这些文献并整理也是有一定成本的,还请理解并多多支持。本站数据会持续更新,而仅需一次付费,未来就可以随时重新下载到最新版本数据。
| 序号 | 推送日期 | 文章 | 类型 | 简述 | 创新点 | 不足 | 研究目的 | 研究对象 | 领域 | 病种 | 技术 | 模型 | 数据类型 | 样本量 | 算法框架 | 模型架构 | 性能指标 | 计算资源 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 141 | 2026-06-19 |
Empowering rural governance with digital technology: Deep learning models for automated detection of rural buildings using remote sensing images
2026, PloS one
IF:2.9Q1
DOI:10.1371/journal.pone.0351311
PMID:42284255
|
研究论文 | 提出一种集成多尺度混合注意力模块、动态特征金字塔网络和渐进对比学习策略的深度学习框架,用于从遥感影像中自动检测农村建筑物以支持乡村治理 | 引入多尺度混合注意力模块并行卷积路径结合通道和空间注意力动态捕捉多尺度特征并抑制背景噪声,动态特征金字塔网络利用内容感知路由自适应融合层次特征实现尺度不变表示,渐进对比学习策略通过硬样本挖掘利用有标签和无标签数据增强判别能力 | 在跨数据集泛化(中国农村数据上MIoU为72.3%)仍有提升空间,高质量注释数据集稀缺问题未彻底解决 | 解决从无人机遥感影像自动检测农村建筑物时面临的极端尺度变化、复杂背景干扰和高质量标注数据稀缺等挑战 | 农村建筑物 | 计算机视觉 | NA | 遥感影像分析 | 深度学习模型 | 图像 | 马萨诸塞州建筑物数据集及中国农村数据 | PyTorch | U-Net, SegNet, DeepLabV3+作为基准,提出框架含多尺度混合注意力模块、动态特征金字塔网络 | 平均交并比(MIoU),像素精度(PA),平均精度均值(mAP) | GitHub开源代码,未明述GPU类型 |
| 142 | 2026-06-19 |
EffortNet: A Deep Learning Framework for Objective Assessment of Speech Enhancement Technologies Using EEG-Based Alpha Oscillations
2026, IEEE transactions on neural systems and rehabilitation engineering : a publication of the IEEE Engineering in Medicine and Biology Society
IF:4.8Q1
DOI:10.1109/TNSRE.2026.3694178
PMID:42149756
|
研究论文 | 提出一种名为EffortNet的深度学习框架,通过脑电图中的alpha振荡客观评估语音增强技术对听力的影响 | 整合自监督学习、增量学习和迁移学习三种互补范式,解决脑电图信号的个体间差异问题,并利用概率指标揭示神经网络差异与主观评分之间的分离现象 | 未明确说明 | 开发一种客观评估语音理解过程中听力困难程度的深度学习框架 | 122名参与者在四种语音条件下(清晰、噪声、MMSE增强、Transformer增强)的64通道脑电图数据 | 机器学习和信号处理 | 听力学相关疾病 | 脑电图(EEG) | 深度学习框架 | 脑电图信号 | 122名参与者 | NA | EffortNet | 分类准确率(与常规CNN和STAnet对比) | NA |
| 143 | 2026-06-19 |
A transformer-based deep learning algorithm for diagnosing spinal infections on axial non-contrast computed tomography images: a dual-center retrospective study
2026, PeerJ
IF:2.3Q2
DOI:10.7717/peerj.21340
PMID:42299150
|
研究论文 | 开发了一种基于Swin Transformer的深度学习算法,用于在轴位非增强CT图像上诊断脊柱感染,并在双中心回顾性研究中验证其性能 | 首次将Swin Transformer模型应用于脊柱感染的CT诊断,并证明其在无磁共振条件下的高准确率和临床辅助价值 | 回顾性研究设计、样本量相对有限(共157例)、未包含其他脊柱病变类型 | 探索基于非增强CT图像的深度学习方法来诊断原发性脊柱感染,提高诊断准确率和效率 | 来自两个医疗中心的157例原发性脊柱感染患者的非增强CT图像切片 | 医学影像分析 | 脊柱感染 | CT成像 | Swin Transformer | CT图像 | 训练及内部验证集127例(来自主要中心,7:3随机划分),外部验证集30例(来自第二中心) | PyTorch | Swin Transformer | AUC, AUPRC, 灵敏度, 特异度, 准确率, PPV, NPV, F1分数 | GPU(具体型号未提及) |
| 144 | 2026-06-19 |
Automated classification of natural habitats using ground-level imagery
2026, PloS one
IF:2.9Q1
DOI:10.1371/journal.pone.0351335
PMID:42308189
|
研究论文 | 提出一种基于地面级图像(照片)的自动化栖息地分类方法,利用深度学习实现16类栖息地的分类 | 首次仅基于地面图像进行栖息地分类,替代依赖卫星影像的传统方法,并开发了DeepLabV3-ResNet101自定义深度学习分类器,结合数据增强与重采样平衡类别 | 部分视觉混合或模糊的栖息地类别(如视觉不明显的类别)分类性能较低,整体F1分数为0.63,且仅针对英格兰‘Living England’框架的16个类别 | 实现基于地面图像的可扩展、高精度栖息地分类,支持生态监测与公民科学应用 | 地面级栖息地照片(来自公民科学或实地拍摄的图片) | 计算机视觉 | NA | 图像预处理(缩放、归一化、增强)与重采样技术 | CNN(DeepLabV3-ResNet101) | 图像 | 16类栖息地图像,未明确具体数量,但通过五折交叉验证与重采样平衡类别 | PyTorch | DeepLabV3-ResNet101 | 准确率, F1分数 | NA |
| 145 | 2026-06-19 |
A semantic segmentation model to predict subcellular glycogen localization using transmission electron microscopy images
2026, PloS one
IF:2.9Q1
DOI:10.1371/journal.pone.0351502
PMID:42308209
|
研究论文 | 开发并验证了一种基于深度学习的语义分割方法,利用透射电子显微镜图像自动量化人体骨骼肌中糖原在亚细胞区室的分布 | 提出结合两个注意力U-Net模型(区域模型和糖原模型)的互补框架,首次实现从TEM图像中自动预测亚细胞糖原定位,并将分析时间大幅缩短 | 模型基于有限样本(7名健康男性)训练,可能无法完全代表病理状态或不同肌肉类型的糖原分布特征;此外,手动标注的准确性可能影响模型性能 | 开发自动化工具以高通量、客观地量化骨骼肌亚细胞糖原分布,支持大规模代谢研究 | 人体骨骼肌活检组织中的糖原颗粒及其亚细胞区室(肌原纤维间、肌原纤维内区域包括A带、I带、Z盘以及线粒体) | 计算机视觉 | NA | NA | 注意力U-Net | 图像(透射电子显微镜图像) | 7名健康男性的骨骼肌活检,在正常、耗尽和糖原超补偿状态下采集 | NA | 注意力U-Net(两个互补模型:区域模型和糖原模型) | 偏差、变异系数、糖原体积密度与生化测量的一致性 | NA |
| 146 | 2026-06-19 |
All-optical doubly resonant cavities for energy-efficient ReLU function in nanophotonic deep learning
2026, PloS one
IF:2.9Q1
DOI:10.1371/journal.pone.0345850
PMID:42308233
|
研究论文 | 提出一种利用紧凑双共振腔实现全光学ReLU激活函数的方法 | 利用非线性过程实现全光学ReLU函数,设备面积比以往方法减小两个数量级,能实现飞焦级激活能量 | NA | 实现能效高、高密度的光学神经网络,用于下一代人工智能硬件 | 全光学双共振腔结构和非线性光学过程 | 机器学习 | NA | 光学非线性过程 | 神经网络 | 光学信号 | NA | NA | 双共振腔结构 | 分类准确率 | NA |
| 147 | 2026-06-19 |
Computer-aided diagnosis system for thoracic computed tomography of rib fractures in older emergency patients: A preliminary study
2026, PloS one
IF:2.9Q1
DOI:10.1371/journal.pone.0351988
PMID:42308243
|
研究论文 | 本研究探讨了基于深度学习的计算机辅助诊断系统在老年急诊患者胸部CT肋骨骨折检测中的应用价值 | 首次按年龄分组评估CAD系统在老年患者中的诊断效能,并与中青年组进行比较 | 未提供具体缺陷,但可从论文标题推断为初步研究 | 评估深度学习CAD系统在老年急诊患者肋骨骨折CT诊断中的价值 | 老年和中年/青年急诊患者 | 计算机视觉 | 肋骨骨折 | CT影像 | 深度学习 | CT图像 | 1012例胸外伤急诊患者 | NA | NA | 灵敏度,假阳性率,阅片时间 | NA |
| 148 | 2026-06-19 |
A lightweight CNN-transformer hybrid architecture with channel attention for real-time hazardous acoustic event detection
2026, Frontiers in artificial intelligence
IF:3.0Q2
DOI:10.3389/frai.2026.1824067
PMID:42311228
|
研究论文 | 提出一种轻量级CNN-Transformer混合架构,用于实时危险声学事件检测 | 融合通道注意力机制的轻量级CNN架构,实现资源受限环境下的高效危险声音分类 | 未提及其他噪声环境下的泛化性能或模型局限性 | 设计适用于边缘部署的实时危险声音检测轻量级深度学习模型 | 基于音频的危险声学信号(哭泣、狗叫、警报、爆炸、火灾、玻璃破碎、尖叫、武器相关声音等8类) | 机器学习和计算机视觉(音频分类) | 不适用 | 音频频谱图处理 | CNN-Transformer混合架构 | 音频(对数梅尔频谱图) | 8类危险声学数据,每类1000个音频样本,总计8000样本 | NA | TinyCNN(增强通道注意力的轻量级CNN主干网络) | 准确率、精确率、召回率、F1分数 | 适用于边缘端部署,具体资源未提及 |
| 149 | 2026-06-19 |
An integrated evolution-aware meta-learning framework with adversarial morphological augmentation for zero-day threat detections
2026, Frontiers in artificial intelligence
IF:3.0Q2
DOI:10.3389/frai.2026.1814012
PMID:42311231
|
研究论文 | 提出一种集成了进化感知元学习与对抗形态增强的零日威胁检测框架M3-GAZE | 将威胁检测形式化为进化推理问题,通过潜在形态谱提取、对抗进化生成对抗网络、元适应框架、不确定性校准层和因果进化图合成器五个创新组件实现零日攻击的高效检测 | 未明确说明局限性,可能包括对复杂实时环境的适应性、计算资源需求或模型可解释性验证的不足 | 克服传统威胁检测框架对静态模式匹配的依赖,提升对零日攻击的检测能力 | 零日威胁和进化攻击行为 | 机器学习 | NA | 生成对抗网络(GAN) | 生成对抗网络、元学习模型 | 威胁检测数据(包括网络流量、系统日志等形态数据) | 不详(基于进化任务生成合成样本,可能涉及小样本场景) | PyTorch | 对抗进化生成对抗网络(AE-GAN)、元适应框架(MAFTI) | 零日召回率、少样本适应性、不确定性校准、假阴性率 | NA |
| 150 | 2026-06-19 |
Leveraging deep learning and explainable AI for effective liver tumor classification from CT scan images
2026, Frontiers in oncology
IF:3.5Q2
DOI:10.3389/fonc.2026.1836325
PMID:42311265
|
研究论文 | 提出一种基于深度学习和可解释人工智能的肝肿瘤CT影像分类框架 | 将可解释AI与多种深度学习模型(ResNet50-v2、EfficientNetV2、Inception-v3、Vision Transformer ViT-16)结合,提升临床可信度 | 未提及 | 实现非侵入性肝肿瘤自动分类并增强模型可解释性 | CT扫描图像中的肝肿瘤 | 计算机视觉 | 肝癌 | 深度学习、可解释AI | CNN、Transformer | 图像 | 未提及 | NA | ResNet50-v2, EfficientNetV2, Inception-v3, Vision Transformer ViT-16 | 准确率 | NA |
| 151 | 2026-06-19 |
Automated HER2 Scoring with Uncertainty Quantification Using Lensfree Holography and Deep Learning
2026, BME frontiers
IF:5.0Q1
DOI:10.34133/bmef.0278
PMID:42311971
|
研究论文 | 利用无透镜全息术与深度学习开发自动化HER2评分系统 | 集成无透镜全息术与贝叶斯蒙特卡洛dropout不确定性量化,实现低成本、高通量的自动化HER2评分 | 未提及具体局限性 | 开发用于乳腺癌HER2评分的自动化系统 | 免疫组化染色的乳腺癌组织切片 | 数字病理学 | 乳腺癌 | 无透镜全息术 | 卷积神经网络 | 图像 | 412个独特组织样本 | NA | 贝叶斯蒙特卡洛dropout | 准确率(4类84.9%,二分类94.8%)、不确定性量化 | NA |
| 152 | 2026-06-19 |
Large language model assisted decision support framework for uncertainty aware detection and management of tomato lateral shoots
2026, Frontiers in plant science
IF:4.1Q1
DOI:10.3389/fpls.2026.1853269
PMID:42312082
|
研究论文 | 提出一种集成深度学习感知与大语言模型的番茄侧枝检测与修剪决策支持框架 | 首次将YOLOv8n实例分割模型与CBAM注意力机制、蒙特卡洛Dropout不确定性估计及大语言模型推理结合,构建端到端的番茄侧枝不确定性感知修剪决策管道 | 未提及在真实温室环境中与人工修剪的对比实验,且大语言模型仅提供决策辅助而非直接控制执行 | 开发一种可靠的番茄侧枝检测与修剪决策支持系统,解决温室复杂光照、叶片遮挡和形态变异导致的检测可靠性问题 | 温室环境下的番茄侧枝 | 计算机视觉, 自然语言处理 | NA | RGB成像, 深度学习, 大语言模型 | 深度学习模型, 大语言模型 | 图像 | 番茄侧枝RGB图像数据集 | PyTorch | YOLOv8n-seg, CBAM, Monte Carlo Dropout, LLM | mAP, 参数量, 平均推理时间 | NA |
| 153 | 2026-06-19 |
Deep Learning for Brain Tumour Analysis: A Systematic Review of CNN-Transformer Hybrids in Multimodal Imaging
2026, International journal of biomedical imaging
IF:3.3Q2
DOI:10.1155/ijbi/4763936
PMID:42312286
|
论文综述 | 系统综述和荟萃分析评估CNN-Transformer混合架构在脑肿瘤检测中的应用,重点关注局部与全局特征学习的整合、诊断准确性和计算效率 | 提出了CNN-Transformer混合架构的三种集成范式(顺序、并行、分层),并通过标准化GigaFLOPs计算效率,系统比较了不同架构的诊断准确率和计算开销 | 存在发表偏倚(Egger检验p=0.043),亚组分析因样本量不足(每组少于10篇)而无法进行正式荟萃分析,混合模型在低级别胶质瘤中准确率从94.6%降至88.3%,对高斯噪声的敏感性是CNN模型的2.3倍 | 评估CNN-Transformer混合架构在脑肿瘤检测中的诊断准确性和计算效率,并分析GANs和多模态影像融合的作用 | 脑肿瘤检测方法(包括CNN-only、Transformer-only和CNN-Transformer混合模型) | 计算机视觉 | 脑肿瘤 | 医学影像(MRI、PET等) | CNN-Transformer混合模型 | 医学影像 | 94篇符合纳入标准的研究 | 未明确提及 | CNN, Transformer, CNN-Transformer混合架构 | 诊断准确率, 计算效率(GigaFLOPs), 推理时间 | 基于BraTS基准(240×240×155体素)标准化的GigaFLOPs计算 |
| 154 | 2026-06-19 |
Deep learning-based autonomous retinal vein cannulation in ex vivo porcine eyes
2025-12-17, Science robotics
IF:26.1Q1
DOI:10.1126/scirobotics.adw2969
PMID:41406252
|
研究论文 | 提出一种基于深度学习与计算机视觉的自主视网膜静脉穿刺工作流程,并在离体猪眼上验证其效果 | 利用深度学习预测针头运动方向及识别接触与穿刺事件,结合两台稳手眼机器人实现自主手术操作,在动态眼动条件下仍保持高成功率 | 仅在离体猪眼上测试,且模拟的眼动可能无法完全代表真实临床中呼吸等复合因素对眼球运动的影响 | 实现视网膜静脉穿刺关键步骤的自主化,提升手术精准性与可靠性 | 离体猪眼及其模拟呼吸运动的动态模型 | 计算机视觉, 机器人控制 | 视网膜静脉阻塞 | 术中光学相干断层扫描 | 卷积神经网络 | 图像 | 20只离体猪眼用于静态实验,6只用于动态模拟眼动实验 | PyTorch | CNN | 成功率 | NA |
| 155 | 2026-06-19 |
NeuroFusionNet: a hybrid EEG feature fusion framework for accurate and explainable Alzheimer's Disease detection
2025-12-15, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-28070-x
PMID:41398345
|
研究论文 | 提出NeuroFusionNet混合深度学习框架,融合手工特征与1D-CNN时序特征,用于基于脑电图(EEG)的阿尔茨海默病准确且可解释检测 | 首次将手工特征与1D-CNN潜在时间嵌入特征融合,并结合Pearson相关系数、粒子群优化(PSO)进行特征选择,主成分分析(PCA)降维及SMOTE类别平衡,同时使用SHAP和Grad-CAM实现模型解释性 | 仅基于三个公开EEG数据集验证,未涉及真实临床多中心数据;模型在低资源场景下的泛化能力需要进一步评估 | 开发一种准确、可解释且高效的基于EEG的阿尔茨海默病检测方法,实现早期诊断并支持临床部署 | 阿尔茨海默病及相关痴呆症患者,通过EEG信号进行二分类检测 | 机器学习 | 阿尔茨海默病 | 脑电图(EEG) | 混合深度学习框架(1D-CNN + 深度神经网络) | EEG时间序列信号 | 三个公开数据集:OpenNeuro ds004504(闭眼)、OpenNeuro ds006036(睁眼)及独立OSF数据集,具体样本数未在摘要中明确 | NA | 1D-CNN、五层深度神经网络 | 准确率(94.27%)、宏F1分数(0.94)、标准差(SD<0.3%)、推理时间(6.5ms每样本)、模型参数(0.94M)、内存占用(4.1MB) | 无需GPU支持,可在标准临床CPU上实时部署 |
| 156 | 2026-06-19 |
Automatic specific absorption rate (SAR) prediction for hyperthermia treatment planning using deep learning method
2025-12, International journal of hyperthermia : the official journal of European Society for Hyperthermic Oncology, North American Hyperthermia Group
IF:3.0Q2
DOI:10.1080/02656736.2025.2554860
PMID:40922671
|
research paper | 提出一种基于深度学习的快速准确比吸收率预测方法,用于支撑脑癌患者热疗计划制定 | 采用编码器-解码器神经网络结合交叉注意力块,首次实现从脑电特性、肿瘤坐标和天线相位快速预测比吸收率分布,将计算时间从10分钟缩短至4秒 | NA | 实现实时热疗计划中比吸收率分布的快速准确预测,支持自适应治疗策略 | 人体头部模型中的比吸收率分布 | machine learning | brain cancer | NA | encoder-decoder neural network | simulation data | 201个仿真样本,其中20个用于测试 | NA | encoder-decoder with cross-attention blocks | root-mean-squared error, mean absolute error, structural similarity index | NA |
| 157 | 2026-06-19 |
Deep domain adaptation eliminates costly data required for task-agnostic wearable robotic control
2025-11-19, Science robotics
IF:26.1Q1
DOI:10.1126/scirobotics.ads8652
PMID:41259448
|
研究论文 | 提出一种深度域自适应框架,通过生物力学模型的模拟传感器克服可穿戴机器人控制中的数据稀缺问题 | 利用模拟传感器作为过渡域,将易获取数据转化为数据稀缺域的有效数据,实现无标签或无设备特定数据下的任务无关可穿戴机器人控制 | 无法从摘要中提取明确限制,可能包括对模拟传感器精度的依赖及泛化能力的潜在限制 | 解决可穿戴机器人控制中数据驱动的个性化需求与高质量设备特定数据获取困难之间的矛盾 | 髋/膝外骨骼及其控制力矩估计器 | 机器学习 | NA | 深度域自适应 | 深度域自适应网络 | 模拟传感器数据、开放数据集、未标记外骨骼数据 | 8名参与者(外骨骼实时控制部署) | PyTorch | 深度域自适应网络 | 误差(Nm/kg)、代谢成本降低百分比 | NA |
| 158 | 2026-06-19 |
How Can Clinicians Leverage Vibe Coding for Machine Learning and Deep Learning Research?
2025-10, Endocrinology and metabolism (Seoul, Korea)
DOI:10.3803/EnM.2025.2675
PMID:41208262
|
综述 | 探讨临床医生如何利用‘氛围编码’工具和方法进行机器学习和深度学习研究 | 提出‘氛围编码’概念,定义其工作流程,分类现有工具,并通过实例展示其降低编程门槛的潜力 | 未提供定量比较不同工具的性能或验证其在复杂医学任务中的有效性 | 帮助缺乏编程技能的临床医生开展机器学习和深度学习研究 | 机器学习和深度学习研究中的‘氛围编码’工具及应用 | 人工智能与医学 | NA | NA | NA | 文本、代码 | NA | TensorFlow, PyTorch, Keras, Scikit-learn | NA | NA | NA |
| 159 | 2026-06-19 |
Street view images help to reveal the impact of noisy environments on the survival duration of stroke patients
2025-09-26, International journal of health geographics
IF:3.0Q2
DOI:10.1186/s12942-025-00416-8
PMID:41013534
|
研究论文 | 利用街景图像和深度学习模型揭示噪声环境对脑卒中患者生存期的影响 | 首次使用街景图像结合多模态深度学习模型评估住宅噪声水平,并探讨噪声对脑卒中死亡率的年龄组和社会经济差异 | 未提及研究局限 | 研究道路交通噪声对脑卒中患者死亡率的年龄组和社会经济差异影响 | 辽宁省阜新市2011-2019年间住院的36240名脑卒中患者 | 机器学习 | 脑卒中 | NA | 多模态深度学习模型 | 街景图像 | 36240名脑卒中住院患者 | NA | 多模态深度学习模型 | 风险比(HR)、95%置信区间(CI)、p值、人口归因分数 | NA |
| 160 | 2026-06-19 |
3D Deep Learning for Virtual Orbital Defect Reconstruction: A Precise and Automated Approach
2025-09-01, The Journal of craniofacial surgery
IF:1.0Q3
DOI:10.1097/SCS.0000000000011143
PMID:39960444
|
研究论文 | 提出一种改进的3D U-Net+++架构用于虚拟眼眶缺损重建,实现高精度和自动化 | 首次采用改进的3D U-Net+++架构处理涉及中线两侧的眼眶缺损,克服传统镜像技术的局限性,并实现完全自动化 | 仅基于CT扫描数据,未涉及其他影像模态;临床验证样本量较小(仅15例) | 开发精确自动化的虚拟眼眶缺损重建方法以辅助术前规划 | 眼眶缺损(包括合成缺损和临床骨折病例)的虚拟重建 | 计算机视觉 | 眼眶骨折 | CT扫描 | 3D U-Net+++ | 图像(CT扫描) | 300个合成缺损(来自颅骨螺旋CT扫描)和15例临床眼眶骨折病例 | NA | 3D U-Net+++ | Hausdorff距离(HD95)、平均对称表面距离(ASSD)、表面Dice相似系数(Surface DSC)、峰值信噪比(PSNR)、结构相似性指数(SSIM)、5点Likert量表评分 | NA |