本数据库通过收集和整理最新科研文献信息而得,供了解领域前沿进展之用。数据源自 PubMed Data ,每日自动更新(使用关键词“['deep learning']”过滤),已收录文献数量参见 统计表格。表格内容由 GPT 自动整理,可能存在错误或遗漏,请使用时务必注意核实!
如有建议或合作意向,欢迎联系 linlin.yan(AT)bioinfo.app 或 微信 yanlinlin82。本项目遵循 MIT 许可 发布,欢迎下载 源码 自行修改使用。如觉得不错,还请不吝 给我打赏,你的支持是我继续创新的重要动力!


除通过在线浏览外,为方便用户离线查阅,本站也提供 付费下载(定价19.9元)。之所以考虑收费,是因为批量扫描这些文献并整理也是有一定成本的,还请理解并多多支持。本站数据会持续更新,而仅需一次付费,未来就可以随时重新下载到最新版本数据。
| 序号 | 推送日期 | 文章 | 类型 | 简述 | 创新点 | 不足 | 研究目的 | 研究对象 | 领域 | 病种 | 技术 | 模型 | 数据类型 | 样本量 | 算法框架 | 模型架构 | 性能指标 | 计算资源 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 11761 | 2025-11-12 |
Image fusion using Y-net-based extractor and global-local discriminator
2024-May-30, Heliyon
IF:3.4Q1
DOI:10.1016/j.heliyon.2024.e30798
PMID:38784534
|
研究论文 | 提出一种基于Y-Net和全局-局部判别器的GAN模型用于红外与可见光图像融合 | 采用Y-Net作为生成器主干架构,引入残差密集块和跨模态上下文注意力捷径,结合全局-局部判别器实现无融合规则的端到端图像融合 | NA | 解决多模态图像融合中特征提取和信息保真度的挑战 | 红外图像与可见光图像 | 计算机视觉 | NA | 图像融合技术 | GAN | 图像 | NA | NA | Y-Net, RDblock, CMSCA, PatchGAN | 结构相似性指数, 强度相似性, 梯度相似性 | NA |
| 11762 | 2025-11-12 |
Beyond here and now: Evaluating pollution estimation across space and time from street view images with deep learning
2023-Dec-10, The Science of the total environment
DOI:10.1016/j.scitotenv.2023.166168
PMID:37586538
|
研究论文 | 本研究使用深度学习从街景图像评估空气污染和噪声的时空分布 | 首次系统评估基于图像的污染模型在时空维度上的泛化能力,特别是在基础设施有限的中低收入国家 | 模型在未见过的地点表现下降,需要与传统传感器网络集成以提高鲁棒性 | 开发能够从街景图像推断细颗粒物和噪声水平的时空可泛化模型 | 加纳阿克拉市的空气污染(PM)和噪声水平 | 计算机视觉 | NA | 街景图像分析 | CNN | 图像 | 超过160万张图像,在145个代表性地点收集,持续15个月 | NA | 卷积神经网络 | 准确率 | NA |
| 11763 | 2025-11-12 |
Phenotyping urban built and natural environments with high-resolution satellite images and unsupervised deep learning
2023-Oct-01, The Science of the total environment
DOI:10.1016/j.scitotenv.2023.164794
PMID:37315611
|
研究论文 | 提出一种无监督深度聚类方法,利用高分辨率卫星图像对城市建成和自然环境进行表型分类 | 开发新型无监督深度聚类方法,仅通过卫星图像即可捕捉城市环境的多维特征,无需传统环境与人口数据 | 基于组合特征的聚类结果对空间尺度和聚类数量选择敏感 | 实现城市建成和自然环境的实时监测与可持续发展追踪 | 加纳阿克拉市的高分辨率卫星图像(0.3米/像素) | 计算机视觉 | NA | 卫星遥感成像 | 无监督深度学习 | 卫星图像 | 加纳阿克拉市全域高分辨率卫星图像 | NA | 深度聚类 | 聚类稳健性, 可解释性 | NA |
| 11764 | 2025-11-12 |
Do poverty and wealth look the same the world over? A comparative study of 12 cities from five high-income countries using street images
2023, EPJ data science
IF:3.0Q1
DOI:10.1140/epjds/s13688-023-00394-6
PMID:37293269
|
研究论文 | 利用街景图像和深度学习比较五个高收入国家12个城市中贫困与富裕社区视觉特征的相似性 | 首次通过跨城市跨国比较分析揭示贫困社区视觉特征比富裕社区更具城市独特性 | 研究仅涵盖高收入国家城市,未包括中低收入国家城市 | 探究不同城市和国家间贫困与富裕社区视觉环境的相似程度 | 12个高收入城市的社区街景图像 | 计算机视觉 | NA | 街景图像分析 | 深度学习 | 图像 | 720万张街景图像,覆盖12个城市8500万人口 | NA | NA | NA | NA |
| 11765 | 2025-11-12 |
Convolutional Neural Network Models Combined with Kansei Engineering in Product Design
2023, Computational intelligence and neuroscience
DOI:10.1155/2023/2572071
PMID:36864929
|
研究论文 | 本研究结合卷积神经网络与感性工学,提出了一种能够满足用户感知需求的产品设计方法 | 首次将CNN模型与感性工学理论相结合,建立了产品设计的感知评价系统,提升了产品设计感知信息的逻辑深度 | 仅以电子秤作为研究案例,缺乏对其他产品类型的验证 | 开发能够满足用户感知需求的产品设计方法,提升产品市场竞争力 | 产品设计造型,特别是电子秤的外观设计 | 计算机视觉 | NA | 图像识别 | CNN | 图像 | NA | NA | 卷积神经网络 | NA | NA |
| 11766 | 2025-11-12 |
Characterisation of urban environment and activity across space and time using street images and deep learning in Accra
2022-11-28, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-022-24474-1
PMID:36443345
|
研究论文 | 利用街景图像和深度学习技术分析加纳阿克拉城市环境特征与人类活动的时空模式 | 首次在非洲城市阿克拉构建大规模时间序列街景图像数据集,并开发针对当地环境特征的物体检测模型 | 仅覆盖145个采样点,手动标注样本数量有限(1250张图像),可能无法完全代表整个城市区域的多样性 | 通过智能感知和分析方法研究城市环境特征对健康、宜居性、安全性和可持续性的影响 | 加纳阿克拉大都会区的城市环境和人类活动 | 计算机视觉 | NA | 街景图像采集、迁移学习、数据增强 | CNN | 图像 | 210万张延时摄影图像(日夜),其中1250张手动标注 | NA | 卷积神经网络 | NA | NA |
| 11767 | 2025-11-12 |
A Lightweight Hybrid Dilated Ghost Model-Based Approach for the Prognosis of Breast Cancer
2022, Computational intelligence and neuroscience
DOI:10.1155/2022/9325452
PMID:39262920
|
研究论文 | 提出一种基于轻量级混合扩张Ghost模型的乳腺癌预后方法,实现恶性细胞检测和家族分类 | 采用改进的随机通道注意力机制和DenseNet模型,结合轻量级深度学习架构,在保持高精度的同时满足严格的执行、训练和能耗限制 | NA | 开发自动化的乳腺癌恶性细胞检测和家族分类系统 | 数字乳腺X线摄影图像中的肿瘤 | 计算机视觉 | 乳腺癌 | 数字乳腺X线摄影 | CNN, DenseNet | 图像 | NA | NA | Ghost模型, DenseNet | 准确率 | NA |
| 11768 | 2025-11-12 |
Pneumonia Detection in Chest X-Ray Images Using Enhanced Restricted Boltzmann Machine
2022, Journal of healthcare engineering
DOI:10.1155/2022/1678000
PMID:35991297
|
研究论文 | 提出一种增强型受限玻尔兹曼机模型用于胸部X射线图像中的肺炎检测 | 通过计算特定特征向量均值与所有输入特征均值的差异来改进权重初始化方法,解决了标准RBM随机权重初始化导致的特征学习不充分问题 | NA | 开发更准确的肺炎自动检测方法 | 胸部X射线图像 | 计算机视觉 | 肺炎 | NA | 受限玻尔兹曼机 | 图像 | 三个不同的肺炎数据集 | NA | 增强型受限玻尔兹曼机 | 准确率, 灵敏度, 特异性, F1分数, ROC曲线 | NA |
| 11769 | 2025-11-12 |
A Method for Extracting Building Information from Remote Sensing Images Based on Deep Learning
2022, Computational intelligence and neuroscience
DOI:10.1155/2022/9968665
PMID:36275958
|
研究论文 | 提出一种基于深度学习的遥感图像建筑物信息提取方法,结合DeepLabv3+与Mixconv2d提升轮廓捕捉能力 | 将DeepLabv3+与Mixconv2d结合,使用不同尺寸卷积核进行特征识别,并采用基于Rdrop Loss的正则化方法 | 基于自建数据集验证,未与其他公开数据集进行对比验证 | 提高遥感图像中建筑物信息提取的精度和效率 | 遥感图像中的建筑物 | 计算机视觉 | NA | 遥感成像 | 深度学习,语义分割 | 遥感图像 | 自建数据集(具体数量未说明) | NA | DeepLabv3+,Mixconv2d | 准确率,效率,分割性能 | NA |
| 11770 | 2025-11-12 |
Food Image Recognition and Food Safety Detection Method Based on Deep Learning
2021, Computational intelligence and neuroscience
DOI:10.1155/2021/1268453
PMID:34956342
|
研究论文 | 提出基于深度学习的食品图像识别和食品安全检测方法 | 结合Tiny-YOLO和孪生网络提出YOLO-SIMM两阶段学习模式,设计YOLO-SiamV1和YOLO-SiamV2两个版本 | 识别精度一般 | 解决食品识别领域复杂度高、识别精度和速度不足的问题 | 食品图像和食品中异物 | 计算机视觉 | NA | 阈值分割技术 | CNN | 图像 | NA | NA | Tiny-YOLO, 孪生网络 | 识别精度 | NA |
| 11771 | 2025-11-11 |
Enhancing Dental Caries Classification with Adversarial Training on Bitewing Radiographs
2025-Nov-10, Journal of imaging informatics in medicine
DOI:10.1007/s10278-025-01737-7
PMID:41212346
|
研究论文 | 本研究通过将投影梯度下降对抗训练应用于ResNet模型,提升咬翼片X光影像中龋齿分类的准确性和鲁棒性 | 首次将投影梯度下降对抗训练技术应用于龋齿分类任务,通过引入轻微扰动增强数据集,显著提升模型性能 | 仅使用单一类型影像数据(咬翼片X光),未考虑其他影像模态;模型性能仍有提升空间 | 提高基于深度学习的龋齿分类模型的准确性和鲁棒性 | 咬翼片X光影像中的龋齿病变 | 计算机视觉 | 龋齿 | X光影像分析 | CNN | 医学影像 | NA | NA | ResNet-50 | 准确率, 敏感度, 特异性 | NA |
| 11772 | 2025-11-11 |
OralSegNet: An Approach to Early Detection of Oral Disease Using Transfer Learning
2025-Nov-09, Oral diseases
IF:2.9Q1
DOI:10.1111/odi.70135
PMID:41207876
|
研究论文 | 提出基于深度学习的口腔疾病早期检测分割系统OralSegNet,使用YOLOv11架构变体从口腔内摄影图像中自动检测和定位口腔疾病 | 首次将YOLOv11架构的三个变体应用于口腔疾病分割任务,采用渐进式数据集增强策略解决类别不平衡问题,并开发了完全客户端响应的Web应用 | 数据集规模相对较小(582张初始图像),模型性能仍有提升空间(mAP@50约0.5),使用免费计算资源可能限制模型复杂度 | 开发自动化口腔疾病检测和定位系统,实现口腔疾病的早期发现 | 口腔内摄影图像中的口腔疾病病变区域 | 计算机视觉 | 口腔疾病 | 深度学习分割 | YOLO | 图像 | 初始582张像素级标注图像,通过数据增强扩展到v2和v3版本 | PyTorch, ONNX Runtime Web | YOLOv11n-seg, YOLOv11s-seg, YOLOv11m-seg | box mAP@50, mask mAP@50 | Google Colab免费版(Intel Xeon CPU, 13GB RAM, T4 GPU 15GB, 120GB存储) |
| 11773 | 2025-11-11 |
Rapid consistent reef surveys with DeepReefMap
2025-Nov-07, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-20795-z
PMID:41203649
|
研究论文 | 介绍使用DeepReefMap进行快速珊瑚礁调查的创新方法,通过神经网络实现3D语义映射 | 首次在红海进行大规模跨国珊瑚礁调查,开发了基于深度学习的实用3D水下测绘和语义分割系统 | NA | 开发高效、标准化、可扩展且经济的珊瑚礁监测策略 | 红海珊瑚礁生态系统 | 计算机视觉 | NA | 水下摄像技术 | 神经网络 | 视频 | 365个视频样带,来自45个地点,184小时视频素材,200,000个标注多边形 | NA | NA | 鲁棒性评估 | NA |
| 11774 | 2025-11-11 |
A hybrid approach leveraging meta-heuristic and ensemble learning for time-sensitive prediction of pollutant concentrations
2025-Nov-07, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-23940-w
PMID:41203671
|
研究论文 | 提出一种结合元启发式算法和集成学习的混合深度学习模型,用于污染物浓度的时间敏感预测 | 首次将爬行动物搜索算法(RSA)与CNN、LSTM和XGBoost集成,通过特征优化和重要性评分提升预测性能 | 研究仅针对印度城市环境,未验证在其他地理区域的适用性 | 开发高精度的污染物浓度预测模型,支持空气质量长期预报 | 大气污染物包括PM2.5、CO、SO2和NO2 | 机器学习 | NA | 时间序列分析 | CNN, LSTM, XGBoost, RSA | 时间序列数据 | NA | NA | CNN, LSTM, Transformer, BiLSTM, BiRNN, ANN, BiGRU | 准确率, 鲁棒性, 误差指标, R²分数 | NA |
| 11775 | 2025-11-11 |
Deep learning models simultaneously trained on multiple datasets improve base-editing activity prediction
2025-Nov-07, Nature communications
IF:14.7Q1
DOI:10.1038/s41467-025-65200-5
PMID:41203686
|
研究论文 | 通过同时训练多个数据集的深度学习模型提高碱基编辑活性预测准确性 | 首次开发能够同时训练多个不同数据集的深度学习模型,并支持数据集感知预测 | NA | 提高CRISPR碱基编辑系统中gRNA设计的准确性 | 碱基编辑gRNA效率预测 | 机器学习 | NA | CRISPR碱基编辑技术 | 深度神经网络 | gRNA序列数据 | 约20,000个gRNAs(包含A•T to G•C和C•G to T•A转换) | NA | 深度神经网络 | NA | NA |
| 11776 | 2025-11-11 |
Task optimized vision transformer for diabetic retinopathy detection and classification in resource constrained early diagnosis settings
2025-Nov-07, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-25399-1
PMID:41203681
|
研究论文 | 提出一种任务优化的视觉Transformer模型,用于资源受限环境下的糖尿病视网膜病变检测和分类 | 设计了专门针对糖尿病视网膜病变的任务优化视觉Transformer模型,集成了分层学习率调度、注意力头调优和嵌入维度优化策略,并通过结构化剪枝和8位量化实现模型压缩 | 研究主要针对资源受限环境,可能在更复杂临床场景下的泛化能力需要进一步验证 | 开发适用于资源受限早期诊断环境的糖尿病视网膜病变自动检测和分类系统 | 糖尿病视网膜病变患者的视网膜眼底图像 | 计算机视觉 | 糖尿病视网膜病变 | 深度学习 | Vision Transformer | 图像 | 三个大规模公共数据集 | NA | Task-Optimized Vision Transformer (TOViT) | 准确率, F1分数 | 树莓派4硬件, 支持实时部署 |
| 11777 | 2025-11-11 |
Improving surgical phase recognition using self-supervised deep learning
2025-Nov-07, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-23697-2
PMID:41203699
|
研究论文 | 本研究探索自监督学习在垂体内窥镜手术阶段识别中的应用,通过比较SimCLR和BYOL框架的性能 | 首次将自监督学习应用于内窥镜垂体手术阶段识别,并引入注意力加权池化算子增强空间特征提取 | 仅针对垂体内窥镜手术进行验证,未在其他手术类型中测试泛化能力 | 开发智能系统为外科医生提供实时决策支持,通过手术阶段识别改善工作流程 | 内窥镜垂体手术视频数据 | 计算机视觉 | 垂体疾病 | 自监督学习 | 深度学习 | 手术视频 | 未明确具体样本数量,但涉及完整数据集和50%标注数据缩减的对比实验 | SimCLR, BYOL | 集成注意力加权池化算子的深度神经网络 | F1-score | NA |
| 11778 | 2025-11-11 |
Multi-output deep learning for high-frequency prediction of air and surface temperature in Kuwait
2025-Nov-07, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-23455-4
PMID:41203707
|
研究论文 | 本研究评估多输出回归模型在科威特使用高频气候数据预测空气和地表温度的性能 | 首次将基于上下文嵌入的Transformer(FTTransformer)和LSTM应用于高频温度预测,并实现六种温度变量的同时预测 | LSTM模型在处理往年异常数据时性能下降,而FTTransformer在不同年份间保持稳定准确性 | 开发高精度的高频空气和地表温度预测模型,用于城市规划和气候韧性建设 | 科威特地区的空气和地表温度及相关气候变量 | 机器学习 | NA | 高频气候数据采集 | Transformer, LSTM, 传统机器学习 | 时间序列气候数据 | 四年内每5分钟采集的高频气候数据,包含30个环境变量 | NA | FTTransformer, LSTM | R², 均方误差, 平均绝对误差 | NA |
| 11779 | 2025-11-11 |
Unsupervised spectra information extraction using physics-informed neural networks in the presence of non-linearities and multi-agent problems
2025-Nov-07, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-25573-5
PMID:41203763
|
研究论文 | 提出一种基于物理信息神经网络的无监督光谱信息提取方法,适用于非线性和多智能体问题 | 将物理信息深度学习从简单线性情况推广到非线性和多智能体场景,扩展了该方法的适用范围 | 目前仅在合成案例上进行测试,尚未在真实场景中验证 | 开发无需监督学习的光谱信息提取方法 | 光谱数据 | 机器学习 | NA | 光谱分析 | 物理信息神经网络 | 光谱数据 | NA | NA | 物理信息神经网络 | 灵敏度, 特异性, 可靠性 | NA |
| 11780 | 2025-11-11 |
Automated inspection of P&ID object recognition using deep learning
2025-Nov-07, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-25506-2
PMID:41203750
|
研究论文 | 提出一种基于深度学习的P&ID图纸对象识别结果自动检测方法 | 针对未识别对象和误识别对象分别开发了不同的检测方法,包括基于深度学习的特征向量相似度计算、基于距离的文本错误检测和交叉情况检查的线条错误检测 | NA | 提高P&ID图纸数字化过程中对象识别结果的准确性和检测效率 | 管道仪表流程图(P&ID)中的符号、文本和线条对象 | 计算机视觉 | NA | 深度学习 | CNN | 工程图纸图像 | 来自实际工业现场的P&ID图纸 | NA | NA | 召回率, 准确率, F1分数 | NA |