本数据库通过收集和整理最新科研文献信息而得,供了解领域前沿进展之用。数据源自 PubMed Data ,每日自动更新(使用关键词“['deep learning']”过滤),已收录文献数量参见 统计表格。表格内容由 GPT 自动整理,可能存在错误或遗漏,请使用时务必注意核实!
如有建议或合作意向,欢迎联系 linlin.yan(AT)bioinfo.app 或 微信 yanlinlin82。本项目遵循 MIT 许可 发布,欢迎下载 源码 自行修改使用。如觉得不错,还请不吝 给我打赏,你的支持是我继续创新的重要动力!


除通过在线浏览外,为方便用户离线查阅,本站也提供 付费下载(定价19.9元)。之所以考虑收费,是因为批量扫描这些文献并整理也是有一定成本的,还请理解并多多支持。本站数据会持续更新,而仅需一次付费,未来就可以随时重新下载到最新版本数据。
| 序号 | 推送日期 | 文章 | 类型 | 简述 | 创新点 | 不足 | 研究目的 | 研究对象 | 领域 | 病种 | 技术 | 模型 | 数据类型 | 样本量 | 算法框架 | 模型架构 | 性能指标 | 计算资源 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 2026-03-10 |
DAUS-Net: Toward Ultrasound Scanner-Agnostic Domain Generalized Robust and Accurate Segmentation
2026-May, Ultrasonic imaging
IF:2.5Q2
DOI:10.1177/01617346251388454
PMID:41449845
|
研究论文 | 本文提出了一种名为DAUS-Net的超声图像分割网络,旨在实现与超声扫描设备无关的、鲁棒且准确的乳腺肿瘤分割 | 将深度频率滤波模块集成到U-Net架构中,并在潜在空间进行自适应频率成分选择,同时用实例归一化替代批量归一化以移除设备相关的风格特征,从而提升模型对不同超声设备的泛化能力 | 研究仅针对乳腺肿瘤分割任务在三个公共数据集上进行了验证,尚未在更多疾病类型或更大规模的临床数据中测试其泛化性能 | 开发一种不依赖于特定超声扫描设备的通用分割模型,以降低模型部署成本并解决医疗影像中数据采集昂贵的问题 | 超声图像中的乳腺肿瘤 | 数字病理 | 乳腺癌 | 超声成像 | CNN | 图像 | 三个公共数据集(具体样本数未在摘要中说明) | 未明确说明 | U-Net(集成深度频率滤波模块) | Dice系数 | NA |
| 2 | 2026-03-10 |
Explainable AI in Cardiology Diagnostics: A Systematic Review of Machine Learning, Meta-heuristic Optimization, and Clinical Text Mining for Coronary Artery Disease
2026-May, International journal of medical informatics
IF:3.7Q2
DOI:10.1016/j.ijmedinf.2026.106321
PMID:41653696
|
综述 | 本文系统综述了机器学习、元启发式优化和临床文本挖掘等人工智能方法在冠状动脉疾病诊断中的应用 | 整合了机器学习、自然语言处理、元启发式优化和可解释人工智能等多种AI方法,并系统评估了它们在CAD诊断中的性能与临床适用性 | 纳入研究临床验证有限,数据稀缺,缺乏标准化、以临床医生为中心的可解释性评估,且外部验证不足 | 旨在识别CAD诊断中最常用的AI模型,评估其性能,并探索可解释性和优化如何提升临床实用性 | 冠状动脉疾病(CAD) | 自然语言处理, 机器学习 | 心血管疾病 | 机器学习, 自然语言处理, 元启发式优化, 可解释人工智能 | 深度学习模型, Transformer模型 | 文本, 基准数据集 | 61项研究 | NA | BioBERT, ClinicalBERT | 准确率 | 需要大量计算资源 |
| 3 | 2026-03-10 |
Learning with less: A survey of deep learning in medical imaging under varying supervision levels
2026-May, Artificial intelligence in medicine
IF:6.1Q1
DOI:10.1016/j.artmed.2026.103375
PMID:41702310
|
综述 | 本文系统综述了医学影像分析中在不同监督水平下应用的深度学习方法 | 首次根据监督水平(无监督、不精确监督、不完全监督、不准确监督和有限监督)对医学影像深度学习方法进行系统性分类和综述,并细分子类别 | 作为综述文章,不涉及具体实验验证,主要基于现有文献进行归纳总结 | 梳理和总结医学影像分析中在不同监督水平下的深度学习方法,探讨未来研究方向 | 医学影像分析领域的深度学习方法和相关数据集 | 医学影像分析 | NA | 深度学习 | NA | 医学影像 | NA | NA | NA | NA | NA |
| 4 | 2026-03-10 |
A Character-level Convolutional Recurrent Interaction Network for joint traditional Chinese medicine clinical named entity recognition and relation extraction
2026-May, Artificial intelligence in medicine
IF:6.1Q1
DOI:10.1016/j.artmed.2026.103372
PMID:41707487
|
研究论文 | 本文提出了一种用于联合中医临床命名实体识别与关系抽取的字符级卷积循环交互网络 | 将中医四诊维度视为关系,并整合字符嵌入与字符间上下文卷积特征向量来捕获古汉语语义信息,通过多任务动态交互联合抽取实体与关系 | 未明确提及模型在更大规模或更复杂中医病历数据集上的泛化能力 | 进一步结构化和建模中医医疗数据,实现中医临床命名实体识别与关系抽取 | 中医电子病历 | 自然语言处理 | NA | NA | CNN, LSTM, 自注意力机制 | 文本 | NYT数据集和TCM-cases数据集 | NA | 字符级卷积循环交互网络 | NA | NA |
| 5 | 2026-03-10 |
GFASNet: Gait feature attention-driven deep sequential network for dementia-related gait pattern analysis
2026-May, Artificial intelligence in medicine
IF:6.1Q1
DOI:10.1016/j.artmed.2026.103377
PMID:41713110
|
研究论文 | 本研究提出了一种名为GFASNet的步态特征注意力驱动深度序列网络,用于分析痴呆相关的步态模式 | 将特征级注意力机制整合到序列深度学习架构中,以增强模型透明度并量化个体步态参数的相对贡献,从而识别潜在的数字化生物标志物 | 未明确说明模型在外部验证集上的泛化能力,且样本量相对有限(232名参与者) | 通过深度学习模型识别痴呆相关的步态改变,并提高模型的可解释性 | 232名参与者在压力传感器步道上进行自由行走测试的步态数据 | 机器学习 | 老年疾病 | 压力传感器步道采集 | LSTM, BiLSTM, GRU, BiGRU | 时空步态序列数据 | 232名参与者 | NA | GFASNet(基于LSTM、BiLSTM、GRU、BiGRU的四种变体) | 分类任务性能(具体指标未明确说明) | NA |
| 6 | 2026-03-10 |
Identification of roasting degree and interpretability analysis of Yunnan arabica coffee beans based on multi-dimensional visual features and CNNs-SHAP
2026-Apr-15, Food chemistry
IF:8.5Q1
DOI:10.1016/j.foodchem.2026.148367
PMID:41672011
|
研究论文 | 本研究通过融合多维视觉特征与CNN-SHAP方法,实现了云南阿拉比卡咖啡豆烘焙度的准确识别与可解释性分析 | 首次将CIE L*a*b*颜色直方图、GLCM-LBP复合纹理和形态参数进行加权融合,并结合SHAP方法打破深度学习黑箱限制,为咖啡烘焙标准化提供可解释技术 | 未明确说明样本的具体来源批次和采集条件,外部验证样本规模未详细说明 | 实现咖啡豆烘焙度的自动化识别与决策过程透明化 | 云南阿拉比卡咖啡豆 | 计算机视觉 | NA | 图像分析技术 | CNN | 图像 | 未明确说明具体数量,包含浅烘、中烘、深烘三类样本 | 未明确说明 | 未指定具体架构 | 准确率 | NA |
| 7 | 2026-03-10 |
Intelligent storage year identification of Anhua dark tea via carbon quantum dots-based colorimetric sensor array and computer vision
2026-Apr-15, Food chemistry
IF:8.5Q1
DOI:10.1016/j.foodchem.2026.148329
PMID:41672020
|
研究论文 | 本研究开发了一种结合比色传感器阵列和深度学习的方法,用于快速识别安化黑茶的储存年份 | 首次将碳量子点比色传感器阵列与计算机视觉结合,利用智能手机在紫外光下捕获颜色变化图像,并通过深度学习模型直接分析,实现了安化黑茶储存年份的快速、低成本、高精度识别 | 未明确说明样本的具体数量、来源多样性以及模型在更广泛样本或不同环境条件下的泛化能力 | 开发一种快速、准确、易于操作的安化黑茶储存年份识别方法 | 安化黑茶 | 计算机视觉 | NA | 比色传感器阵列、碳量子点 | CNN | 图像 | NA | NA | ResNet18, VGG16, DenseNet121, MobileNetV3-Small, EfficientNet B0 | 准确率 | NA |
| 8 | 2026-03-10 |
Self-supervised learning for aflatoxin B1 detection using masked spectra
2026-Apr-15, Food chemistry
IF:8.5Q1
DOI:10.1016/j.foodchem.2026.148342
PMID:41679220
|
研究论文 | 本研究提出了一种基于自监督学习的策略,用于花生和玉米中黄曲霉毒素B1的准确检测 | 创新性地将光谱重建误差用作波长注意力机制,并与自监督学习阶段的微调编码器集成,开发了分类模型,同时基于光谱重建误差选择关键波长 | NA | 开发一种高效的小样本光谱检测方法,用于黄曲霉毒素B1的检测 | 花生和玉米中的黄曲霉毒素B1 | 机器学习 | NA | 光谱检测 | 自监督学习, 深度学习 | 光谱数据 | NA | NA | NA | 准确率 | NA |
| 9 | 2026-03-10 |
Near- and Mid-Infrared Spectroscopy for the Rapid and Non-Destructive Analysis of Wheat Flour and Wheat-Based Products: A Review
2026-Apr-15, Food chemistry
IF:8.5Q1
DOI:10.1016/j.foodchem.2026.148379
PMID:41691843
|
综述 | 本文综述了近红外和中红外光谱技术在小麦粉及其制品快速、无损分析中的应用进展 | 整合光谱技术与化学计量学及机器学习方法,提高了预测精度和稳健性,支持实时原位分析 | NA | 优化小麦粉的质量控制与安全评估,为食品工业提供快速、可靠、可持续的分析系统 | 小麦粉及小麦基制品 | 机器学习 | NA | 近红外光谱,中红外光谱 | 深度学习 | 光谱数据 | NA | NA | NA | 预测精度,稳健性 | NA |
| 10 | 2026-03-10 |
Artificial intelligence streamlines scientific discovery of drug-target interactions
2026-Apr, British journal of pharmacology
IF:6.8Q1
DOI:10.1111/bph.17427
PMID:39843168
|
综述 | 本文综述了人工智能技术在药物靶点相互作用预测中的应用 | 系统性地概述了AI在DTI预测中的最新方法,包括经典机器学习、深度学习和基于网络的方法,并指出了当前挑战和未来方向 | 作为一篇综述文章,未提出新的实验数据或模型,主要基于现有文献进行总结 | 探讨人工智能如何简化药物发现过程中的药物靶点相互作用预测 | 药物靶点相互作用 | 机器学习 | NA | NA | 经典机器学习, 深度学习, 基于网络的方法 | NA | NA | NA | NA | NA | NA |
| 11 | 2026-03-10 |
Reinforcement Learning-Based Sequential Parameter Tuning for Image Signal Processing
2026-Apr, IEEE transactions on pattern analysis and machine intelligence
IF:20.8Q1
DOI:10.1109/TPAMI.2025.3642837
PMID:41379910
|
研究论文 | 本文提出了一种基于强化学习的图像信号处理(ISP)参数顺序调优方法,以自动化传统上依赖专家手动调整的耗时过程 | 首次将硬件ISP参数调优建模为顺序优化问题,并分别提出了基于单智能体强化学习(SARL-ISP)和协作多智能体强化学习(MARL-ISP)的框架,其中MARL-ISP通过序列化参数调优模块(SPTM)和特征选择模块(FSM)探索了ISP模块顺序结构及参数间耦合关系的影响 | 未明确说明模型在极端光照或噪声条件下鲁棒性,也未讨论计算复杂度及实时性是否满足硬件部署要求 | 自动化图像信号处理(ISP)参数调优过程,提升图像质量并优化下游计算机视觉任务性能 | 硬件ISP处理模块及其可调参数 | 计算机视觉 | NA | 强化学习(RL) | 强化学习智能体(单智能体及多智能体) | RAW图像,RGB图像 | 未明确说明具体样本数量,仅提及使用最小训练数据 | 未明确说明 | SARL-ISP, MARL-ISP(包含序列化参数调优模块SPTM和特征选择模块FSM) | 定量指标(未具体说明),定性评估 | NA |
| 12 | 2026-03-10 |
Unveiling Fine-Grained Deceptive Patterns in Multimodal Fake News: An Explainable Neuro-Symbolic Framework With LVLMs
2026-Apr, IEEE transactions on pattern analysis and machine intelligence
IF:20.8Q1
DOI:10.1109/TPAMI.2025.3642831
PMID:41379920
|
研究论文 | 本文提出了一种可解释的神经符号框架GE-NSLM,用于检测多模态假新闻中的细粒度欺骗模式 | 从解释假新闻如何被制造的角度出发,预先定义了四种欺骗模式,并首次将大型视觉语言模型与神经符号模型结合,提供可解释的检测结果 | 未明确说明模型在处理新兴或复杂欺骗模式时的泛化能力,也未讨论计算效率问题 | 开发一个既能准确检测多模态假新闻,又能解释其制造背后深层原理的可解释性框架 | 多模态假新闻(包含图像和文本) | 自然语言处理,计算机视觉 | NA | NA | 神经符号模型,大型视觉语言模型 | 多模态数据(图像和文本) | NA | NA | GE-NSLM(一种神经符号潜在模型) | NA | NA |
| 13 | 2026-03-10 |
Handwritten Text Recognition: A Survey
2026-Apr, IEEE transactions on pattern analysis and machine intelligence
IF:20.8Q1
DOI:10.1109/TPAMI.2025.3646002
PMID:41411365
|
综述 | 本文对从早期启发式方法到现代深度学习模型的演进进行了全面调查,并提供了统一框架来评估研究方法、基准测试进展、关键数据集及文献结果 | 提出了一个统一框架来分类手写文本识别研究,并系统梳理了从词级到文档级的技术演进路径 | 作为综述文章,未提出新的算法模型,主要基于现有文献进行分析归纳 | 系统梳理手写文本识别领域的技术演进、研究方法和未来方向 | 手写文本识别模型、数据集和评估方法 | 模式识别 | NA | 深度学习 | 神经网络 | 手写文本图像 | NA | NA | NA | NA | NA |
| 14 | 2026-03-10 |
DSwinIR: Rethinking Window-Based Attention for Image Restoration
2026-Apr, IEEE transactions on pattern analysis and machine intelligence
IF:20.8Q1
DOI:10.1109/TPAMI.2025.3646016
PMID:41418006
|
研究论文 | 本文提出了一种新的注意力机制——可变形滑动窗口注意力(DSwin Attention),用于图像恢复任务 | 引入了基于令牌和内容感知的范式,通过可变形滑动窗口注意力机制超越传统的网格和固定窗口划分,增强了跨窗口特征交互和感受野 | NA | 改进图像恢复中基于窗口的自注意力机制,以提升模型性能 | 图像恢复任务 | 计算机视觉 | NA | NA | Transformer | 图像 | NA | NA | DSwinIR, GridFormer | dB(信噪比提升) | NA |
| 15 | 2026-03-10 |
Jo-SNC: Combating Noisy Labels Through Fostering Self- and Neighbor-Consistency
2026-Apr, IEEE transactions on pattern analysis and machine intelligence
IF:20.8Q1
DOI:10.1109/TPAMI.2025.3646737
PMID:41428907
|
研究论文 | 提出一种名为Jo-SNC的噪声鲁棒方法,通过联合样本选择和基于自一致性及邻域一致性的模型正则化来应对标签噪声问题 | 提出联合样本选择和模型正则化的噪声鲁棒方法,引入Jensen-Shannon散度衡量样本清洁度,设计自适应阈值方案,并采用三元组一致性正则化提升模型性能 | 未明确说明方法在极端噪声比例或特定数据分布下的性能边界,实验主要基于基准数据集 | 解决监督深度学习中的标签噪声问题,提升模型在噪声环境下的鲁棒性 | 带有噪声标签的监督学习数据 | 机器学习 | NA | NA | 深度网络 | NA | 多个基准数据集(未指定具体数量) | NA | NA | NA | NA |
| 16 | 2026-03-10 |
Deep Learning-Based Detection of Periodontal Infrabony and Furcation Defects on Periapical Radiographs: A Feasibility Study
2026-Apr, International dental journal
IF:3.2Q1
DOI:10.1016/j.identj.2025.109380
PMID:41544585
|
研究论文 | 本研究探索了基于深度学习的对象检测模型在根尖片上自动检测和分类牙周骨缺损的可行性 | 首次将YOLOv8对象检测模型应用于根尖片上牙周骨缺损的详细分类,包括一壁缺损、多壁缺损、火山口样缺损和根分叉病变 | 数据集存在不平衡问题,且二维成像本身存在固有局限,导致模型对较小或影像学上模糊的缺损检测困难 | 评估人工智能辅助对象检测模型在牙周骨缺损分类中的可行性和性能 | 根尖片上显示的牙周骨缺损 | 计算机视觉 | 牙周病 | 深度学习 | CNN | 图像 | 581张包含至少1处牙周骨缺损的根尖片图像(来自总共7464张图像) | NA | YOLOv8l | 平均精度均值, 精确率, 召回率 | NA |
| 17 | 2026-03-10 |
Automated Classification of Store-Operated Calcium Entry Activity and Disease Conditions in Murine Skeletal Muscle Images Using Machine Learning
2026-Apr, Muscle & nerve
IF:2.8Q2
DOI:10.1002/mus.70157
PMID:41603483
|
研究论文 | 本研究比较了三种机器学习模型在基于小鼠骨骼肌图像中钙库操纵性钙内流(SOCE)活性进行分类的能力,以评估肌肉活动或疾病状态 | 首次将机器学习模型应用于小鼠骨骼肌图像的SOCE活性自动分类,为肌肉病理的临床分类提供了可扩展的自动化解决方案 | 研究样本量有限,未来需要更大数据集和更复杂模型(如基于Transformer的模型)来提升在复杂肌肉条件下的性能 | 开发并比较机器学习模型,以实现从小鼠骨骼肌图像中自动分类SOCE活性和疾病状态,以辅助肌肉营养不良症的诊断和治疗 | 小鼠骨骼肌纤维的免疫荧光图像,来自钙蛋白酶-3缺失小鼠和野生型小鼠,包括静息和运动后状态 | 计算机视觉 | 肌肉营养不良症 | 免疫荧光成像 | CNN, SVM | 图像 | 来自钙蛋白酶-3缺失小鼠和野生型小鼠的骨骼肌纤维图像,具体数量未在摘要中明确说明 | NA | CNN, EfficientNet, SVM | 准确率, F1分数, 精确率, 受试者工作特征曲线下面积 | NA |
| 18 | 2026-03-10 |
Multi-Task Deep Learning for Sex and Age Estimation from Panoramic Radiographs in a Brazilian Young Population
2026-Apr, International dental journal
IF:3.2Q1
DOI:10.1016/j.identj.2025.109381
PMID:41604952
|
研究论文 | 本研究提出并评估了一种基于ForensicNet的多任务深度学习框架,用于从巴西5-15岁年轻人群的全景X光片中同时估计实际年龄和分类性别 | 提出了一种基于EfficientNet-B3的多任务深度学习模型,结合了卷积块注意力模块(CBAM)的任务特定分支,并采用加权多任务损失函数进行端到端训练 | 研究样本仅限于巴西5-15岁的年轻人群,可能限制了模型在其他年龄组或不同种族人群中的泛化能力 | 开发一个自动化框架,从全景X光片中准确估计年龄和分类性别,以辅助法医和临床应用 | 巴西年轻人群(5-15岁)的全景X光片 | 计算机视觉 | NA | 全景X光成像 | 深度学习 | 图像 | 2200张高分辨率全景X光片,按年龄和性别平衡 | NA | EfficientNet-B3, ForensicNet | 平均绝对误差, 决定系数, 准确率, 曲线下面积 | NA |
| 19 | 2026-03-10 |
A Multimodal Model for Caries Screening Using Intraoral Images and Questionnaires
2026-Apr, International dental journal
IF:3.2Q1
DOI:10.1016/j.identj.2026.109420
PMID:41650828
|
研究论文 | 本研究开发了一种结合口内图像和问卷数据的多模态深度学习模型,用于儿童龋齿筛查,并与仅使用图像的单一模态模型进行性能比较 | 通过整合口内图像和问卷数据构建多模态模型,提高了早期龋齿的召回率,同时保持了整体诊断性能,并利用SHAP分析增强了模型决策的可解释性 | 需要进一步的大规模、多中心验证以确认其普适性和有效性 | 开发用于儿童龋齿筛查的多模态深度学习模型 | 儿童的口内图像和口腔健康问卷数据 | 计算机视觉 | 龋齿 | 深度学习 | 深度学习模型 | 图像, 文本 | 7671张图像(3913张咬合面图像和3758张光滑面图像) | NA | NA | 准确率, 精确率, 召回率, F1分数, ROC-AUC | NA |
| 20 | 2026-03-10 |
Comparison of Artificial Intelligence Models for Automatic Segmentation of the Mandibular Canals and Branches
2026-Apr, International dental journal
IF:3.2Q1
DOI:10.1016/j.identj.2026.109427
PMID:41653835
|
研究论文 | 本研究比较并改进了三种深度学习模型(U-Net Transformer、Swin UNETR和3D UX-Net)在下颌管及其分支自动分割中的性能 | 首次比较了三种先进的3D深度学习模型在下颌管分割任务中的表现,并引入了基于解剖学特征的后处理模块以显著提升模型性能 | 研究仅使用了173个CBCT扫描样本,样本量相对有限;未在外部数据集上验证模型的泛化能力 | 比较和优化深度学习模型在下颌管及其分支自动分割中的性能 | 下颌管、切牙管和颏管等牙科结构 | 计算机视觉 | NA | 锥形束计算机断层扫描 | 深度学习 | 3D医学图像 | 173个CBCT扫描 | NA | U-Net Transformer, Swin UNETR, 3D UX-Net | Dice相似系数, 交并比, 95百分位豪斯多夫距离, 平均对称表面距离, 精确率, 召回率 | NA |