本数据库通过收集和整理最新科研文献信息而得,供了解领域前沿进展之用。数据源自 PubMed Data ,每日自动更新(使用关键词“['deep learning']”过滤),已收录文献数量参见 统计表格。表格内容由 GPT 自动整理,可能存在错误或遗漏,请使用时务必注意核实!
如有建议或合作意向,欢迎联系 linlin.yan(AT)bioinfo.app 或 微信 yanlinlin82。本项目遵循 MIT 许可 发布,欢迎下载 源码 自行修改使用。如觉得不错,还请不吝 给我打赏,你的支持是我继续创新的重要动力!


除通过在线浏览外,为方便用户离线查阅,本站也提供 付费下载(定价19.9元)。之所以考虑收费,是因为批量扫描这些文献并整理也是有一定成本的,还请理解并多多支持。本站数据会持续更新,而仅需一次付费,未来就可以随时重新下载到最新版本数据。
| 序号 | 推送日期 | 文章 | 类型 | 简述 | 创新点 | 不足 | 研究目的 | 研究对象 | 领域 | 病种 | 技术 | 模型 | 数据类型 | 样本量 | 算法框架 | 模型架构 | 性能指标 | 计算资源 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 641 | 2025-12-01 |
Transformer-based optical attenuation compensation and denoising in photoacoustic imaging
2025-Nov, Journal of biomedical optics
IF:3.0Q2
DOI:10.1117/1.JBO.30.11.116004
PMID:41312519
|
研究论文 | 提出基于Transformer的生成模型解决线性阵列光声成像中的光学衰减补偿和去噪耦合问题 | 首次将视觉Transformer架构应用于光声成像的衰减补偿和去噪耦合问题,提出Trans U-Net模型 | 主要使用模拟数据和仿体数据进行训练,在真实临床数据上的泛化能力需进一步验证 | 开发深度学习方法来同时解决光声成像中的光学衰减补偿和噪声抑制问题 | 线性阵列光声成像系统获取的图像数据 | 医学影像处理 | 乳腺癌 | 光声成像 | 生成对抗网络, U-Net, Transformer | 图像 | 模拟数据、实验仿体数据和小动物肿瘤图像 | NA | Pix2Pix, Residual U-Net, Transformer U-Net | PSNR, SSIM, MSE | NA |
| 642 | 2025-12-01 |
Relation knowledge distillation 3D-ResNet-based deep learning for breast cancer molecular subtypes prediction on ultrasound videos: a multicenter study
2025-Nov, British journal of cancer
IF:6.4Q1
DOI:10.1038/s41416-025-03146-7
PMID:40858830
|
研究论文 | 开发并验证基于关系知识蒸馏的三维残差网络模型,利用超声视频预测乳腺癌分子亚型 | 首次将关系知识蒸馏技术应用于三维残差网络,通过超声视频实现乳腺癌分子亚型的四分类预测 | 回顾性研究设计,样本量相对有限,需要进一步前瞻性验证 | 开发非侵入性乳腺癌分子亚型预测工具,辅助临床个性化管理 | 乳腺癌患者及其超声视频数据 | 计算机视觉 | 乳腺癌 | 超声成像 | 3D-CNN | 视频, 图像 | 882例乳腺癌患者(2375个超声视频和9499张图像),外加86例外部队列患者 | NA | 3D-ResNet, 2D-ResNet | AUC, 敏感度, 特异度, 准确率, 平衡准确率, 精确率, 召回率, F1分数 | NA |
| 643 | 2025-11-30 |
Lightweight Hybrid Deep Learning Models for Accurate Classification of Respiratory Conditions from Raw Lung Sounds
2025-Nov-29, Journal of medical systems
IF:3.5Q2
DOI:10.1007/s10916-025-02315-8
PMID:41315171
|
研究论文 | 提出一种基于轻量级混合深度学习模型的框架,用于从原始肺音中准确分类十一种呼吸系统疾病 | 首次使用无需特征工程或预处理的原始肺音数据,结合轻量级混合CNN-LSTM架构实现高精度呼吸病理分类 | 仅进行了数据集内评估,需要额外临床数据集的外部验证来评估泛化能力 | 提高呼吸系统疾病诊断准确性,并通过对比分析确定最高效的模型 | 原始肺听诊音 | 机器学习 | 呼吸系统疾病 | 肺音听诊 | CNN, LSTM, 混合CNN-LSTM | 音频 | 两个不同数据集(原始形式和增强后) | NA | 混合CNN-LSTM | 准确率 | NA |
| 644 | 2025-11-30 |
Application and Challenges of Deep Learning in Pulmonary Vessels Segmentation of CTPA Images
2025-Nov-28, IEEE journal of biomedical and health informatics
IF:6.7Q1
DOI:10.1109/JBHI.2025.3638808
PMID:41313701
|
综述 | 本文系统综述了深度学习在CTPA图像肺血管分割中的应用进展与挑战 | 首次按数据维度(2D/3D/2.5D)系统分类网络架构并评估临床适应性,提出针对标注稀缺和模型泛化等临床挑战的创新缓解策略 | 基于文献综述的分析方法,缺乏原始实验验证;仅纳入23项高质量研究,可能存在发表偏倚 | 评估深度学习在CTPA图像肺血管分割中的技术进展和临床实施挑战 | CTPA图像中的肺血管结构 | 数字病理 | 肺血管疾病 | 计算机断层扫描肺血管造影(CTPA) | 深度学习 | 医学影像 | 23项高质量研究 | NA | NA | Dice相似系数(DSC) | NA |
| 645 | 2025-11-30 |
Ortho-OPD: an Automatic Osteotomy Planes Design Model for Orthognathic Surgery Based on Deep Learning
2025-Nov-28, IEEE journal of biomedical and health informatics
IF:6.7Q1
DOI:10.1109/JBHI.2025.3638775
PMID:41313700
|
研究论文 | 提出基于深度学习的自动截骨平面设计模型Ortho-OPD,用于正颌手术规划 | 首次结合CNN分割网络和RANSAC算法实现从原始CT数据自动设计正颌手术截骨平面 | 训练样本量较小(71例),需进一步扩大验证 | 开发自动化的正颌手术截骨平面设计方法以提升手术规划效率 | 颅颌面CT数据和正颌手术截骨平面 | 计算机视觉 | 牙颌面畸形 | CT成像 | CNN | 3D医学图像(CT) | 71个训练样本,31个测试病例 | NA | CNN结合RANSAC算法 | Dice相似系数,角度误差,最短距离,临床效率 | NA |
| 646 | 2025-11-30 |
Artificial Intelligence in Pediatric Surgery: From Diagnostics and Preoperative Planning to Risk Stratification: A Comprehensive Review of Current Applications
2025-Nov-28, European journal of pediatric surgery : official journal of Austrian Association of Pediatric Surgery ... [et al] = Zeitschrift fur Kinderchirurgie
IF:1.5Q3
DOI:10.1055/a-2743-4868
PMID:41314409
|
综述 | 全面综述人工智能在儿科外科诊断、术前规划、风险分层和手术错误预防四大领域的当前应用 | 首次系统整合儿科外科四大应用领域的最新进展,突出成人外科与儿科外科在AI转化方面的差异 | 多数研究为回顾性单中心研究,方法学异质性强,外部验证不足,缺乏前瞻性验证 | 评估人工智能在儿科外科领域的应用现状和发展前景 | 儿科外科患者群体 | 数字病理 | 儿科外科疾病 | 深度学习 | 深度学习模型 | 医学影像 | NA | NA | NA | 准确率 | NA |
| 647 | 2025-11-30 |
Automated Bone Age Assessment and Adult Height Prediction from Pediatric Hand Radiographs via a Cascaded Deep Learning Framework
2025-Nov-26, Journal of medical systems
IF:3.5Q2
DOI:10.1007/s10916-025-02306-9
PMID:41296212
|
研究论文 | 提出一种级联深度学习框架,从儿童手部X光片自动评估骨龄并预测成年身高 | 首次将实例分割与并行ResNet子网络结合的级联框架,实现端到端的骨龄评估和身高预测 | 仅使用中国儿童数据,模型泛化能力需进一步验证 | 提高儿科生长评估中骨龄评估和身高预测的客观性和效率 | 中国儿童手部X光片 | 计算机视觉 | 儿科生长发育 | X射线成像 | CNN, 实例分割, 回归模型 | X光图像 | 8,242张左手X光片 | PyTorch | Yolact, ResNet-18 | Pearson相关系数, Bland-Altman分析, 平均绝对误差 | NA |
| 648 | 2025-11-30 |
Towards decoding individual words from non-invasive brain recordings
2025-Nov-26, Nature communications
IF:14.7Q1
DOI:10.1038/s41467-025-65499-0
PMID:41298362
|
研究论文 | 开发了一种从非侵入性脑记录(EEG和MEG)解码单个单词的深度学习流程 | 首次实现从非侵入性脑记录中解码训练集未出现的单词,并在多设备、多语言、多任务场景下持续优于现有方法 | 非侵入式记录的解码精度仍受设备类型和实验协议限制,EEG和听力任务比MEG和阅读任务更难解码 | 构建非侵入式脑信号自然语言解码器 | 人类脑电信号(EEG/MEG) | 脑机接口, 自然语言处理 | NA | 脑电图(EEG), 脑磁图(MEG) | 深度学习 | 脑信号时间序列 | 723名参与者,500万个单词,涵盖三种语言 | NA | NA | 解码准确率 | NA |
| 649 | 2025-11-30 |
YOMO TF based edge cloud collaborative surveillance framework for tobacco warehouse safety management
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-26011-2
PMID:41298508
|
研究论文 | 提出一种基于YOMO-TF的边缘云协同监控框架,用于烟草仓库安全管理 | 结合YOLO、MobileOne、Transformer和联邦自蒸馏技术,构建自适应深度学习的边缘云协同监控架构 | NA | 开发实时、隐私保护且可扩展的烟草仓库安全监控解决方案 | 烟草仓库监控场景中的异常行为检测 | 计算机视觉 | NA | 深度学习,联邦学习 | YOLO, Transformer, 轻量级CNN | 视频,图像 | NA | NA | YOLOv8-nano, MobileOne-S, Temporal Shift Transformer (TST) | 准确率, 精确率, 召回率, F1分数 | 边缘设备,云平台 |
| 650 | 2025-11-30 |
Dual-modality fusion for mango disease classification using dynamic attention based ensemble of leaf & fruit images
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-26052-7
PMID:41298556
|
研究论文 | 提出一种基于动态注意力机制的双模态融合方法,结合芒果叶片和果实图像进行疾病分类 | 引入模态注意力融合机制动态加权不同模态的预测结果,并采用类别感知的数据增强策略 | 未明确说明模型在复杂田间环境下的鲁棒性验证 | 提高芒果疾病分类的准确性和泛化能力 | 芒果叶片和果实图像 | 计算机视觉 | 植物疾病 | 深度学习 | CNN | 图像 | 未明确说明具体样本数量 | Django | ResNet-50, MobileNetV2, EfficientNet-B0, ConvNeXt | 准确率, F1分数, ROC-AUC | NA |
| 651 | 2025-11-30 |
Transformer-based deep learning for adaptive pedagogy under uncertain student preferences
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-25996-0
PMID:41298579
|
研究论文 | 提出一种基于Transformer的深度学习框架SRE-TransformerNet,用于在不确定学生偏好的情况下实现自适应教学 | 融合Swin Transformer、ResNet和EfficientNet三种架构,并引入三种新型预处理技术(ARS、FFWA、UDT)和三种新评估指标(CSS、TCI、MCIM) | 未明确说明数据收集的具体限制和模型在不同教育场景中的泛化能力 | 开发能够适应多样化学习行为和个人偏好的个性化教育系统 | 学生学习行为和偏好 | 机器学习 | NA | 深度学习 | Transformer, CNN | 教育行为数据 | NA | NA | Swin Transformer, ResNet, EfficientNet | F1-score, AUC, accuracy, recall, CSS, TCI, MCIM | NA |
| 652 | 2025-11-30 |
A Hybrid Cross-Attentive CNN-BiLSTM-Transformer Network for Dysarthria Severity Classification
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-26049-2
PMID:41298571
|
研究论文 | 提出一种混合深度学习模型用于构音障碍严重程度分类 | 集成CNN、BiLSTM和Transformer架构,采用独特的交叉注意力机制融合小波尺度图与声学特征 | NA | 实现构音障碍的客观自动检测和严重程度分类 | 构音障碍患者语音数据 | 自然语言处理 | 神经系统疾病 | 声学特征分析,小波变换 | CNN, BiLSTM, Transformer | 语音信号,图像 | TORGO和UA Speech两个公共数据集 | NA | 混合CNN-BiLSTM-Transformer网络 | 准确率,配对t检验 | NA |
| 653 | 2025-11-30 |
Novel dual-input stream-based hybrid approach for wheat leaf disease classification using edge-aware features
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-26123-9
PMID:41298585
|
研究论文 | 提出一种结合Xception和EfficientNetB3架构的双输入流混合深度学习模型EffiXB3,用于小麦叶片病害分类 | 首次将Xception和EfficientNetB3架构与边缘感知特征相结合,采用双输入流处理结构和纹理特征 | NA | 提高小麦叶片病害分类的准确性和鲁棒性 | 小麦叶片图像 | 计算机视觉 | 植物病害 | Canny边缘检测 | CNN,混合深度学习模型 | 图像 | NA | NA | Xception,EfficientNetB3,EffiXB3 | 准确率 | NA |
| 654 | 2025-11-30 |
Dynamic edge-caching through content popularity and crowd prediction for short video services
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-26079-w
PMID:41298598
|
研究论文 | 提出一种通过内容流行度和人群预测的动态边缘缓存框架DECC,用于优化短视频服务的缓存决策 | 首次联合建模内容流行度和用户访问行为,采用混合深度学习架构捕获视频请求和用户活动的时序动态特征 | 未明确说明模型在不同网络环境下的泛化能力,实验数据可能受特定场景限制 | 优化移动网络中短视频服务的边缘缓存效率,降低访问延迟 | 短视频内容缓存决策和用户访问行为 | 机器学习 | NA | 深度学习 | CNN, LSTM, GRU | 时序数据,用户行为数据 | 真实世界数据集(具体数量未说明) | 未明确说明 | Conv1D, LSTM, GRU混合架构 | 缓存命中率,访问延迟降低,资源利用效率 | NA |
| 655 | 2025-11-28 |
Research on personalized distance education recommendation system based on deep learning
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-26020-1
PMID:41298620
|
NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| 656 | 2025-11-28 |
CT-based intratumoral heterogeneity quantification fusing deep learning radiomics for predicting lymph node metastasis in early-stage lung adenocarcinoma: a multicenter study
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-26331-3
PMID:41298638
|
NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| 657 | 2025-11-30 |
A deep learning model for contact angle prediction in carbonate reservoirs under smart water assisted foam injection (SWAF)
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-26336-y
PMID:41298639
|
研究论文 | 本研究开发了机器学习模型来预测智能水辅助泡沫注入条件下碳酸盐岩储层的接触角 | 首次将深度学习模型应用于SWAF注入条件下的接触角预测,并采用数据增强技术扩展数据集 | 未考虑原油特性和油田尺度数据 | 开发准确的接触角预测模型以优化智能水辅助泡沫注入过程 | 碳酸盐岩储层在智能水辅助泡沫注入条件下的接触角 | 机器学习 | NA | 数据增强技术包括高斯噪声、缩放变换和物理约束生成对抗网络 | CNN, XGBoost, SVR, Random Forest, MLP | 表格数据 | 初始1,615个样本,通过数据增强扩展到13,032个样本 | NA | 卷积神经网络, XGBoost, 支持向量回归, 随机森林, 多层感知器 | RMSE, R² | NA |
| 658 | 2025-11-30 |
An autoencoder and vision transformer based interpretability analysis on the performance differences in automated staging of second and third molars
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-26121-x
PMID:41298637
|
研究论文 | 提出结合自编码器和视觉变换器的框架,用于提升牙齿年龄分期分类性能并提供模型可解释性分析 | 首次将自编码器与视觉变换器结合用于牙齿分期任务,通过多角度可解释性分析揭示数据层面的性能限制因素 | 研究主要关注下颌第二和第三磨牙,结论可能不适用于其他牙齿类型;性能差距的根本数据问题需要进一步数据收集来解决 | 提升法医牙科年龄估计中深度学习模型的性能和可解释性 | 下颌第二磨牙(37号牙)和第三磨牙(38号牙)的X光图像 | 计算机视觉 | 法医牙科 | 牙齿X光成像 | 自编码器, Vision Transformer | 医学图像 | 未明确说明具体样本数量 | 未明确说明 | 自编码器, Vision Transformer | 准确率 | NA |
| 659 | 2025-11-30 |
A transformer based approach to STEAM integrated english course design in high schools under deep learning
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-26024-x
PMID:41298657
|
研究论文 | 本研究探索将STEAM教育理念与深度学习技术相结合,开发基于Transformer架构的高中英语课程资源自动生成系统 | 提出融合STEAM语义特征的Transformer框架,实现英语教学内容的智能生成和个性化推送 | 在资源有限环境中的实施存在挑战,需要进一步改进 | 通过深度学习技术提升高中英语课程资源的智能化和相关性 | 高中英语课程资源开发 | 自然语言处理 | NA | 深度学习 | Transformer | 文本 | 300名高中生,其中150名学生的数据构成核心训练语料 | NA | Transformer编码器-解码器架构 | BLEU分数, 创新指数, 内容多样性 | NA |
| 660 | 2025-11-30 |
Human visual attention-inspired knowledge distillation underlying interpretable computational pathology
2025-Nov-26, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-26004-1
PMID:41298683
|
研究论文 | 提出受人类视觉注意力启发的知识蒸馏方法,用于计算病理学中的可解释医学图像分析 | 首次将人类视觉注意力机制融入知识蒸馏框架,通过捕捉局部和全局图像块关系构建差异化特征 | 未明确说明方法在更广泛病理学任务和数据集上的泛化能力 | 解决计算病理学中模型轻量化、可解释性与性能之间的平衡问题 | 医学病理图像 | 计算病理学 | NA | 深度学习 | 知识蒸馏 | 医学图像 | NA | NA | NA | 分割任务性能,注意力图与专家标注一致性 | NA |