深度学习在生物医药领域的应用

序号	推送日期	文章	类型	简述	创新点	不足	研究目的	研究对象	领域	病种	技术	模型	数据类型	样本量	算法框架	模型架构	性能指标	计算资源
141	2026-06-19	Empowering rural governance with digital technology: Deep learning models for automated detection of rural buildings using remote sensing images 2026, PloS one IF:2.9Q1 DOI:10.1371/journal.pone.0351311 PMID:42284255	研究论文	提出一种集成多尺度混合注意力模块、动态特征金字塔网络和渐进对比学习策略的深度学习框架，用于从遥感影像中自动检测农村建筑物以支持乡村治理	引入多尺度混合注意力模块并行卷积路径结合通道和空间注意力动态捕捉多尺度特征并抑制背景噪声，动态特征金字塔网络利用内容感知路由自适应融合层次特征实现尺度不变表示，渐进对比学习策略通过硬样本挖掘利用有标签和无标签数据增强判别能力	在跨数据集泛化（中国农村数据上MIoU为72.3%）仍有提升空间，高质量注释数据集稀缺问题未彻底解决	解决从无人机遥感影像自动检测农村建筑物时面临的极端尺度变化、复杂背景干扰和高质量标注数据稀缺等挑战	农村建筑物	计算机视觉	NA	遥感影像分析	深度学习模型	图像	马萨诸塞州建筑物数据集及中国农村数据	PyTorch	U-Net, SegNet, DeepLabV3+作为基准，提出框架含多尺度混合注意力模块、动态特征金字塔网络	平均交并比（MIoU），像素精度（PA），平均精度均值（mAP）	GitHub开源代码，未明述GPU类型
142	2026-06-19	EffortNet: A Deep Learning Framework for Objective Assessment of Speech Enhancement Technologies Using EEG-Based Alpha Oscillations 2026, IEEE transactions on neural systems and rehabilitation engineering : a publication of the IEEE Engineering in Medicine and Biology Society IF:4.8Q1 DOI:10.1109/TNSRE.2026.3694178 PMID:42149756	研究论文	提出一种名为EffortNet的深度学习框架，通过脑电图中的alpha振荡客观评估语音增强技术对听力的影响	整合自监督学习、增量学习和迁移学习三种互补范式，解决脑电图信号的个体间差异问题，并利用概率指标揭示神经网络差异与主观评分之间的分离现象	未明确说明	开发一种客观评估语音理解过程中听力困难程度的深度学习框架	122名参与者在四种语音条件下（清晰、噪声、MMSE增强、Transformer增强）的64通道脑电图数据	机器学习和信号处理	听力学相关疾病	脑电图（EEG）	深度学习框架	脑电图信号	122名参与者	NA	EffortNet	分类准确率（与常规CNN和STAnet对比）	NA
143	2026-06-19	A transformer-based deep learning algorithm for diagnosing spinal infections on axial non-contrast computed tomography images: a dual-center retrospective study 2026, PeerJ IF:2.3Q2 DOI:10.7717/peerj.21340 PMID:42299150	研究论文	开发了一种基于Swin Transformer的深度学习算法，用于在轴位非增强CT图像上诊断脊柱感染，并在双中心回顾性研究中验证其性能	首次将Swin Transformer模型应用于脊柱感染的CT诊断，并证明其在无磁共振条件下的高准确率和临床辅助价值	回顾性研究设计、样本量相对有限（共157例）、未包含其他脊柱病变类型	探索基于非增强CT图像的深度学习方法来诊断原发性脊柱感染，提高诊断准确率和效率	来自两个医疗中心的157例原发性脊柱感染患者的非增强CT图像切片	医学影像分析	脊柱感染	CT成像	Swin Transformer	CT图像	训练及内部验证集127例（来自主要中心，7:3随机划分），外部验证集30例（来自第二中心）	PyTorch	Swin Transformer	AUC, AUPRC, 灵敏度, 特异度, 准确率, PPV, NPV, F1分数	GPU（具体型号未提及）
144	2026-06-19	Automated classification of natural habitats using ground-level imagery 2026, PloS one IF:2.9Q1 DOI:10.1371/journal.pone.0351335 PMID:42308189	研究论文	提出一种基于地面级图像（照片）的自动化栖息地分类方法，利用深度学习实现16类栖息地的分类	首次仅基于地面图像进行栖息地分类，替代依赖卫星影像的传统方法，并开发了DeepLabV3-ResNet101自定义深度学习分类器，结合数据增强与重采样平衡类别	部分视觉混合或模糊的栖息地类别（如视觉不明显的类别）分类性能较低，整体F1分数为0.63，且仅针对英格兰‘Living England’框架的16个类别	实现基于地面图像的可扩展、高精度栖息地分类，支持生态监测与公民科学应用	地面级栖息地照片（来自公民科学或实地拍摄的图片）	计算机视觉	NA	图像预处理（缩放、归一化、增强）与重采样技术	CNN（DeepLabV3-ResNet101）	图像	16类栖息地图像，未明确具体数量，但通过五折交叉验证与重采样平衡类别	PyTorch	DeepLabV3-ResNet101	准确率, F1分数	NA
145	2026-06-19	A semantic segmentation model to predict subcellular glycogen localization using transmission electron microscopy images 2026, PloS one IF:2.9Q1 DOI:10.1371/journal.pone.0351502 PMID:42308209	研究论文	开发并验证了一种基于深度学习的语义分割方法，利用透射电子显微镜图像自动量化人体骨骼肌中糖原在亚细胞区室的分布	提出结合两个注意力U-Net模型（区域模型和糖原模型）的互补框架，首次实现从TEM图像中自动预测亚细胞糖原定位，并将分析时间大幅缩短	模型基于有限样本（7名健康男性）训练，可能无法完全代表病理状态或不同肌肉类型的糖原分布特征；此外，手动标注的准确性可能影响模型性能	开发自动化工具以高通量、客观地量化骨骼肌亚细胞糖原分布，支持大规模代谢研究	人体骨骼肌活检组织中的糖原颗粒及其亚细胞区室（肌原纤维间、肌原纤维内区域包括A带、I带、Z盘以及线粒体）	计算机视觉	NA	NA	注意力U-Net	图像（透射电子显微镜图像）	7名健康男性的骨骼肌活检，在正常、耗尽和糖原超补偿状态下采集	NA	注意力U-Net（两个互补模型：区域模型和糖原模型）	偏差、变异系数、糖原体积密度与生化测量的一致性	NA
146	2026-06-19	All-optical doubly resonant cavities for energy-efficient ReLU function in nanophotonic deep learning 2026, PloS one IF:2.9Q1 DOI:10.1371/journal.pone.0345850 PMID:42308233	研究论文	提出一种利用紧凑双共振腔实现全光学ReLU激活函数的方法	利用非线性过程实现全光学ReLU函数，设备面积比以往方法减小两个数量级，能实现飞焦级激活能量	NA	实现能效高、高密度的光学神经网络，用于下一代人工智能硬件	全光学双共振腔结构和非线性光学过程	机器学习	NA	光学非线性过程	神经网络	光学信号	NA	NA	双共振腔结构	分类准确率	NA
147	2026-06-19	Computer-aided diagnosis system for thoracic computed tomography of rib fractures in older emergency patients: A preliminary study 2026, PloS one IF:2.9Q1 DOI:10.1371/journal.pone.0351988 PMID:42308243	研究论文	本研究探讨了基于深度学习的计算机辅助诊断系统在老年急诊患者胸部CT肋骨骨折检测中的应用价值	首次按年龄分组评估CAD系统在老年患者中的诊断效能，并与中青年组进行比较	未提供具体缺陷，但可从论文标题推断为初步研究	评估深度学习CAD系统在老年急诊患者肋骨骨折CT诊断中的价值	老年和中年/青年急诊患者	计算机视觉	肋骨骨折	CT影像	深度学习	CT图像	1012例胸外伤急诊患者	NA	NA	灵敏度，假阳性率，阅片时间	NA
148	2026-06-19	A lightweight CNN-transformer hybrid architecture with channel attention for real-time hazardous acoustic event detection 2026, Frontiers in artificial intelligence IF:3.0Q2 DOI:10.3389/frai.2026.1824067 PMID:42311228	研究论文	提出一种轻量级CNN-Transformer混合架构，用于实时危险声学事件检测	融合通道注意力机制的轻量级CNN架构，实现资源受限环境下的高效危险声音分类	未提及其他噪声环境下的泛化性能或模型局限性	设计适用于边缘部署的实时危险声音检测轻量级深度学习模型	基于音频的危险声学信号（哭泣、狗叫、警报、爆炸、火灾、玻璃破碎、尖叫、武器相关声音等8类）	机器学习和计算机视觉（音频分类）	不适用	音频频谱图处理	CNN-Transformer混合架构	音频（对数梅尔频谱图）	8类危险声学数据，每类1000个音频样本，总计8000样本	NA	TinyCNN（增强通道注意力的轻量级CNN主干网络）	准确率、精确率、召回率、F1分数	适用于边缘端部署，具体资源未提及
149	2026-06-19	An integrated evolution-aware meta-learning framework with adversarial morphological augmentation for zero-day threat detections 2026, Frontiers in artificial intelligence IF:3.0Q2 DOI:10.3389/frai.2026.1814012 PMID:42311231	研究论文	提出一种集成了进化感知元学习与对抗形态增强的零日威胁检测框架M3-GAZE	将威胁检测形式化为进化推理问题，通过潜在形态谱提取、对抗进化生成对抗网络、元适应框架、不确定性校准层和因果进化图合成器五个创新组件实现零日攻击的高效检测	未明确说明局限性，可能包括对复杂实时环境的适应性、计算资源需求或模型可解释性验证的不足	克服传统威胁检测框架对静态模式匹配的依赖，提升对零日攻击的检测能力	零日威胁和进化攻击行为	机器学习	NA	生成对抗网络（GAN）	生成对抗网络、元学习模型	威胁检测数据（包括网络流量、系统日志等形态数据）	不详（基于进化任务生成合成样本，可能涉及小样本场景）	PyTorch	对抗进化生成对抗网络（AE-GAN）、元适应框架（MAFTI）	零日召回率、少样本适应性、不确定性校准、假阴性率	NA
150	2026-06-19	Leveraging deep learning and explainable AI for effective liver tumor classification from CT scan images 2026, Frontiers in oncology IF:3.5Q2 DOI:10.3389/fonc.2026.1836325 PMID:42311265	研究论文	提出一种基于深度学习和可解释人工智能的肝肿瘤CT影像分类框架	将可解释AI与多种深度学习模型（ResNet50-v2、EfficientNetV2、Inception-v3、Vision Transformer ViT-16）结合，提升临床可信度	未提及	实现非侵入性肝肿瘤自动分类并增强模型可解释性	CT扫描图像中的肝肿瘤	计算机视觉	肝癌	深度学习、可解释AI	CNN、Transformer	图像	未提及	NA	ResNet50-v2， EfficientNetV2， Inception-v3， Vision Transformer ViT-16	准确率	NA
151	2026-06-19	Automated HER2 Scoring with Uncertainty Quantification Using Lensfree Holography and Deep Learning 2026, BME frontiers IF:5.0Q1 DOI:10.34133/bmef.0278 PMID:42311971	研究论文	利用无透镜全息术与深度学习开发自动化HER2评分系统	集成无透镜全息术与贝叶斯蒙特卡洛dropout不确定性量化，实现低成本、高通量的自动化HER2评分	未提及具体局限性	开发用于乳腺癌HER2评分的自动化系统	免疫组化染色的乳腺癌组织切片	数字病理学	乳腺癌	无透镜全息术	卷积神经网络	图像	412个独特组织样本	NA	贝叶斯蒙特卡洛dropout	准确率（4类84.9%，二分类94.8%）、不确定性量化	NA
152	2026-06-19	Large language model assisted decision support framework for uncertainty aware detection and management of tomato lateral shoots 2026, Frontiers in plant science IF:4.1Q1 DOI:10.3389/fpls.2026.1853269 PMID:42312082	研究论文	提出一种集成深度学习感知与大语言模型的番茄侧枝检测与修剪决策支持框架	首次将YOLOv8n实例分割模型与CBAM注意力机制、蒙特卡洛Dropout不确定性估计及大语言模型推理结合，构建端到端的番茄侧枝不确定性感知修剪决策管道	未提及在真实温室环境中与人工修剪的对比实验，且大语言模型仅提供决策辅助而非直接控制执行	开发一种可靠的番茄侧枝检测与修剪决策支持系统，解决温室复杂光照、叶片遮挡和形态变异导致的检测可靠性问题	温室环境下的番茄侧枝	计算机视觉，自然语言处理	NA	RGB成像，深度学习，大语言模型	深度学习模型，大语言模型	图像	番茄侧枝RGB图像数据集	PyTorch	YOLOv8n-seg, CBAM, Monte Carlo Dropout, LLM	mAP, 参数量, 平均推理时间	NA
153	2026-06-19	Deep Learning for Brain Tumour Analysis: A Systematic Review of CNN-Transformer Hybrids in Multimodal Imaging 2026, International journal of biomedical imaging IF:3.3Q2 DOI:10.1155/ijbi/4763936 PMID:42312286	论文综述	系统综述和荟萃分析评估CNN-Transformer混合架构在脑肿瘤检测中的应用，重点关注局部与全局特征学习的整合、诊断准确性和计算效率	提出了CNN-Transformer混合架构的三种集成范式（顺序、并行、分层），并通过标准化GigaFLOPs计算效率，系统比较了不同架构的诊断准确率和计算开销	存在发表偏倚（Egger检验p=0.043），亚组分析因样本量不足（每组少于10篇）而无法进行正式荟萃分析，混合模型在低级别胶质瘤中准确率从94.6%降至88.3%，对高斯噪声的敏感性是CNN模型的2.3倍	评估CNN-Transformer混合架构在脑肿瘤检测中的诊断准确性和计算效率，并分析GANs和多模态影像融合的作用	脑肿瘤检测方法（包括CNN-only、Transformer-only和CNN-Transformer混合模型）	计算机视觉	脑肿瘤	医学影像（MRI、PET等）	CNN-Transformer混合模型	医学影像	94篇符合纳入标准的研究	未明确提及	CNN, Transformer, CNN-Transformer混合架构	诊断准确率, 计算效率（GigaFLOPs）, 推理时间	基于BraTS基准（240×240×155体素）标准化的GigaFLOPs计算
154	2026-06-19	Deep learning-based autonomous retinal vein cannulation in ex vivo porcine eyes 2025-12-17, Science robotics IF:26.1Q1 DOI:10.1126/scirobotics.adw2969 PMID:41406252	研究论文	提出一种基于深度学习与计算机视觉的自主视网膜静脉穿刺工作流程，并在离体猪眼上验证其效果	利用深度学习预测针头运动方向及识别接触与穿刺事件，结合两台稳手眼机器人实现自主手术操作，在动态眼动条件下仍保持高成功率	仅在离体猪眼上测试，且模拟的眼动可能无法完全代表真实临床中呼吸等复合因素对眼球运动的影响	实现视网膜静脉穿刺关键步骤的自主化，提升手术精准性与可靠性	离体猪眼及其模拟呼吸运动的动态模型	计算机视觉, 机器人控制	视网膜静脉阻塞	术中光学相干断层扫描	卷积神经网络	图像	20只离体猪眼用于静态实验，6只用于动态模拟眼动实验	PyTorch	CNN	成功率	NA
155	2026-06-19	NeuroFusionNet: a hybrid EEG feature fusion framework for accurate and explainable Alzheimer's Disease detection 2025-12-15, Scientific reports IF:3.8Q1 DOI:10.1038/s41598-025-28070-x PMID:41398345	研究论文	提出NeuroFusionNet混合深度学习框架，融合手工特征与1D-CNN时序特征，用于基于脑电图（EEG）的阿尔茨海默病准确且可解释检测	首次将手工特征与1D-CNN潜在时间嵌入特征融合，并结合Pearson相关系数、粒子群优化（PSO）进行特征选择，主成分分析（PCA）降维及SMOTE类别平衡，同时使用SHAP和Grad-CAM实现模型解释性	仅基于三个公开EEG数据集验证，未涉及真实临床多中心数据；模型在低资源场景下的泛化能力需要进一步评估	开发一种准确、可解释且高效的基于EEG的阿尔茨海默病检测方法，实现早期诊断并支持临床部署	阿尔茨海默病及相关痴呆症患者，通过EEG信号进行二分类检测	机器学习	阿尔茨海默病	脑电图（EEG）	混合深度学习框架（1D-CNN + 深度神经网络）	EEG时间序列信号	三个公开数据集：OpenNeuro ds004504（闭眼）、OpenNeuro ds006036（睁眼）及独立OSF数据集，具体样本数未在摘要中明确	NA	1D-CNN、五层深度神经网络	准确率（94.27%）、宏F1分数（0.94）、标准差（SD<0.3%）、推理时间（6.5ms每样本）、模型参数（0.94M）、内存占用（4.1MB）	无需GPU支持，可在标准临床CPU上实时部署
156	2026-06-19	Automatic specific absorption rate (SAR) prediction for hyperthermia treatment planning using deep learning method 2025-12, International journal of hyperthermia : the official journal of European Society for Hyperthermic Oncology, North American Hyperthermia Group IF:3.0Q2 DOI:10.1080/02656736.2025.2554860 PMID:40922671	research paper	提出一种基于深度学习的快速准确比吸收率预测方法，用于支撑脑癌患者热疗计划制定	采用编码器-解码器神经网络结合交叉注意力块，首次实现从脑电特性、肿瘤坐标和天线相位快速预测比吸收率分布，将计算时间从10分钟缩短至4秒	NA	实现实时热疗计划中比吸收率分布的快速准确预测，支持自适应治疗策略	人体头部模型中的比吸收率分布	machine learning	brain cancer	NA	encoder-decoder neural network	simulation data	201个仿真样本，其中20个用于测试	NA	encoder-decoder with cross-attention blocks	root-mean-squared error, mean absolute error, structural similarity index	NA
157	2026-06-19	Deep domain adaptation eliminates costly data required for task-agnostic wearable robotic control 2025-11-19, Science robotics IF:26.1Q1 DOI:10.1126/scirobotics.ads8652 PMID:41259448	研究论文	提出一种深度域自适应框架，通过生物力学模型的模拟传感器克服可穿戴机器人控制中的数据稀缺问题	利用模拟传感器作为过渡域，将易获取数据转化为数据稀缺域的有效数据，实现无标签或无设备特定数据下的任务无关可穿戴机器人控制	无法从摘要中提取明确限制，可能包括对模拟传感器精度的依赖及泛化能力的潜在限制	解决可穿戴机器人控制中数据驱动的个性化需求与高质量设备特定数据获取困难之间的矛盾	髋/膝外骨骼及其控制力矩估计器	机器学习	NA	深度域自适应	深度域自适应网络	模拟传感器数据、开放数据集、未标记外骨骼数据	8名参与者（外骨骼实时控制部署）	PyTorch	深度域自适应网络	误差（Nm/kg）、代谢成本降低百分比	NA
158	2026-06-19	How Can Clinicians Leverage Vibe Coding for Machine Learning and Deep Learning Research? 2025-10, Endocrinology and metabolism (Seoul, Korea) DOI:10.3803/EnM.2025.2675 PMID:41208262	综述	探讨临床医生如何利用‘氛围编码’工具和方法进行机器学习和深度学习研究	提出‘氛围编码’概念，定义其工作流程，分类现有工具，并通过实例展示其降低编程门槛的潜力	未提供定量比较不同工具的性能或验证其在复杂医学任务中的有效性	帮助缺乏编程技能的临床医生开展机器学习和深度学习研究	机器学习和深度学习研究中的‘氛围编码’工具及应用	人工智能与医学	NA	NA	NA	文本、代码	NA	TensorFlow, PyTorch, Keras, Scikit-learn	NA	NA	NA
159	2026-06-19	Street view images help to reveal the impact of noisy environments on the survival duration of stroke patients 2025-09-26, International journal of health geographics IF:3.0Q2 DOI:10.1186/s12942-025-00416-8 PMID:41013534	研究论文	利用街景图像和深度学习模型揭示噪声环境对脑卒中患者生存期的影响	首次使用街景图像结合多模态深度学习模型评估住宅噪声水平，并探讨噪声对脑卒中死亡率的年龄组和社会经济差异	未提及研究局限	研究道路交通噪声对脑卒中患者死亡率的年龄组和社会经济差异影响	辽宁省阜新市2011-2019年间住院的36240名脑卒中患者	机器学习	脑卒中	NA	多模态深度学习模型	街景图像	36240名脑卒中住院患者	NA	多模态深度学习模型	风险比（HR）、95%置信区间（CI）、p值、人口归因分数	NA
160	2026-06-19	3D Deep Learning for Virtual Orbital Defect Reconstruction: A Precise and Automated Approach 2025-09-01, The Journal of craniofacial surgery IF:1.0Q3 DOI:10.1097/SCS.0000000000011143 PMID:39960444	研究论文	提出一种改进的3D U-Net+++架构用于虚拟眼眶缺损重建，实现高精度和自动化	首次采用改进的3D U-Net+++架构处理涉及中线两侧的眼眶缺损，克服传统镜像技术的局限性，并实现完全自动化	仅基于CT扫描数据，未涉及其他影像模态；临床验证样本量较小（仅15例）	开发精确自动化的虚拟眼眶缺损重建方法以辅助术前规划	眼眶缺损（包括合成缺损和临床骨折病例）的虚拟重建	计算机视觉	眼眶骨折	CT扫描	3D U-Net+++	图像（CT扫描）	300个合成缺损（来自颅骨螺旋CT扫描）和15例临床眼眶骨折病例	NA	3D U-Net+++	Hausdorff距离（HD95）、平均对称表面距离（ASSD）、表面Dice相似系数（Surface DSC）、峰值信噪比（PSNR）、结构相似性指数（SSIM）、5点Likert量表评分	NA