本数据库通过收集和整理最新科研文献信息而得,供了解领域前沿进展之用。数据源自 PubMed Data ,每日自动更新(使用关键词“['deep learning']”过滤),已收录文献数量参见 统计表格。表格内容由 GPT 自动整理,可能存在错误或遗漏,请使用时务必注意核实!
如有建议或合作意向,欢迎联系 linlin.yan(AT)bioinfo.app 或 微信 yanlinlin82。本项目遵循 MIT 许可 发布,欢迎下载 源码 自行修改使用。如觉得不错,还请不吝 给我打赏,你的支持是我继续创新的重要动力!


除通过在线浏览外,为方便用户离线查阅,本站也提供 付费下载(定价19.9元)。之所以考虑收费,是因为批量扫描这些文献并整理也是有一定成本的,还请理解并多多支持。本站数据会持续更新,而仅需一次付费,未来就可以随时重新下载到最新版本数据。
| 序号 | 推送日期 | 文章 | 类型 | 简述 | 创新点 | 不足 | 研究目的 | 研究对象 | 领域 | 病种 | 技术 | 模型 | 数据类型 | 样本量 | 算法框架 | 模型架构 | 性能指标 | 计算资源 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 461 | 2025-12-12 |
Phytochemical-based discovery of a potent antimalarial candidate targeting PfPI4K: A hybrid structure-based and deep learning approach
2025-Dec, Experimental parasitology
IF:1.4Q3
DOI:10.1016/j.exppara.2025.109064
PMID:41270854
|
研究论文 | 本研究通过结合基于结构的同源建模与深度学习筛选方法,从天然蒽醌类化合物中识别出靶向PfPI4K的强效抗疟候选药物AD37 | 首次采用混合结构建模与深度学习策略筛选天然蒽醌类化合物,发现具有高结合亲和力的新型PfPI4K抑制剂AD37 | 研究仅基于计算模拟和体外数据,缺乏体内实验验证;样本量较小(58个化合物) | 发现新型抗疟药物靶点PfPI4K的抑制剂以应对青蒿素部分耐药问题 | 恶性疟原虫磷脂酰肌醇4-激酶(PfPI4K)及58种具有抗疟活性的天然蒽醌类化合物 | 计算药物发现 | 疟疾 | 同源建模、分子对接、ADMET分析、分子动力学模拟 | 深度学习模型(未具体说明类型) | 化合物结构数据、蛋白质序列数据 | 58个天然蒽醌类化合物 | Modeller 10.5, GLIDE, GROMACS | NA | 结合亲和力(-5.983 kcal/mol)、Lipinski规则符合性、ADMET参数、分子动力学稳定性 | NA |
| 462 | 2025-12-12 |
BAGEL: Protein engineering via exploration of an energy landscape
2025-Dec, PLoS computational biology
IF:3.8Q1
DOI:10.1371/journal.pcbi.1013774
PMID:41337470
|
研究论文 | 本文介绍了BAGEL,一个用于可编程蛋白质工程的模块化开源框架,通过模型无关和无梯度的能量景观探索,实现序列空间的灵活探索 | 提出了一种模块化、开源且模型无关的蛋白质工程框架,支持多状态优化和高级蒙特卡洛技术,突破了现有计算流程的刚性和特定性限制 | 未明确提及框架在特定蛋白质设计任务中的性能上限或计算效率的具体限制 | 开发一个灵活、可编程的蛋白质工程框架,以加速新蛋白质的设计并降低技术门槛 | 蛋白质序列与结构设计 | 机器学习 | NA | 能量函数采样、蒙特卡洛技术 | 深度学习蛋白质模型 | 蛋白质序列与结构数据 | NA | 开源自定义框架(BAGEL) | 模型无关架构,支持集成多种公开深度学习蛋白质模型 | NA | NA |
| 463 | 2025-12-12 |
CPSMI2025: A curated dataset of conventional Pap smear microscopy images for deep learning-based cervical cancer screening
2025-Dec, Data in brief
IF:1.0Q3
DOI:10.1016/j.dib.2025.112272
PMID:41362340
|
研究论文 | 本文介绍了一个名为CPSMI2025的宫颈癌筛查数据集,包含2169张高分辨率巴氏涂片显微图像,用于支持深度学习自动化筛查工具的开发 | 提供了一个基于低成本开源显微平台采集的、包含九个临床相关细胞学类别的巴氏涂片图像数据集,专门针对资源有限地区设计 | 数据集仅来源于墨西哥两家医疗机构,可能无法完全代表全球不同人群的细胞学特征 | 开发自动化宫颈癌筛查工具,以解决资源有限地区专科医生不足的诊断瓶颈 | 巴氏涂片显微图像 | 数字病理学 | 宫颈癌 | 显微成像 | NA | 图像 | 2169张高分辨率图像,源自超过350张手动筛查的玻片 | NA | NA | NA | NA |
| 464 | 2025-12-12 |
Artificial inteligence and datasets for leukemia diagnosis: A scoping review of machine lerning and deep learning approaches
2025-Dec, MethodsX
IF:1.6Q2
DOI:10.1016/j.mex.2025.103722
PMID:41362667
|
综述 | 本文对用于白血病诊断的机器学习和深度学习方法进行了范围性综述,重点关注基于公开数据集的图像技术 | 系统回顾了基于公开数据集(如ALL-IDB、C-NMC等)的ML和DL方法,并讨论了研究空白和未来方向,如可解释AI和符合WHO 2022标准的分类框架 | 存在数据集不平衡、染色变异性、缺乏标准注释和临床验证有限等问题 | 综述机器学习和深度学习方法在白血病诊断中的应用 | 白血病诊断 | 数字病理学 | 白血病 | 外周血涂片检查、骨髓活检 | CNN, ResNet, DenseNet, MobileNet, 集成模型 | 图像 | 基于公开数据集(如ALL-IDB、C-NMC、AML_Cytomorphology_LMU、SN-AM、CPTAC-AML) | NA | 卷积神经网络, ResNet, DenseNet, MobileNet | NA | NA |
| 465 | 2025-12-12 |
Classification of periapical dental X-ray using the YOLOv8 deep learning model
2025-Dec, MethodsX
IF:1.6Q2
DOI:10.1016/j.mex.2025.103721
PMID:41362668
|
研究论文 | 本研究提出了一种结合ESRGAN和YOLOv8的两阶段管道,用于牙科X射线图像的增强和多类牙科异常检测 | 首次将ESRGAN与YOLOv8结合,用于牙科X射线图像的增强和分类,提高了图像细节和分辨率,并实现了六种牙科状况的自动检测 | 龋齿和严重腐烂牙齿的检测灵敏度较低,分别为0.174和0.355,且不同类别的特异性差异较大,表明假阳性率可变 | 提高牙科X射线图像的诊断准确性,通过图像增强和深度学习模型实现自动牙科评估 | 牙科X射线图像 | 计算机视觉 | 牙科疾病 | 深度学习,图像增强 | GAN, CNN | 图像 | 100张测试图像 | PyTorch | ESRGAN, YOLOv8 | PSNR, SSIM, mAP@0.5, mAP@0.5:0.95, 灵敏度, 特异性 | NA |
| 466 | 2025-12-12 |
Deep Learning-Based Assessment for Media Haze and Retinal Vascular Leakage of Uveitis
2025-Dec, Ocular immunology and inflammation
IF:2.6Q2
DOI:10.1080/09273948.2025.2567520
PMID:41123627
|
研究论文 | 本研究应用深度学习自动评估葡萄膜炎的介质混浊和血管渗漏,并评估其性能 | 首次结合EfficientNetV2-L、InceptionV3、MobileNetV3和LadderNet模型,自动化评估葡萄膜炎的介质混浊和血管渗漏,并通过K-means聚类识别渗漏模式 | 样本量相对有限(213名患者),且依赖眼科医生的标注,可能存在主观偏差 | 开发自动化评估葡萄膜炎介质混浊和血管渗漏的深度学习模型,以改进诊断准确性和疾病活动性指标 | 葡萄膜炎患者的彩色眼底照相(CFP)和荧光素眼底血管造影(FFA)图像 | 计算机视觉 | 葡萄膜炎 | CFP, FFA | CNN | 图像 | 213名患者的756张CFP图像和740张FFA图像 | NA | EfficientNetV2-L, InceptionV3, MobileNetV3, LadderNet | Micro-AUC, Dice相似系数(DSC) | NA |
| 467 | 2025-12-12 |
Stretchable Polymorphic Electrochromic Textile Electronics for Deep Learning-Assisted Self-Adaptive Camouflage
2025-Dec, Small (Weinheim an der Bergstrasse, Germany)
DOI:10.1002/smll.202510137
PMID:41123949
|
研究论文 | 本文开发了一种基于无液体聚氨酯-脲弹性离子导体的可拉伸全固态多态电致变色纺织电子系统,并利用MobileNetV2深度学习模型实现动态环境下的自适应伪装 | 开发了具有超分子-共价双交联网络的弹性离子导体,实现了快速响应、高色彩对比度、长期运行及大变形与低温下优异着色稳定性的电致变色纺织电子系统,并首次集成了深度学习模型以实现环境驱动的自适应伪装 | 未明确说明系统在极端环境(如高温、高湿)下的长期稳定性,也未讨论大规模生产的经济可行性与纺织品的洗涤耐久性 | 开发具有优异变色性能、机械可靠性和环境稳定性的智能纺织电子系统,实现基于深度学习的环境自适应伪装 | 可拉伸电致变色纺织电子系统及其在人体伪装中的应用 | 机器学习 | NA | 电致变色技术,弹性离子导体制备 | CNN | 环境信息数据(推测为图像或传感器数据) | NA | NA | MobileNetV2 | 响应时间(≈3秒),色彩对比度(≈58.1%),运行时长(>12000秒) | NA |
| 468 | 2025-12-12 |
Deep geometric framework to predict antibody-antigen binding affinity
2025-Dec, Journal of structural biology
IF:3.0Q3
DOI:10.1016/j.jsb.2025.108257
PMID:41138893
|
研究论文 | 本文提出了一种新颖的深度几何神经网络框架,用于预测抗体-抗原结合亲和力,通过结合结构模型和序列模型,并利用交叉注意力块共享信息 | 构建了最大且最通用的抗体-抗原结合亲和力预测数据集,并设计了一种结合结构特征和序列进化信息的深度几何神经网络,通过多尺度分层注意力块模拟相互作用空间 | 模型高度依赖于抗体-抗原结构的质量,且现有数据集可能仍存在局限性,尽管已扩展至多种抗原变体 | 开发一种高效且准确的抗体-抗原结合亲和力预测方法,以支持药物开发 | 抗体-抗原序列对和结构对,以及对应的连续结合亲和力值 | 机器学习 | NA | 深度几何神经网络 | 几何神经网络, 注意力机制 | 序列数据, 结构数据 | 超过100K序列对和8K结构对 | PyTorch, TensorFlow (未明确指定,但基于深度学习框架) | 交叉注意力块, 多尺度分层注意力块 | 平均绝对误差, 相关系数 | NA |
| 469 | 2025-12-12 |
Long Short-Term Memory-Driven Modeling of Dynamic Hepatocellular Carcinoma Microenvironments: A Deep Learning Framework for Precision Treatment Prediction
2025-Dec, JCO precision oncology
IF:5.3Q1
DOI:10.1200/PO-25-00315
PMID:41370726
|
研究论文 | 本研究评估了深度学习方法,特别是长短期记忆网络,用于分析肝细胞癌肿瘤微环境的动态变化,以改善疾病理解和治疗预测 | 首次将LSTM网络与CNN结合,集成多模态数据,用于动态建模肝细胞癌肿瘤微环境的时空演化,并通过GAN进行数据增强 | 由于缺乏详细的病因学信息,未对不同病因(如乙型肝炎病毒、丙型肝炎病毒和非酒精性脂肪性肝炎)进行分层验证 | 通过深度学习框架分析肝细胞癌肿瘤微环境的动态变化,以改进疾病理解和精准治疗预测 | 肝细胞癌肿瘤微环境的多模态数据,包括高通量测序、蛋白质表达和时间序列成像数据 | 数字病理学 | 肝细胞癌 | 高通量测序, 蛋白质表达分析, 时间序列成像 | LSTM, CNN, GAN | 多模态数据(测序、蛋白质表达、时间序列图像) | NA | NA | LSTM, CNN, GAN | 准确率 | NA |
| 470 | 2025-12-12 |
Assessing the generalizability of artificial intelligence in radiology: a systematic review of performance across different clinical settings
2025-Dec, Annals of medicine and surgery (2012)
DOI:10.1097/MS9.0000000000004166
PMID:41377327
|
系统综述 | 本文通过系统综述评估了人工智能在放射学诊断模型中的外部泛化性能 | 系统性地评估了AI模型在不同临床环境下的泛化性能,并识别了可能增强泛化性的方法 | 纳入的研究数量有限(仅6项),且部分研究存在患者选择偏倚或采样不明确的问题 | 评估人工智能在放射学诊断中的外部泛化性能,以促进其临床部署 | 应用于计算机断层扫描、磁共振成像或X射线的AI诊断模型 | 计算机视觉 | NA | NA | CNN, GAN | 图像 | NA | NA | 3D Convolutional Neural Networks, Generative Adversarial Networks-augmented models, no-new-U-Net ensembles | AUC, 灵敏度, 特异度 | NA |
| 471 | 2025-12-12 |
Artificial Intelligence in IPMN diagnosis: bridging promise and clinical reality
2025-Dec, Annals of medicine and surgery (2012)
DOI:10.1097/MS9.0000000000004170
PMID:41377378
|
综述 | 本文综述了人工智能(AI)在胰腺导管内乳头状黏液性肿瘤(IPMN)诊断中的应用、潜力及面临的挑战 | 系统性地总结了AI(尤其是机器学习和深度学习模型)在利用CT、MRI和内镜超声区分IPMN良恶性病变方面的高性能表现(准确率高达94-99.6%),并指出其超越传统临床评估的潜力 | AI的广泛应用受到缺乏标准化成像协议、方法学透明度不足以及缺乏前瞻性多中心验证的限制 | 评估人工智能在IPMN风险分层和精准诊断中的应用前景,并探讨其融入临床实践与国际指南的路径 | 胰腺导管内乳头状黏液性肿瘤(IPMN) | 数字病理学 | 胰腺癌 | CT, MRI, 内镜超声 | 机器学习, 深度学习 | 医学影像 | NA | NA | NA | 准确率 | NA |
| 472 | 2025-12-12 |
Interpretable Thermodynamic Score-based Classification of Relaxation Excursions
2025-Dec-01, bioRxiv : the preprint server for biology
DOI:10.1101/2025.11.26.690838
PMID:41377511
|
研究论文 | 提出一种名为Keeping SCORE的物理启发式方法,将扩散模型转化为分类和回归的概率引擎,通过测量不同类别假设下的噪声轨迹耗散来计算精确的类别似然和预测置信度 | 将扩散模型应用于分类和回归任务,通过非平衡统计力学原理提供不确定性估计和特征归因,实现无需修改现有训练模型的可解释性 | NA | 开发一种可解释且具有不确定性感知的分类与回归框架,应用于计算生物学和科学领域 | 图像识别任务(手写数字、自然照片)、单细胞基因组学(细胞身份区分、基因扰动效应映射)和分子生物物理学(突变对蛋白质折叠能量的影响预测) | 机器学习 | NA | 扩散模型 | 扩散模型 | 图像、单细胞基因组数据、分子生物物理数据 | NA | NA | 扩散模型 | 准确率、概率估计 | NA |
| 473 | 2025-12-12 |
From detection to grading: A hybrid KOA-YOLOv5-RF model for knee osteoarthritis diagnosis
2025-Dec, MethodsX
IF:1.6Q2
DOI:10.1016/j.mex.2025.103725
PMID:41378376
|
研究论文 | 本研究提出了一种基于混合深度学习与机器学习框架的计算机辅助诊断系统,用于从X射线图像中检测并分级膝关节骨关节炎的严重程度 | 将YOLOv5的目标检测与分割能力与随机森林分类器的序数分级能力相结合,构建了一种可扩展、可解释且临床相关的混合模型 | 研究未明确说明模型在不同医疗机构或设备采集的X射线图像上的泛化能力,也未讨论计算资源需求对资源受限环境的实际适用性 | 开发一种计算机辅助诊断系统,以支持放射科医生进行膝关节骨关节炎的早期诊断和严重程度分级 | 膝关节骨关节炎的X射线图像 | 计算机视觉 | 膝关节骨关节炎 | X射线成像 | CNN, 随机森林 | 图像 | 1535张X射线图像 | PyTorch, Scikit-learn | YOLOv5 | 准确率, ROC-AUC, Cohen's kappa, 敏感性, 特异性 | NA |
| 474 | 2025-12-12 |
Evaluation on the Feasibility of the Pulse Oximetry-triggered Coronary CT Angiography
2025-Dec, Radiology. Cardiothoracic imaging
DOI:10.1148/ryct.240495
PMID:41379007
|
研究论文 | 本研究评估了基于脉搏血氧计触发的冠状动脉CT血管成像(CCTA)在无法或难以连接心电图设备的心脏受试者中应用的可行性 | 提出并验证了一种基于脉搏血氧计监测心率生成模拟虚拟ECG信号来触发CCTA的新方案,替代传统的ECG触发方式 | 研究为单中心前瞻性研究,样本量相对有限(300名参与者),且仅使用了16-cm z轴覆盖范围的CT设备 | 评估脉搏血氧计触发CCTA在临床诊断成像中的可行性,特别是针对无法使用ECG设备的患者 | 计划接受冠状动脉CT血管成像(CCTA)的连续参与者 | 数字病理学 | 心血管疾病 | 冠状动脉CT血管成像(CCTA)、脉搏血氧计心率监测、运动校正算法、深度学习图像重建 | NA | 医学影像(CT图像) | 300名参与者(平均年龄57岁±12;161名男性),分为脉搏血氧计触发组(n=150)和传统ECG触发组(n=150) | NA | NA | 辐射剂量、对比剂剂量、检查时间、CT衰减值、图像噪声、信噪比、对比噪声比、整体图像质量主观评估 | 16-cm z轴覆盖范围的CT设备,具体计算资源未说明 |
| 475 | 2025-12-12 |
Preoperative prediction of axillary lymph node metastasis in breast invasive ductal carcinoma patients using a deep learning model based on dynamic contrast-enhanced magnetic resonance imaging: a multicenter study
2025-Nov-30, Gland surgery
IF:1.5Q3
DOI:10.21037/gs-2025-365
PMID:41377877
|
研究论文 | 本研究开发并验证了一个基于动态对比增强磁共振成像的深度学习模型,用于术前预测乳腺浸润性导管癌患者的腋窝淋巴结转移 | 结合深度学习特征与临床特征构建预测模型,并在多中心数据上验证其性能,显著提升了预测准确性 | 研究为回顾性分析,样本量相对有限,且仅基于特定医院的影像数据,可能存在选择偏倚 | 开发非侵入性工具以术前预测乳腺浸润性导管癌患者的腋窝淋巴结转移,辅助临床决策 | 520名诊断为乳腺浸润性导管癌的患者 | 数字病理学 | 乳腺癌 | 动态对比增强磁共振成像 | 深度学习模型 | 医学影像 | 520名患者(411名用于训练和内部验证,109名用于外部测试) | NA | NA | AUC | NA |
| 476 | 2025-12-12 |
Enhanced Feature Extraction for Detection and Classification of Kidney Abnormalities
2025-11-29, Current medical imaging
IF:1.1Q3
|
研究论文 | 本研究提出了一种基于深度学习的诊断框架,通过新型模型KTNET增强特征提取,用于从CT扫描图像中自动检测和分类多种肾脏异常 | 引入了基于Transformer架构的新型模型Kidney Transformer Network (KTNET),以增强疾病特异性特征提取,提高肾脏异常的分类准确性 | NA | 开发一个智能、可靠的框架,用于肾脏异常的早期检测和分类,以改善患者诊断和临床决策 | 肾脏异常,包括囊肿、结石、肿瘤和其他结构性病变 | 计算机视觉 | 肾脏疾病 | CT扫描 | Transformer | 图像 | NA | NA | Kidney Transformer Network (KTNET) | 准确率, 精确率, 召回率, F1分数 | NA |
| 477 | 2025-12-12 |
Analytical and numerical solutions of MABC fractional advection dispersion models by utilizing the modified physics informed neural networks with impacts of fractional derivative
2025-Nov-27, Scientific reports
IF:3.8Q1
DOI:10.1038/s41598-025-30065-7
PMID:41310394
|
研究论文 | 本研究提出了一种新的分数阶对流扩散方程,并利用改进的物理信息神经网络(PINNs)框架对其进行数值求解 | 提出了基于改进的Atangana-Baleanu-Caputo(MABC)分数阶导数的对流扩散方程新公式,并开发了专门的PINNs算法来求解MABC意义上的分数阶微分方程 | 未在摘要中明确说明 | 开发准确有效的数学模型以模拟污染物传输现象,并求解分数阶对流扩散方程 | 污染物传输的分数阶对流扩散模型 | 机器学习 | NA | 物理信息神经网络(PINNs) | 深度学习模型 | NA | NA | TensorFlow, PyTorch | 物理信息神经网络 | 精度, 计算效率 | NA |
| 478 | 2025-12-12 |
Deep Generative Model-Driven Design of Microbial Synthetic Promoters
2025-Nov-26, Journal of microbiology and biotechnology
IF:2.5Q3
DOI:10.4014/jmb.2510.10043
PMID:41309366
|
综述 | 本文综述了利用深度生成模型(VAE、GAN、扩散模型)设计和生成具有可调表达水平的微生物合成启动子的方法、流程和应用 | 系统总结并比较了三种主流深度生成模型(VAE、GAN、扩散模型)在合成启动子设计中的原理、优势和应用策略,为这一新兴领域提供了全面的方法学框架 | 作为综述文章,未提出新的原创模型或实验数据,主要基于现有文献进行归纳和评述 | 探讨如何利用深度学习技术加速和优化微生物合成启动子的设计与生成 | 微生物合成启动子(人工设计的DNA序列) | 机器学习 | NA | 深度生成模型(DGM) | VAE, GAN, 扩散模型 | DNA序列数据 | NA | NA | NA | NA | NA |
| 479 | 2025-12-12 |
A predicted structural interactome reveals binding interference from intrinsically disordered regions
2025-Nov-20, bioRxiv : the preprint server for biology
DOI:10.1101/2025.08.15.670535
PMID:40894573
|
研究论文 | 本研究利用AlphaFold2多聚体预测了秀丽隐杆线虫中的蛋白质-蛋白质相互作用,并强调了内在无序区域在预测高置信度相互作用中的重要性 | 结合物理和功能数据集,通过深度学习预测蛋白质相互作用,并首次系统性地分析了内在无序区域在预测中的作用 | 研究主要基于秀丽隐杆线虫,可能不直接适用于其他物种,且预测结果需要实验验证 | 预测和分析蛋白质-蛋白质相互作用,特别是内在无序区域的作用 | 秀丽隐杆线虫中的蛋白质 | 机器学习 | NA | AlphaFold2多聚体 | 深度学习模型 | 蛋白质序列和结构数据 | NA | AlphaFold2 | AlphaFold2多聚体 | NA | NA |
| 480 | 2025-12-12 |
Validating Radiology Artificial Intelligence Model Performance on Photon-Counting CT Images Using Large Language Models for Ground Truth Extraction
2025-Nov-19, Journal of the American College of Radiology : JACR
IF:4.0Q1
DOI:10.1016/j.jacr.2025.11.024
PMID:41265766
|
研究论文 | 本研究评估了使用大型语言模型(LLM)从放射学报告中自动提取真实标签的可行性,以验证放射学人工智能模型在光子计数CT图像上的性能 | 首次提出利用LLM自动化提取放射学报告中的真实标签,为AI工具的性能评估提供可扩展且高效的替代方案,特别是在新型成像硬件(如PCCT)引入输入漂移时 | 研究为回顾性分析,LLM提取的标签可能存在错误,需部分人工校正;样本仅涵盖四种特定诊断任务,可能无法推广到其他放射学领域 | 验证使用LLM自动化提取放射学报告真实标签的可行性,以支持放射学AI工具的可扩展性能评估和监控 | 针对肺栓塞、颅内出血、颈椎骨折和椎体压缩性骨折的四种FDA批准的深度学习计算机辅助检测和分诊工具 | 自然语言处理 | 肺栓塞, 颅内出血, 颈椎骨折, 椎体压缩性骨折 | 光子计数CT(PCCT)扫描, 传统CT扫描 | 深度学习 | 文本(放射学报告) | 未明确指定样本数量,但涉及使用新型PCCT扫描仪和传统扫描仪获取的检查报告 | 未明确指定,但使用了LLM(Llama 3.3) | 未明确指定具体架构,但基于LLM(Llama 3.3) | Fleiss's κ(用于测量评分者间一致性),性能指标(如准确性等,但未具体列出) | 未明确指定 |