#评估模型
CMB - 中文医学基准测试,全面评估医疗AI模型的知识与临床能力
CMB医学基准测试评估模型数据集人工智能Github开源项目
Chinese Medical Benchmark (CMB)是一个全面的中文医学基准测试项目,由CMB-Exam和CMB-Clin两部分组成。CMB-Exam包含11200道测试题,覆盖6大类28个子类的医学知识。CMB-Clin提供74个复杂医疗咨询案例。该项目致力于评估医疗AI模型的知识储备和临床推理能力,为中文医疗AI发展提供参考标准。
metricx-23-qe-xl-v2p0 - Google开发的无参考机器翻译质量评估模型
机器翻译MetricX-23Huggingface模型评估模型Github开源项目谷歌NLP
MetricX-23-QE-XL-V2P0是一款无需参考翻译的机器翻译质量评估模型。该模型由Google开发,基于mT5架构微调而成,能准确预测翻译质量得分。在WMT'23指标共享任务中表现优异,适用于评估多语言对的翻译质量。通过合成数据训练,MetricX-23-QE-XL-V2P0增强了对各种翻译缺陷的识别能力,代表了机器翻译质量评估技术的重要进展。