相关项目
CMB
Chinese Medical Benchmark (CMB)是一个全面的中文医学基准测试项目,由CMB-Exam和CMB-Clin两部分组成。CMB-Exam包含11200道测试题,覆盖6大类28个子类的医学知识。CMB-Clin提供74个复杂医疗咨询案例。该项目致力于评估医疗AI模型的知识储备和临床推理能力,为中文医疗AI发展提供参考标准。
metricx-23-qe-xl-v2p0
MetricX-23-QE-XL-V2P0是一款无需参考翻译的机器翻译质量评估模型。该模型由Google开发,基于mT5架构微调而成,能准确预测翻译质量得分。在WMT'23指标共享任务中表现优异,适用于评估多语言对的翻译质量。通过合成数据训练,MetricX-23-QE-XL-V2P0增强了对各种翻译缺陷的识别能力,代表了机器翻译质量评估技术的重要进展。