#自动评估

phospho学习资料汇总 - LLM应用的文本分析与洞察后台

2024年09月10日
Cover of phospho学习资料汇总 - LLM应用的文本分析与洞察后台

Artemis: 互动学习平台的创新之路

2024年09月05日
Cover of Artemis: 互动学习平台的创新之路

磷光(Phospho):为LLM应用提供文本分析的革命性平台

2024年08月31日
Cover of 磷光(Phospho):为LLM应用提供文本分析的革命性平台
相关项目
Project Cover

phospho

Phospho 是为LLM应用设计的文本分析平台,提供灵活的日志记录、自动评估、洞察提取和数据可视化等功能,帮助开发者发现问题和提取用户反馈,从而评估应用的效果。借助phospho,开发者可以安心地在生产环境中部署LLM应用,并通过用户反馈不断优化对话体验。该平台支持Python和JavaScript客户端,方便快速集成和自动处理批量信息事件。用户还可以在注册托管版本后,在协作平台上管理phospho实验室的评估工作。

Project Cover

Artemis

Artemis是一个开源的交互式学习平台,为编程、测验和建模等练习提供即时个性化反馈。该平台支持多种编程语言,集成版本控制和持续集成,提供在线代码编辑器和手动代码审查功能。Artemis还包括测验、建模练习、文本练习、考试模式、评分系统和反作弊检查等功能,为教师提供定制选项,为学生提供实时协作环境,有效结合创新教学与传统教育方法。

Project Cover

metricx-23-large-v2p0

MetricX-23是Google Research开发的开源机器翻译评估模型系列。模型在T5X上训练后转为PyTorch格式,提供参考型和无参考型两种版本,规模从Large到XXL不等。通过合成数据训练,MetricX-23能识别漏译、过度翻译等多种翻译问题。项目提供推理脚本和评估工具,适用于翻译质量研究和实际应用场景。

Project Cover

unieval-dialog

UniEval作为一款开源工具,通过多维度自动评估提升自然语言生成的精确性和细致性。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号