#评估工具
Awesome-LLM-Eval - 集成了评估工具、数据集、演示与论文资源的平台
大模型评估评估工具评估数据集LLM应用LLM技术边界Github开源项目
Awesome-LLM-Eval 包罗万象,集成了评估工具、数据集、演示与论文资源,深入探讨大型语言模型的评估技术和方法。该平台支撑学术探索与实际应用,并致力于提升语言模型的透明度及可信度。
sliiidea - 智能创意管理与评估应用
AI工具Sliiidea想法管理评估工具决策辅助创意组织
这是一款专注于创意管理的应用,通过直观的滑动功能实现想法的快速捕捉、组织和优先排序。应用提供简洁界面,支持列表组织、筛选和状态跟踪,帮助用户评估创意并做出明智决策。未来计划推出AI集成、协作管理和多媒体支持等功能,致力于成为创意激发和培养的有力工具。
fadtk - 标准化Frechet音频距离计算工具
FAD音频嵌入评估工具音频模型音频距离Github开源项目
fadtk是一个计算Frechet音频距离(FAD)的标准化工具库。它支持多种音频嵌入模型,能高效计算音频嵌入和FAD∞分数。该工具提供预计算统计数据用于基线比较,可计算单曲FAD以识别异常。fadtk主要用于评估生成音乐质量,为音频研究提供了实用灵活的解决方案。
ScubaGear - Microsoft 365安全配置评估工具
ScubaGearMicrosoft 365安全配置评估工具CISAGithub开源项目
ScubaGear是一款开源的Microsoft 365租户配置评估工具,旨在验证租户设置是否符合CISA安全配置基线标准。该工具通过PowerShell查询M365 API,结合Open Policy Agent比对Rego安全策略,生成多格式报告。ScubaGear可从PowerShell Gallery安装,支持多产品评估,为管理员提供高效的合规性检查解决方案。
相关文章