Awesome-LLMs-Evaluation-Papers
该项目汇总了大型语言模型(LLMs)评估领域的前沿研究论文,涵盖知识能力、对齐性和安全性评估等方面。还包括特定领域的LLMs评估和综合评估平台介绍。旨在为研究人员提供全面的LLMs评估资源,推动语言模型的可靠发展,平衡社会效益与潜在风险。