#AI实验室
AcmeTrace - 大规模语言模型工作负载数据集
Github开源项目数据集Acme TraceAI实验室工作负载资源利用
AcmeTrace是一个来自上海人工智能实验室的大规模语言模型工作负载数据集,涵盖2023年3月至8月期间的数据。该数据集包含880,740个作业记录,其中470,497个为GPU作业,来自两个独立的GPU集群。这些数据为研究人员提供了分析大规模语言模型在数据中心开发特征的宝贵资源,支持相关学术研究。
Orion - 开源无监督时间序列异常检测库
Github开源项目无监督学习AI实验室Orion时间序列异常检测机器学习库
Orion是MIT数据到AI实验室开发的开源库,专注于无监督时间序列异常检测。该项目提供多个验证过的机器学习管道,能够识别时间序列数据中的异常模式。Orion集成了自动机器学习工具,支持AER、TadGAN等算法,并提供完善的文档、教程和基准测试。兼容Python 3.8-3.11版本,可通过pip轻松安装。适用于需要进行时间序列分析的研究人员和开发者。
POLAR-14B-v0.2 - 韩文大语言模型助力生态系统
Github开源项目开源语言模型模型HuggingfaceAI实验室偏见与风险POLAR
POLAR-14B-v0.2由Plateer AI实验室开发,受启于SOLAR,致力于韩文语言模型的持续发展与贡献。