#数据集
DB-GPT-Hub: 提升大语言模型在文本到SQL转换中的性能
深入探讨大语言模型的越狱攻击:挑战、影响与防御策略
first-order-model
First Order Motion Model项目提供了一种先进的图像动画运动模型,通过驾驶视频和源图像生成逼真的动画序列。支持包括VoxCeleb、Fashion和MGIF在内的多种数据集,提供详细的安装和使用指南。项目支持Python和Docker,确保了环境兼容性,还提供Colab和Kaggle的在线演示。此外,该项目还具备面部交换功能,适用于监督和非监督的视频编辑任务。
fiftyone
FiftyOne 是一款提升机器学习工作流的开源工具,通过可视化数据集和解读模型结果来提高效率。用户可用它处理复杂标签、评估模型、探索场景、识别错误模式和注释错误等。安装简便,可通过 pip 安装并运行示例代码快速上手。
ssd.pytorch
该项目实现了基于PyTorch的SSD目标检测器,支持VOC和COCO数据集,并可使用Visdom进行训练过程中的实时损失可视化。页面包含详细的安装、训练和评估指南,并提供预训练模型的使用说明。项目展示了高效性能,并包含未来功能更新计划,帮助开发者快速上手并扩展应用。
CV
本项目提供深度学习视频讲解及笔记资源,涵盖Pytorch、李沐、吴恩达等名师课程,并附有详细的数据集和实用工具。适合从事AI算法开发、图像处理及语音识别方向的求职者,并提供多家知名企业的内推机会,帮助自学者搭建交流平台,实现技术突破和职业发展。
argilla
Argilla是一款为AI工程师和领域专家设计的数据集管理工具,旨在通过高效的数据管理和标注流程提升AI项目的数据质量和模型效果。Argilla支持文本分类、命名实体识别和多模态模型等多种AI项目的数据收集和反馈,帮助用户快速迭代和优化数据与模型。该工具提供开源社区支持,用户可以参与并共享开源数据集和模型。通过与Hugging Face Spaces的集成,用户可以轻松部署和使用Argilla,提高AI项目的整体效率和质量。
魔搭社区
魔搭社区是一个专业平台,旨在汇聚各领域机器学习模型,提供模型探索、推理、训练、部署和应用等一站式服务。设计简约,操作便捷,确保用户可以快速找到所需功能。直观的导航和详尽的文档支持帮助用户快速上手,推动机器学习技术的广泛应用。
jailbreak_llms
本项目利用JailbreakHub框架,首次测量和研究野生越狱提示,收集了2022年12月至2023年12月的15,140个提示,其中包括1,405个越狱提示。通过分析Reddit和Discord等平台的数据,本研究旨在提高LLM供应商和研究社区对模型潜在风险的认识,并推动更强大的安全措施。
lunary
Lunary 提供开源的可观测性、提示管理和评估功能,帮助LLM开发者优化应用性能。它支持成本分析、日志监控、提示模板创建和微调数据集,方便快速集成和自托管。兼容JavaScript和Python模块,适用于多种模型,并提供托管版本和本地部署指南,确保数据安全和优质支持。
google-research
Google Research提供多种项目的代码和数据集,数据集在CC BY 4.0国际许可下发布,源码文件在Apache 2.0许可下发布。用户可通过GitHub编辑器下载所需子目录,并进行浅克隆以提交拉取请求。库内容持续更新,最新更新时间为2023年。