Project Icon

langtest

开源工具助力语言模型全面测试与优化

LangTest是一款强大的开源工具,专为语言模型的测试和优化而设计。该工具提供超过60种测试类型,全面评估模型的鲁棒性、偏见、表示、公平性和准确性。LangTest兼容多个主流NLP框架,如Spark NLP、Hugging Face和Transformers。此外,它还能对OpenAI、Cohere等大型语言模型进行问答、毒性检测和临床测试等方面的评估。通过使用LangTest,数据科学家可以开发出更安全、可靠和负责任的自然语言处理模型。

awesome-LLM-resourses - 中文大语言模型全面资源汇总 数据处理到评估应有尽有
GithubLLMRAG大语言模型开源项目微调推理评估
该项目汇总了中文大语言模型(LLM)领域的全面资源,包含数据处理、微调、推理和评估等多个环节的开源工具。资源库涵盖最新LLM技术,并收录RAG系统和AI代理等前沿应用。项目为LLM研究者和开发者提供了丰富的工具和信息,有助于推进相关项目的开发与应用。
can-ai-code - 通过人类撰写的面试题测试AI的编程能力
AI codingDockerGithubLLMquantizationtesting suite开源项目
该项目通过人类撰写的面试题测试AI的编程能力,提供多种主流API提供商和CUDA支持的推理脚本,并在基于Docker的沙盒环境中验证Python和NodeJS代码的安全性。用户可以评估提示技巧和采样参数对大语言模型(LLM)编码性能的影响,以及量化对LLM编码性能的衰减影响。项目包括多语言测试套件和来自OpenAI的Python-only测试套件,支持对比分析,并提供了详尽的结果数据和评估脚本。
HanLP - 面向多语种的生产环境自然语言处理工具,支持PyTorch与TensorFlow
GithubHanLPPyTorchTensorFlow多语种开源项目自然语言处理
HanLP是一款面向生产环境的多语种自然语言处理工具,基于PyTorch和TensorFlow双引擎。支持130种语言和多种NLP任务,包括分词、词性标注、命名实体识别和依存句法分析等。HanLP的预训练模型持续更新,并提供RESTful API和native API,适用于敏捷开发和移动应用。
deepchecks - 用于持续验证 ML 模型和数据的测试
AIDeepchecksGithub开源项目机器学习测试监控
Deepchecks是一款开源工具,专为AI和机器学习模型的验证而设计。它提供从研究到生产的全面测试解决方案,包括数据和模型的测试、持续集成及监控。Deepchecks涵盖数据表格、自然语言处理和计算机视觉的验证需求,并提供详细文档和社区支持,助力提升模型的性能与准确性。用户可轻松安装使用这款工具,确保模型在生产环境中的表现稳定可靠。
langchain-examples - LangChain框架多功能AI应用示例
GithubLangChainStreamlit应用大语言模型开源项目生成式AI问答生成
该项目包含了一系列利用LangChain框架的应用示例,适用于聊天机器人、文本摘要、数据生成、代码理解和问答等场景。项目介绍了与LangChain、OpenAI、Chroma等服务的集成,并提供了代码示例和应用演示,帮助用户更好地掌握相关技术。
LangChain - LangChain的C#实现
C#GithubLLMsLangChainSemanticKernel开源项目数据库
LangChain的C#实现提供了一个灵活且可扩展的大型语言模型框架,支持多种第三方库。该项目适用于创建和管理向量数据库,并能够集成多种LLM模型。团队对拉取请求响应迅速,并欢迎更多开发者参与提升项目质量。查询项目Wiki和示例代码以快速入门。
langui - 开放源代码的UI组件库
AI界面ChatGPTGithubLangUI开源开源项目部署
LangUI提供易于部署的用户界面组件,可通过复制和粘贴快速集成,无需安装或配置,即可帮助您构建和部署AI驱动的ChatGPT应用。
T-Eval - 分步骤评估大语言模型工具使用能力的基准测试框架
GithubT-Eval基准测试大语言模型工具使用能力开源项目评估
T-Eval是一个评估大语言模型工具使用能力的基准测试框架。它将评估过程分解为指令遵循、规划、推理、检索、理解和审查等多个子过程,实现了细粒度分析。该项目提供英文和中文评测数据集、测试脚本和排行榜。T-Eval为研究人员和开发者提供了一个深入分析语言模型工具使用能力的新方法。
LangSaaS - 面向开发者的RAG聊天机器人SaaS模板
AI工具LangChainLangSaaSNextJSRAGchatbot
LangSaaS为开发者提供了一个用于创建基于检索增强生成(RAG)技术的AI聊天机器人应用的SaaS模板。该模板集成了现代化前端(Next.js)和后端(Python环境中的LangChain),以及LangChain、Qdrant、Cohere、UnstructuredIO和Stripe支付网关等工具。开发者可以利用这一模板快速构建和部署RAG聊天机器人应用,大幅缩短开发周期。LangSaaS的模块化架构使其具有良好的可定制性,能够满足不同项目的特定需求。
prompttools - 全面LLM实验评估工具集
GithubLLMPromptTools人工智能向量数据库开源项目提示词实验
PromptTools是一套开源的LLM实验工具集,支持向量数据库和提示词的测试与评估。该工具兼容OpenAI、Anthropic等多个主流API,提供代码、笔记本和本地playground界面。开发者可以便捷地比较不同模型和参数性能,并评估向量数据库检索准确性,有效提升AI开发效率。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号