Project Icon

crab

多模态语言模型代理基准测试框架

CRAB是一个构建语言模型代理基准环境的Python框架。该项目支持跨平台部署,提供统一接口访问多种环境。CRAB特点包括简单配置、创新的基准测试套件和图形评估方法。这些功能为开发和评估多模态语言模型代理提供了灵活的工具。

PraisonAI - 多智能体系统框架 简化大语言模型应用开发
AI框架GithubLLM应用PraisonAI多智能体系统开源软件开源项目
PraisonAI是一个集中式框架,用于简化多智能体系统的创建和编排。该框架支持100多种大语言模型,提供多智能体UI、AI代理聊天和代码库交互等多种界面。PraisonAI强调易用性和定制化,适用于各种大语言模型应用场景。框架特点包括自动AI代理创建、YAML配置和自定义工具集成。
dclm - 大型语言模型训练与评估的开源综合框架
DataComp-LMGithub大语言模型开源项目数据处理模型训练评估
DataComp-LM是一个开源的大型语言模型训练和评估框架。它提供了超过300T的CommonCrawl标准语料库、基于open_lm的预训练方案和50多项评估指标。研究人员可利用该框架在411M至7B参数规模下进行数据集构建实验。通过数据集优化,DataComp-LM已显著提升了模型性能,创建了多个跨规模表现优异的高质量数据集。
LAMBDA - LAMBDA:无代码多代理数据分析系统,集成大模型与自然语言技术
GithubLAMBDA多智能体系统开源项目数据分析机器学习
LAMBDA 是一个创新的开源无代码多代理数据分析系统,通过大模型解决复杂数据问题。主要功能包括通过自然语言指令进行数据分析、多代理模块(编程和检查代理)生成与调试代码、灵活的模型和算法集成、自动报告生成等。LAMBDA 提供易用的用户界面,允许直接干预操作过程,大幅提升数据科学实践和分析模式。
helm - 全面评估语言模型和文本图像模型的开源框架
GithubHEIMHELMStanford CRFM开源项目文本生成图像模型语言模型评估
HELM是一个开源的评估框架,用于全面分析语言模型和文本到图像模型的性能。该框架提供标准化数据集、统一模型接口和多维度评估指标。HELM不仅关注准确性,还评估效率、偏见和毒性等方面。对于文本到图像模型,HELM涵盖12个关键评估维度,包括图像质量、推理能力和多语言支持。研究人员可借助HELM深入了解模型的优势和潜在风险。
rci-agent - 智能代理利用语言模型解决计算机任务
GithubMiniWoB++RCI Agent开源项目自然语言计算机任务语言模型
RCI Agent是一个基于预训练语言模型的智能代理,专门用于执行MiniWoB++基准测试中的计算机任务。该项目采用RCI提示方案优化输出,在样本效率方面表现出色。相比其他模型,RCI Agent使用更少的样本即可达到仅次于CC-Net的性能。这一研究成果展示了大型语言模型在解决通用计算机任务中的潜力,为克服专家演示获取和奖励函数定义等挑战提供了新思路。
swarm - 轻量级且可扩展的多代理系统编排框架
GithubOpenAISwarm多代理系统开源项目教育框架轻量级协调
Swarm框架是一种用于轻量级和可扩展多代理系统编排的教育性工具。它能够高效、可控、且易于测试,适用于教学和大型实际应用。Swarm主要通过代理和交接这两个基本抽象概念,实现了多代理系统之间的复杂互动模式。支持Python 3.10+,使用简单明确的指令即可安装并配置。探索我们的示例代码与案例,从基础功能到复杂的客户服务场景,Swarm提供一应俱全的解决方案。
HydraLab - 云测试基础设施构建框架
GithubHydra Lab云测试平台开源项目测试框架自动化测试设备管理
HydraLab是一个开源的云测试基础设施构建框架,支持Android、iOS、Windows和浏览器平台的自动化测试。该框架提供测试设备管理、任务管理和结果可视化功能,兼容Espresso、Appium等测试框架,并支持无脚本的智能探索测试。HydraLab采用中心-代理分布式设计,便于团队构建云测试平台,提升测试效率。
starwhale - 一体化机器学习运维平台 加速AI模型开发流程
GithubLLMOpsMLOpsStarwhale开源项目机器学习运营模型开发
Starwhale是一个开源的MLOps/LLMOps平台,致力于优化机器学习运维流程。平台提供模型、运行时和数据集的统一管理,支持模型评估、在线演示和大语言模型微调等功能。Starwhale支持独立版、服务器版和云端版部署,适应不同应用场景。其开放架构允许开发者自定义MLOps功能,为AI团队打造高效、标准化的开发环境。
cornac - 多模态推荐系统比较框架
CornacGithub多模态开源项目推荐系统机器学习辅助数据
Cornac是一个多模态推荐系统比较框架,支持文本、图像等辅助数据。它便于快速实验和实现新模型,兼容TensorFlow、PyTorch等库。Cornac实现了协同过滤、内容推荐等多种算法,支持高效近似最近邻搜索。框架还提供简单的模型部署方式,有助于构建推荐系统应用。
dummy-unknown - 轻量级RoBERTa模型助力快速单元测试和CI
CIGithubHuggingfaceRobertaConfigRobertaForMaskedLMtokenizer开源项目模型模型测试
dummy-unknown是一个用于单元测试和持续集成(CI)的简化RoBERTa模型项目。它提供了小型配置的RoBERTa模型,支持PyTorch和TensorFlow实现,并包含简单的分词器、词汇表和合并规则。这个轻量级模型为开发者创建了高效的测试环境,有助于加快模型开发和验证流程。项目的设计简洁明了,适合快速部署和测试,是NLP开发中的实用工具。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号