Project Icon

code-act

使用可执行代码统一LLM代理机制

CodeAct通过可执行代码统一了LLM代理的行动空间,并利用集成的Python解释器实现动态行为调整。相比文本和JSON,CodeAct成功率提高了20%。项目包含详细数据集和模型说明,并支持Kubernetes部署,显著提升在非专业任务中的性能表现。

AutoAct - 自主规划驱动的智能体学习框架
AutoActGithub人工智能大语言模型开源项目机器学习自然语言处理
AutoAct是一个创新的智能体学习框架,无需大规模标注数据或闭源模型。该框架通过自主规划合成轨迹,并自动分化子智能体群组完成任务。实验结果显示,AutoAct在多种语言模型上的表现与强基线相当或更优。这种方法为智能体学习提供了高效、可复现的新途径。
SeeAct - 基于多模态GPT模型的网页任务自动化解决方案
GPT-4V(ision)GithubMind2WebSeeActweb代理多模态模型开源项目
SeeAct采用多模态GPT模型(如GPT-4V(ision)),提供网页任务自动化的解决方案,支持OpenAI和Google的多种语言模型,并与Playwright浏览器无缝集成。适用于网页代理测试与评估,支持多种配置和自定义任务,实现安全操作和实时监控。Multimodal-Mind2Web数据集提供丰富的网页截图和HTML文本,便于实验和评估。
agentchain - 使用大型语言模型(LLM)来规划和编排多个代理,或使用大型模型(LM)来完成复杂的任务。
AgentChainGithub交互代理任务编排多模态大型语言模型开源项目
AgentChain采用先进的的大型语言模型,提供基于自然语言输入的规划与决策能力,支持文本、图像、音频和表格数据等多模态输入输出。其智能系统能够协调多个agent执行复杂任务,适用于计算机视觉、语音识别等数据处理工作,并可定制以满足各类项目需求,从自动化生成旅游图片到金融分析报告。此外,AgentChain还能通过Twilio等平台实现邮件发送和电话通知等通信任务。
codel - 自主运行的安全AI代理,支持终端、浏览器和编辑器操作
Autonomous AICodelDockerGithubPostgreSQL开源项目现代化界面
Codel是一个自主运行的安全AI代理,在Docker环境中自动执行复杂任务并保存历史记录。内置浏览器和文本编辑器,支持自托管和现代用户界面,用户可通过简单的Docker命令快速启动,并获取最新信息。
Instruct2Act - 利用大语言模型实现多模态指令向机器人操作的映射
GithubInstruct2Act多模态指令大型语言模型开源项目机器人操控零样本方法
Instruct2Act是一种创新框架,通过大语言模型将多模态指令转化为机器人操作。该框架生成Python程序,有效结合感知、规划和动作环节,将复杂指令转化为精准策略代码。在不同场景尤其是桌面操作领域,框架的零样本方法表现优异,超越了许多现有的学习策略。
llama-3-8b-liquid-coding-agent - 代码生成与标签提炼的自动化应用
FlaskGithubHuggingfacePython编程RESTful API开源项目本地技术模型项目结构
该模型专门进行编码训练,能够自动生成包含完整项目文件和使用示例的代码。使用XML格式标签<codestart>和<codeend>支持多种文件类型,包括Python、CSS和JavaScript等,并可优先使用本地技术如SQLite。该项目适合于创建简单的RESTful API示例,满足多种编程需求。
AgentTuning - 提升大语言模型的多任务代理能力
AI代理AgentTuningGithubLLM开源项目机器学习自然语言处理
AgentTuning项目通过多种代理任务的交互数据微调大语言模型,增强其通用代理能力。实验表明,经过AgentTuning的模型在新的代理任务中展现出良好的泛化能力,同时保持了强大的语言处理能力。项目开源的AgentInstruct数据集和AgentLM模型为相关研究提供了重要参考。
AgentLLM - 用LLM打造自主代理,浏览器端高效运行
AgentLLMChatGPTGithubWebGPUWizardLM开源项目浏览器原生LLM
AgentLLM展示了使用开源大型语言模型(LLM)在浏览器上运行自主代理的潜力,可有效处理复杂的目标导向任务。通过利用WebGPU,项目显著提升了性能,并在无工具简化版的AgentGPT环境中实现。该平台适合于希望快速验证LLM能力的用户,界面友好且功能丰富。
allenact - 支持多环境与算法的Embodied AI研究框架
AI2AllenActEmbodied AIGithub开源项目模仿学习深度强化学习
AllenAct是一个专为Embodied AI研究设计的开源框架,提供模块化和灵活的学习架构,支持多种环境和算法。其主要特点包括任务抽象、训练序列试验、PyTorch支持和多智能体功能。由Allen Institute for AI开发,提供详尽的文档、教程及预训练模型,为Embodied AI研究提供有效支持。
llm-action - 提升AI模型训练与推理效率的高级技术与指南
GithubLLM实战LLM训练分布式训练参数高效微调开源项目微调技术
llm-action项目为NVIDIA GPU和Ascend NPU上的大模型训练提供简易工具,详细介绍了LLM训练技术的高效微调和分布式技术。深入探究LLM微调实战与技术原理,并提供实际代码示例以供学习和应用。涵盖普适性框架与多模态微调专项技术,适合开发者与研究人员优化和扩展其AI模型的能力。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号