Project Icon

ScreenAgent

由视觉语言大模型驱动的电脑控制工具

ScreenAgent项目创建了一个由视觉语言模型驱动的电脑控制环境,允许代理通过截图与真实屏幕互动并操作GUI。自动控制流程分为规划、执行和反思三个阶段,使代理能够完成多步骤任务。项目包含丰富的截图和操作序列数据集,支持包括GPT-4V、LLaVA-1.5、CogAgent和ScreenAgent在内的多种模型,并提供简化体验的网页版客户端。

modelscope-agent - 可定制和扩展的开源大语言模型代理框架
GithubModelScope-Agent代理系统大语言模型工具调用开源项目智能助手
ModelScope-Agent 是一个可定制和扩展的代理框架,支持角色扮演、工具调用、规划和记忆功能。通过简单配置,可以快速实现代理应用,利用丰富的模型和工具接口,如 Dashscope、OpenAI 等。框架低耦合、高扩展性,便于开发者扩展和定制各种代理应用,适用于多种实际应用场景。
ScreenSnapAI - macOS智能截图管理与AI交互工具
AI工具AI截图助手OpenAI APIScreenSnapAImacOS工具智能对话
ScreenSnapAI是一款创新的macOS应用,集成了AI技术实现智能截图管理。用户可与屏幕内容进行AI对话,享受自动命名和标记功能,并使用智能文件夹组织截图和对话。支持各类Mac设备,提供免费版和功能更丰富的专业版。这款工具旨在提升工作效率,为用户带来便捷的截图体验。
LaVague - 开源大动作模型框架,用于开发AI Web代理
AI Web AgentsGithubLaVagueLarge Action ModelSelenium开源开源项目热门
LaVague 是一个开源的大动作模型框架,专为开发AI Web代理而设计。该框架通过世界模型和行动引擎,将用户的目标转化为执行指令,并通过Selenium或Playwright执行这些操作。LaVague 支持自定义配置、令牌计数、日志工具,还提供了Gradio交互界面。适用于高效自动化Web任务的开发者和技术专家。
micro-agent - 专门设计用于自动编写Python代码的微型自主代理工具
AGIGithubLLMsMicro AgentOpenAI GPT-4开源项目自动化软件工程
Micro Agent是一个基于OpenAI GPT-4的微型自主代理工具,专门设计用于自动编写Python代码,达成用户指定的目的。该项目简化了编写和测试代码的过程,通过其内置的状态机制进行自动化处理。它无疑是AI研究领域的重要工具,代表着迈向通用人工智能的一步。此外,它为AI开发者和研究人员提供了一个探索和实验自主代理开发的有效平台。
Rodel.Agent - 集成多种AI功能的Windows桌面应用程序
AI服务GithubRodel AgentWindows开源项目文本到语音桌面应用
Rodel Agent 是一款Windows桌面应用程序,涵盖聊天、图像生成、文本转语音和机器翻译功能,支持主流AI服务,提供卓越的桌面AI体验。开发者可使用Visual Studio 2022,依赖.NET 8和Windows App SDK 1.5。只需克隆仓库并初始化子模块即可构建项目,包含桌面UI和控制台模块,用户可自由配置服务。
agent-tutorial - 实践驱动的智能Agent开发教程
AgentDatawhaleGithubModelScope Agent开源项目教程智能助手
这是一份由Datawhale团队编写的Agent开发教程,重点通过实践引导学习。教程介绍了ModelScope Agent的使用方法,探讨了Agent的创作思路和应用前景。内容涵盖Agent原理、环境配置和日程规划小助手实践,适合有意学习和开发Agent应用的读者。
agentlego - 多模态工具扩展及集成的开源库
AgentLegoGithub图像生成大语言模型开源项目视觉感知语音处理
AgentLego是一个提供多种工具API的开源库,旨在增强基于大语言模型的代理功能。它支持多模态工具,如视觉感知、图像生成与编辑、语音处理等,且易于集成到LangChain、Transformers Agents和Lagent等框架中。同时,AgentLego支持远程访问和工具服务,适用于需要大型机器学习模型或特定环境的应用。
Awesome-AGI-Agents - 全面解读AGI智能体的最新资源与开发平台
AI AgentsAuto-GPTGithubLLMLangChainOpenAI开源项目
精选AGI智能体资源集合,涵盖文章、视频、论文、前沿项目和开发平台。开源项目如Auto-GPT和MetaGPT展示了自主AI智能体的应用潜力。复旦NLP与米哈游的综述论文对大语言模型驱动的Agent提供了深度解读。开发者可借助LangChain、SuperAGI等工具,快速构建和部署智能体。适用于关注AI智能体发展及其在科研、技术和应用领域前沿探索的用户。
Invisibility - 开发代理系统实现电脑操作自动化
AGIAI工具Invisibility人工智能工作流程自动化
Invisibility是一家专注于开发代理系统的AI实验室,致力于实现电脑操作的全面自动化。其首款产品通过跟踪软件流程和学习工作流程,创建智能自动化方案,消除重复操作。Invisibility开发的执行软件能精确模拟人类界面操作,无需API支持,为用户提供高效、便捷的自动化解决方案。
AgentTuning - 提升大语言模型的多任务代理能力
AI代理AgentTuningGithubLLM开源项目机器学习自然语言处理
AgentTuning项目通过多种代理任务的交互数据微调大语言模型,增强其通用代理能力。实验表明,经过AgentTuning的模型在新的代理任务中展现出良好的泛化能力,同时保持了强大的语言处理能力。项目开源的AgentInstruct数据集和AgentLM模型为相关研究提供了重要参考。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号