Project Icon

SeeAct

基于多模态GPT模型的网页任务自动化解决方案

SeeAct采用多模态GPT模型(如GPT-4V(ision)),提供网页任务自动化的解决方案,支持OpenAI和Google的多种语言模型,并与Playwright浏览器无缝集成。适用于网页代理测试与评估,支持多种配置和自定义任务,实现安全操作和实时监控。Multimodal-Mind2Web数据集提供丰富的网页截图和HTML文本,便于实验和评估。

speak-gpt - 开源高级AI助手,兼容多种语言模型
API提供商GPT模型GithubSpeakGPT人工智能助手开源开源项目
SpeakGPT是一款开源高级AI助手,利用强大的大语言模型(LLM)提供卓越的性能和功能。支持GPT、LLAMA、MIXTRAL、GEMMA、Gemini、DALL-E等多种模型。核心功能包括聊天、图像生成、语音输入、功能调用、深色模式和自定义API提供商支持。通过优化设计和安全的API密钥存储保证数据安全,代码公开可供检查以确保其安全性。
entaoai - 企业数据互动体验优化,集成多模态与高级评估
Azure Cognitive SearchAzure OpenAI ServiceChatGPTGithubLLMPrompt Flow开源项目
此项目展示了多种创建类似ChatGPT体验的方法,支持企业自有数据。通过Azure OpenAI服务访问ChatGPT模型,并利用Pinecone、Redis等向量存储或Azure认知搜索实现数据索引与检索。用户可以上传数据进行端到端测试。功能更新包括高效聊天、实时流、问答和管理功能的重构,多模态模式和高级评估技术的初步版本,以及根据最佳实践配置认知搜索类型。丰富的功能和更新确保出色的性能与用户体验。
OpenAdapt - 具有大型多模态模型 (LMM) 的 AI 优先流程自动化
AI-First Process AutomationGUI AutomationGithubLarge Multimodal ModelsOpenAdaptPython开源项目
OpenAdapt项目利用大型多模态模型(LMMs)实现与桌面和网页图形用户界面的无缝集成。这个开源Python库通过录制和分析用户操作,自动生成任务提示并执行任务回放,减少重复性工作,提高效率。项目特点包括模型无关性、自动提示生成和广泛的系统兼容性,支持所有类型的GUI,包括虚拟化和网页。项目遵守MIT开源许可证。了解更多关于安装、使用和贡献的信息,并加入开发者社区优化流程自动化技术。
LaVague - 开源大动作模型框架,用于开发AI Web代理
AI Web AgentsGithubLaVagueLarge Action ModelSelenium开源开源项目热门
LaVague 是一个开源的大动作模型框架,专为开发AI Web代理而设计。该框架通过世界模型和行动引擎,将用户的目标转化为执行指令,并通过Selenium或Playwright执行这些操作。LaVague 支持自定义配置、令牌计数、日志工具,还提供了Gradio交互界面。适用于高效自动化Web任务的开发者和技术专家。
YourGPT - 全面的企业级AI和GPT应用平台
AI工具AI聊天机器人YourGPT大语言模型开发平台生成式AI
YourGPT提供先进的人工智能和GPT套件,包括无代码AI聊天机器人和LLM Spark开发平台。这些工具帮助企业利用大型语言模型(LLM)和GPT技术进行创新和转型。平台注重数据安全和GDPR合规,适用于酒店、银行、房地产、医疗保健和电子商务等多个行业。
YiAi - 整合多种AI模型并优化功能,支持GPT-4o、Claude3.5等热门大模型
ChatfireAPIGPT-4-AllGithubYiAiQuickDeploymj-proxy-plusnineai开源项目
该项目基于nineai 2.4.2开发,整合了GPT-4o、Claude3.5等多种热门模型,新增识图和文件分析功能。优化界面显示和用户交互,支持多种文件类型和模型排序,提高使用体验。支持国内外热门模型API中转,并附有详细的部署教程,适用于Node.js、MySQL和Redis环境,易于安装和配置,提供高效、稳定的AI解决方案。
opensearch-ai - 开源的个性化AI搜索引擎项目,能够在用户浏览网页时学习和适应其兴趣
AI搜索引擎GithubOpenSearch GPT个性化学习兴趣开源项目网络浏览
OpenSearch GPT是一个开源的个性化AI搜索引擎项目,能够在用户浏览网页时学习和适应其兴趣。该项目整合了Mem0自动记忆收集、Vercel AI ADK、Next.js等技术,并使用GPT-4o-mini模型。通过持续学习用户习惯,OpenSearch GPT提供精准搜索结果,优化网络浏览体验。
evalgpt - 智能化的代码解释与任务分解系统
EvalGPTGithub代码生成任务执行开源项目扩展性错误处理
EvalGPT是一个基于GPT-4、CodeLlama和Claude 2等大型语言模型的代码解释框架。此工具能自动生成代码、执行并返回结果,提升开发效率。EvalGPT的架构借鉴了Google的Borg系统,通过规划、调度和内存模块,高效地完成任务,同时确保了广泛的错误处理和可扩展性,适用于各种编程需求。
MyGPT - 直观高效的个性化AI聊天机器人创建平台
AI工具MyGPT个性化机器人人工智能对话开源工具语音识别
MyGPT是一个功能强大的AI聊天机器人创建平台,让用户轻松定制个性化AI助手。平台支持GPT-4和Claude等多种AI模型,提供直观的Telegram界面,集成先进的语音识别和神经网络文本转语音技术。灵活的API允许在多种设备和场景中使用自定义机器人。MyGPT专注于提升响应速度和用户体验,简化AI助手的创建过程。作为开源平台,MyGPT还提供灵活的定价策略,适合各类用户需求。
Parallel GPT - ChatGPT批量任务处理平台
AI工作流AI工具ChatGPTOpenAI低代码批量处理
Parallel GPT是一个专业的ChatGPT批量任务处理平台。用户可通过CSV或JSON文件导入多个提示,在电子表格界面上并行处理查询。支持OpenAI GPT-4、Claude 3、Gemini和Azure等多种AI模型,提供低代码环境和编程扩展性。平台功能包括自定义AI工作流程、安全的数据存储和访问控制,以及团队协作。Parallel GPT适合需要大规模处理AI生成内容的团队和个人,提供高效、灵活的解决方案。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号