#网页交互

tarsier - 网页交互感知系统赋能AI代理执行网络任务
Tarsier网页交互OCRLLM自动化Github开源项目
Tarsier是一个为网络交互AI代理开发的视觉工具包。它利用智能标记和OCR技术将网页内容转化为结构化文本,使AI能够理解网页布局。该工具支持多种OCR引擎,提供易用的API,帮助开发者为AI代理增添网页感知能力,提高自动化网络任务的效率。
Mind2Web - AI通用网页交互代理
Mind2Web网页代理数据集AI模型网页交互Github开源项目
Mind2Web是一个开创性的AI项目,旨在开发能在任何网站上执行复杂任务的通用网页交互代理。该项目构建了包含2,000多个开放式任务的数据集,覆盖137个网站和31个领域。Mind2Web的特点是任务多样性、真实网站环境和广泛的用户交互模式,为AI在网络环境中的应用提供了坚实基础。
GPT-EW - AI驱动的智能网页助手 提升浏览体验
AI工具GPT-EWAI助手网页交互浏览器扩展实时支持
GPT-EW是一款Chrome浏览器扩展,将ChatGPT的AI能力集成到各类网站中。这款工具提供实时、上下文感知的智能对话,为浏览者提供即时信息和个性化指导。通过理解网页内容并给出定制建议,GPT-EW显著提升了网络浏览体验。只需点击,即可将网页转化为交互式AI界面,实现更智能、高效的在线互动。
GPTs Enhancer - Chrome扩展实现网页文本与GPT模型的智能交互
AI工具GPTs EnhancerChrome扩展OpenAI自定义命令网页交互
GPTs Enhancer是一款Chrome浏览器扩展,支持用户自定义命令,将网页文本一键发送至OpenAI的GPT模型并获取智能反馈。该工具提供网站流量分析、网页翻译和阅读等多种预设功能,提高了GPT模型交互效率。除文本处理外,GPTs Enhancer还支持PDF和其他数据格式,是一款全能型AI辅助工具。