#智能手机应用
AppAgent - 智能代理框架简化智能手机应用操作
Github开源项目多模态GPT-4VAppAgent智能手机应用探索学习
AppAgent是一种基于LLM的多模态智能代理框架,模仿人类点击和滑动操作来运行智能手机应用。框架通过自主探索或观察人类演示学习新操作,生成知识库以执行复杂任务。无需系统后端访问,适用性广泛。提供详细配置步骤、评估基准和使用案例,支持GPT-4V和通义千问-VL等多种模型。
Babel Dish - 智能菜单翻译应用 实时解读全球美食
AI工具AI翻译智能手机应用Babel Dish菜单翻译旅行工具
Babel Dish是一款基于AI技术的菜单翻译应用。通过拍摄或上传外语菜单照片,点击需翻译的文字,即可获得准确的菜品翻译和详细描述。该应用能快速分析菜单内容并翻译成目标语言,帮助用户克服语言障碍,深入了解异国美食。Babel Dish为全球美食爱好者和旅行者提供了便捷的翻译工具,让用户在世界各地的餐厅都能轻松点餐,丰富用餐体验。
HeardThat - HeardThat应用让智能手机助力清晰对话
AI工具智能手机应用语音分离听力辅助噪音环境HeardThat
HeardThat是一款智能手机应用,专门设计用于改善嘈杂环境中的对话体验。通过先进的语音分离技术,该应用可以有效过滤背景噪音,提升语音清晰度。用户只需连接现有的蓝牙耳机或助听器,即可将智能手机变为实用的助听工具。HeardThat不仅适合听力障碍人士,也为任何在社交场合中难以听清对话的人提供了实用解决方案,有助于改善社交互动体验。