Project Icon

umi-on-legs

四足机器人操作技能的全身控制框架

UMI on Legs项目为四足机器人与机械臂结合提供了可扩展的操作技能框架。该框架整合真实人类示范和模拟训练的全身控制器,实现视觉运动策略在四足机器人上的应用。项目涵盖全身控制器模拟训练、实际部署、iPhone里程计应用、UMI真实环境类和ARX5 SDK等组件,为机器人操作研究提供综合解决方案。

Instruct2Act - 利用大语言模型实现多模态指令向机器人操作的映射
GithubInstruct2Act多模态指令大型语言模型开源项目机器人操控零样本方法
Instruct2Act是一种创新框架,通过大语言模型将多模态指令转化为机器人操作。该框架生成Python程序,有效结合感知、规划和动作环节,将复杂指令转化为精准策略代码。在不同场景尤其是桌面操作领域,框架的零样本方法表现优异,超越了许多现有的学习策略。
JARVIS-1 - 开放世界中具备多模态记忆的多任务智能体
GithubJARVIS-1Minecraft多模态语言模型开放世界开源项目记忆增强
JARVIS-1通过多模态输入和人类指令实现复杂任务的规划和执行,在开放世界的Minecraft中表现出强大的功能。该智能体结合预训练多模态语言模型与实际游戏经验,将视觉观察和文本指令转化为执行计划,并利用多模态记忆进行规划。JARVIS-1能完成超过200种任务,从砍树等短期任务到获取钻石镐等长期任务,均表现卓越。项目仅在Linux上运行,依赖多个相关项目如STEVE-1和Minedojo。
self-operating-computer - 使多模态模型能够操作计算机的框架
API接口GPT-4oGithubSelf-Operating Computer多模态模型开源项目键盘鼠标操作
Self-Operating Computer Framework通过模拟人类的视觉和手动操作,实现计算机的自动化控制。当前支持GPT-4o、Gemini Pro Vision、Claude 3和LLaVa多模态模型,并计划对更多模型开放兼容。适用于Mac OS, Windows和Linux系统。
koishi - 跨平台、可扩展、高性能的智能机器人开发框架
GithubKoishi开发框架开源项目插件生态聊天机器人跨平台
Koishi是一个功能强大的跨平台智能机器人开发框架。它拥有丰富的生态系统,提供超过1000个官方和社区插件,涵盖平台支持、业务功能等多个方面。Koishi不仅开箱即用,还配备了便捷的控制台和在线插件市场,便于非专业用户快速搭建机器人。对于开发者,Koishi提供了完善的TypeScript支持、单元测试和模块热重载等专业功能,有助于构建可扩展的解决方案。
guilyx - 机器人专家的全栈技术探索 从路径规划到无人机集群
GitHubGithub开源项目机器人工程师编程语言软件开发
guilyx是一位专注于机器人技术的软件工程师,在路径规划、轨迹跟踪和行为规划等领域积累了丰富经验。目前在阿布扎比进行无人机集群研究,同时探索Web3和区块链技术。其GitHub展示了多样化的项目经历,体现了在机器人和嵌入式系统领域的专业素养和持续学习精神。
Omi - AI驱动的开源可穿戴设备 实现智能对话记录
AI可穿戴设备GithubOmi开源项目移动应用语音转录
Omi是一款创新的开源AI可穿戴设备,旨在优化对话记录和管理。通过与移动设备连接,Omi能够自动生成高质量的会议、聊天和语音备忘录转录。其低功耗蓝牙技术支持使用小型纽扣电池持续工作超过24小时。Omi的开源软件栈鼓励社区参与和协作。轻巧的人体工学设计使其成为理想的日常佩戴设备。
keras-llm-robot - 基于Langchain和Fastchat开源框架的Web应用,支持多模态、RAG和Agent等多功能
GithubKeras-llm-robotWeb UI多模态模型开源开源项目语言模型
keras-llm-robot是一套基于Langchain和Fastchat开源框架的Web应用,支持多模态、RAG和Agent等多功能。项目完全开源,适合在Hugging Face平台上测试和部署各类模型。用户可自定义模型组合以适应不同的部署和实验需求,同时提供语音和图像识别、代码执行、实时翻译等多元化功能。
AiOS - 先进的全流程人体姿态与形状估计框架
AiOSGithubSMPL-X人体姿态估计开源项目深度学习计算机视觉
AiOS是一个创新的人体姿态和形状估计框架,采用全新的全流程方法。该项目通过三阶段的渐进式处理,实现高精度的SMPL-X参数回归。AiOS支持多人场景分析,并能有效处理复杂遮挡情况。在AGORA和BEDLAM等多个基准数据集上,AiOS展现出卓越的性能表现。这一开源项目为计算机视觉和人机交互等领域提供了有力的研究工具。
safe-control-gym - 安全控制与强化学习的物理仿真平台
Githubsafe-control-gym仿真环境安全约束开源项目强化学习机器人控制
'safe-control-gym'是一个开源的基于物理的仿真平台,为学习控制和强化学习研究提供CartPole和Quadrotor环境。该平台支持符号化先验动力学,实现多种扰动和约束条件,集成了多种控制器和安全过滤器。研究人员可利用此平台测试控制方法的鲁棒性和泛化能力,探索安全学习和控制领域的创新。
ibc - 隐式行为克隆算法在机器人策略学习中的创新应用
GithubImplicit Behavioral Cloning人工智能开源项目机器人策略学习能量模型行为克隆
IBC项目提出的隐式行为克隆算法在机器人策略学习中表现优异。该方法善于处理复杂、不连续和多值函数,适用于高维动作空间和视觉输入场景。在D4RL基准测试中,IBC在人类专家任务上与顶尖离线强化学习方法相当。实际应用中,IBC能让机器人学习复杂精细行为,应对高组合复杂性和毫米级精度任务。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号