Project Icon

semantic-router

超高速语义决策引擎,优化LLM和代理性能

Semantic Router通过语义向量空间实现快速决策,提升LLM和AI代理的效率。兼容Cohere、OpenAI等多种编码器,并集成Pinecone和Qdrant等数据库,适用于多模态识别和本地运行。通过Route对象定义,Semantic Router实现精准语义路由,优化对话系统性能。

simulatrex-engine - 基于大语言模型的模拟决策引擎
API服务GithubLLM模拟Simulatrex决策支持开源项目
Simulatrex-engine是一个基于大语言模型(LLM)的模拟决策引擎,用于生成和分析复杂场景。它提供playground环境用于运行和可视化模拟结果,支持Docker快速部署。项目包含RESTful API接口,方便开发者集成,并通过GitHub平台支持开源社区贡献。Simulatrex-engine具有安装使用指南,支持各种模拟场景的运行和功能扩展。
sematic - 开源的机器学习平台,支持ML工程师和数据科学家使用Python编写并运行复杂的端到端流水线
GithubKubernetesPythonSematic开源开源项目机器学习
Sematic是一个开源的机器学习平台,支持ML工程师和数据科学家使用Python编写并运行复杂的端到端流水线。无论在本地计算机、云虚拟机还是Kubernetes集群上执行,Sematic都可以高效利用云资源。它具有易于上手、端到端可追溯性、本地与云一致性和高可重复性等特点,可在无需部署或额外基础设施的情况下开始使用,所有流水线步骤都可以在web仪表盘上监控和可视化,适用于优化不同计算资源。
semantic-search-nextjs-pinecone-langchain-chatgpt - 使用Next.js、Langchain和Pinecone构建语义搜索应用的入门指南
GPT3GithubLangchainJSNext.jsPinecone开源项目语义搜索
这是一个使用Next.js、LangchainJS、Pinecone向量数据库和GPT3构建的全栈入门项目。从文本文件嵌入向量、存储在Pinecone到进行语义搜索,提供了完整的指导,包括克隆仓库、安装依赖、配置API密钥和运行应用程序的步骤。项目的构建基于Node.js教程,并移植到Next.js。同时,提供了Lens协议开发文档的查询示例和自定义数据处理的建议,非常适合希望快速上手上述工具进行语义搜索项目的开发者。
web-llm - 浏览器语言模型推理引擎,完全支持OpenAI API
GithubOpenAI API兼容性WebGPUWebLLM大语言模型开源项目浏览器内推理
WebLLM是一款借助WebGPU技术,实现硬件加速的浏览器内语言模型推理引擎,无需服务器即可直接在浏览器内运行。完全兼容OpenAI API,并具备流式输出和JSON模式生成功能,支持广泛的模型集成。通过NPM或CDN可以快速集成到各类AI交互应用中,同时确保用户隐私安全,并享受高效的GPU加速体验。
AutoWebGLM - 智能网页导航代理系统
AutoWebGLMGithubHTML简化Web导航代理大语言模型开源项目自动网页浏览
AutoWebGLM项目致力于开发高效的自动网页导航代理系统。该项目基于ChatGLM3-6B模型,通过创新的HTML简化算法、人机混合训练方法、强化学习和拒绝采样技术,显著提升了模型的网页理解和浏览器操作能力。此外,项目推出的AutoWebBench双语基准为评估AI网页导航代理性能提供了专业工具。
search-agents - 树搜索算法助力语言模型智能体优化网页交互决策
AI代理GithubTree SearchVisualWebArena开源项目网页环境语言模型
这个开源项目开发了一种创新的树搜索算法,提升了语言模型智能体在网页环境中的探索和规划能力。该方法在VisualWebArena和WebArena基准测试中得到验证,支持GPT-4和Llama-3等多种模型。项目提供完整文档,包括安装指南、评估流程和基线复现方法,为研究人员和开发者提供了实用工具。
cognee - 旨在通过图形、LLMs和向量检索功能,为AI工程师提供精确的输出结果的开源框架
GithubLLMscognee向量检索图数据库开源项目自然语言处理
cognee是一个先进的开源框架,旨在通过图形、LLMs和向量检索功能,为AI工程师提供精确的输出结果。该工具支持自我改进,兼容多种本地配置和存储方案,从而助力AI项目的高效实施和灵活扩展。
rtp-llm - 大型语言模型推理加速引擎
CUDAGithubrtp-llm多模态输入大语言模型开源项目量化
rtp-llm是阿里巴巴基础模型推理团队开发的大型语言模型推理加速引擎,广泛应用于支持淘宝问答、天猫、菜鸟网络等业务,并显著提升处理效率。该项目基于高性能CUDA技术,支持多种权重格式和多模态输入处理,跨多个硬件后端。新版本增强了GPU内存管理和设备后端,优化了动态批处理功能,提高了用户的使用和体验效率。
yt-semantic-search - 使用OpenAI最新模型为任何YouTube播放列表创建语义搜索索引
All-In PodcastGithubNext.jsOpenAIPineconeYouTube开源项目
该项目使用OpenAI最新模型为任何YouTube播放列表创建语义搜索索引,支持精准查找感兴趣的片段。以All-In Podcast为示例,通过Pinecone进行高效向量搜索,并使用Next.js和Vercel进行前端部署,适用于所有YouTube频道或播放列表。
distributed-llama - 优化大型语言模型的分布式计算性能
Distributed LlamaGithubLlama 3Python 3TCP socketsTensor parallelism开源项目
通过分布式计算技术,分散大型语言模型(LLMs)的工作负载到多个设备上,即使是性能较弱的设备也能运行强大的LLMs。项目使用TCP sockets同步状态,用户可以使用家庭路由器轻松配置AI集群,实现显著加速效果。Distributed Llama支持多种模型架构,提供简便的设置和操作方法,用户可以在本地运行大规模语言模型。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号