#语义搜索
haystack - 用于构建端到端LLM应用程序的高级框架,支持广泛的NLP功能
Github开源项目语义搜索LLMHaystack文档检索自然语言问答热门
Haystack是一个综合性的LLM框架,能够实现从文档检索到问题回答的多种功能。用户可以灵活选择使用OpenAI、Cohere、Hugging Face等提供的模型,或是自定义部署在各大平台的模型。该框架支持包括语义搜索、答案生成和大规模文档处理等广泛的NLP任务,同时还支持使用现成模型或对其进行微调,基于用户反馈持续优化模型性能。适用于企业级应用开发,帮助用户解决复杂的NLP问题。
Exa - 连接AI与全球知识库的高效Web API
语义搜索AI搜索引擎AI助手热门AI搜索AI工具Exa智能系统数据抓取
通过Exa的Web API技术,AI能直接访问和处理来自互联网的最新且相关的数据。支持语义理解的搜索、网页内容抓取、及发掘相似内容,适用于法律、新闻和科研等多个领域。简单几行代码即可集成,提升数据处理效率和质量。
SolidGPT - AI语义搜索助手,简化代码查询与管理
Github开源项目VSCode插件语义搜索SolidGPT代码搜索开发者助手
SolidGPT是一款AI助手,专为开发者提供代码和工作空间的语义搜索功能,可通过VSCode扩展快速集成。用户只需简单配置,利用OpenAI API即可高效查询代码库并解答问题,无需频繁切换上下文,大幅提升工作效率。支持与Notion集成,实现项目文档和任务板的语义搜索和总结,全面掌握项目进度。SolidGPT注重数据安全,不会收集用户数据,是开发者提升生产力的理想工具。
languagemodels - 轻松实现低内存大语言模型推理的Python库
Github开源项目Python大语言模型语义搜索GPU加速Language Models
该Python库简化了大语言模型的使用,最低内存需求仅为512MB,确保所有推理在本地完成以保障数据隐私。支持GPU加速及多种模型配置,功能涵盖文本翻译、代码补全、语义搜索等,适合教育和商业用途。用户可通过简单的pip命令安装,在REPL、笔记本或脚本中使用。详见官方网站的文档与示例程序。
llm-search - 支持多格式文档和语义重排搜索功能的问答系统
大型语言模型Github开源项目语义搜索混合搜索pyLLMSearch文档嵌入
llm-search是一款高效的问答系统,提供简易的YAML配置和与多个本地文档集的交互能力。特色包括优化的文档解析、结合HyDE技术提高搜索结果的准确性和相关性的混合搜索、聊天历史、深度链接、重新排名和定制嵌入等。适用于各类大型语言模型,如OpenAI或本地方案,提供高度定制化。此外,系统能够生成高质量的密集和稀疏嵌入,以优化搜索效果,支持多查询和与其他LLM平台的互操作性。
clip-retrieval - 构建高效图像和文本检索系统的开源工具
Github开源项目机器学习语义搜索文本嵌入clip-retrieval图像嵌入
clip-retrieval 提供一个建立语义搜索系统的强大工具,使得用户能够迅速实现图像和文本的嵌入计算及索引构建。该项目能在20小时内处理超过1亿的图文嵌入,支持远程查询、数据过滤以及简洁的前端用户界面,适用于学术研究和商业应用。
txtai - 集成语义搜索的高效嵌入式数据库解决方案
大型语言模型Github开源项目语义搜索LLMtxtai嵌入式数据库
txtai是一个功能全面的嵌入式数据库,不仅支持语义搜索和大语言模型协同工作,还提供全流程语言模型任务处理。特色功能包括支持SQL的矢量搜索、主题建模和增强生成检索等。txtai可以在本地运行,也可以通过容器编排进行扩展,并提供多语言API绑定,以便用户快速部署和使用。
sgpt - 提升语义搜索精准度的句嵌入GPT模型
Github开源项目语义搜索SGPT双编码器交叉编码器对比微调
SGPT项目通过改进GPT模型,提供了高效的语义搜索解决方案。该项目支持对称和非对称搜索,使得句子嵌入更具语义意义。新发布的GRIT模型在同一结构下融合了多种编码器,性能更佳。欢迎访问GitHub,了解详细信息和获取预训练模型。
joplin-plugin-jarvis - AI笔记助手与文献综述工具
Github开源项目语义搜索文献综述JarvisJoplinAI笔记
Jarvis是一款针对Joplin的AI笔记助手,利用在线和离线大语言模型(如OpenAI的ChatGPT、GPT-4等),提供聊天、语义搜索、自动注释和文献综述功能。插件通过简单命令实现多项操作,提升笔记管理效率,适合科研人员及重度笔记用户。支持在Joplin插件市场安装,并兼容多种API密钥。
semantic-search-nextjs-pinecone-langchain-chatgpt - 使用Next.js、Langchain和Pinecone构建语义搜索应用的入门指南
Github开源项目语义搜索Next.jsPineconeLangchainJSGPT3
这是一个使用Next.js、LangchainJS、Pinecone向量数据库和GPT3构建的全栈入门项目。从文本文件嵌入向量、存储在Pinecone到进行语义搜索,提供了完整的指导,包括克隆仓库、安装依赖、配置API密钥和运行应用程序的步骤。项目的构建基于Node.js教程,并移植到Next.js。同时,提供了Lens协议开发文档的查询示例和自定义数据处理的建议,非常适合希望快速上手上述工具进行语义搜索项目的开发者。
DocumentGPT - 允许用户上传PDF文档并与AI聊天机器人互动,并通过向量数据库实现研究文档语义搜索的web应用
Github开源项目语义搜索向量数据库AI聊天机器人DocumentGPTOpenAI Chat API
DocumentGPT是一个基于OpenAI Chat API的web应用,允许用户上传PDF文档并与AI聊天机器人互动,还可以通过向量数据库进行语义搜索。用户能在应用内查看文档内容、进行Google/YouTube搜索并获取自动搜索建议,同时提供上下文丰富的搜索结果及其来源验证。欢迎尝试Streamlit Cloud上的部署版本,且GitHub上开放了贡献和反馈渠道。
embedbase - 提供开发AI应用所需的全部工具和API,支持使用VectorDB和多种大模型
Github开源项目AI应用语义搜索LLMVectorDBEmbedbase
Embedbase提供易用的API,支持在无需托管的情况下使用VectorDB和多种大模型(LLM)。其核心功能包括文本生成和语义搜索,适用于推荐引擎、智能合约集成和文档交互。通过NPM安装并使用JavaScript SDK快速开始。访问文档获取教程与最佳实践,或加入Discord社区获取支持。
similarities - 文本和图像相似度计算与语义搜索的高效工具
Github开源项目语义搜索CLIP文本相似度similarities图像相似度
该工具包提供多种文本和图像相似度计算及语义匹配算法,支持高效处理亿级数据。主要功能包含文本相似度计算、文本搜索、图文匹配、图像搜索等多种算法。项目采用Python3开发,支持命令行操作,基于PyTorch和FastAPI等技术,可实现多语言环境下的高效向量表示及检索,开箱即用。
IntelliNode - 集成多种AI模型的统一接口、评估与生产模块
Github开源项目AI集成语义搜索语言模型图像生成IntelliNode
IntelliNode 是一个 JavaScript 模块,能将先进的 AI 技术集成到项目中。通过直观的函数调用,可生成文本、语音或图像,并切换使用 ChatGPT、LLaMA、WaveNet、Gemini 和 Stable Diffusion 等模型。主要功能包括语义搜索、多模型评估和聊天机器人。简单 npm 安装后即可使用最新 AI 模型,详情参见文档和示例代码。
awesome-chatgpt-plugins - 最新ChatGPT插件与开发教程
Github开源项目ChatGPTOpenAI插件语义搜索代码解释器
提供ChatGPT插件的信息、官方指南和教程,助您探索和使用OpenAI的插件功能。涵盖插件演示、开发资源及博客文章,提升ChatGPT应用能力。
semantic-search-openai-pinecone - 使用OpenAI与Pinecone的语义搜索引擎解决方案
Github开源项目语义搜索Next.jsPrismaPineconeOpenAI Embeddings
该项目展示了如何利用OpenAI Embeddings和Pinecone向量数据库构建语义搜索引擎。使用Next.js、NextAuth.js、Prisma、TailwindCSS和tRPC等技术栈,用户可以在Pinecone和OpenAI的免费层上探索和运行应用程序。详细的视频演示和技术文档也提供了对语义搜索功能的深入理解和实现指导。
codequestion - 专为开发者设计的离线语义搜索工具
Github开源项目语义搜索安装指南开发者模型下载codequestion
codequestion是一款使用Stack Exchange数据和Python 3.8+的本地语义搜索应用。无需网络连接,即可快速查找相似问题,并集成txtai 5.0,提供语义图和路径遍历功能。支持VS Code集成和API服务,安装简便,适用于各种平台。
similarity-search-kit - 隐私为先的iOS和macOS本地文本嵌入与语义搜索工具
Github开源项目语义搜索NLPSwiftSimilaritySearchKit本地文本嵌入
SimilaritySearchKit是一个Swift包,支持iOS和macOS应用,实现本地文本嵌入和语义搜索。该工具强调速度、可扩展性和隐私,内置多种NLP模型和相似度度量,开发者可快速创建功能强大的应用,同时确保数据本地存储,保护隐私。适用于隐私优先的文档搜索引擎、离线问答系统和文档聚类推荐引擎。安装简单,支持多种嵌入模型和距离度量。
semantra - 智能语义搜索 深入挖掘文档核心内容
Github开源项目语义搜索命令行工具嵌入模型Semantra文档分析
Semantra是一款开源的语义搜索工具,专注于本地文档内容分析。它支持处理文本和PDF文件,通过交互式Web界面提供精准的语义查询功能。Semantra采用多种嵌入模型,可根据需求进行定制,并确保数据隐私和安全。这一工具适用于各类专业人士,如记者、研究人员、学生和历史学家等,帮助他们在大量文档中快速定位关键信息,提升工作效率。
semantic-grep - 基于词嵌入的语义搜索命令行工具
Github开源项目多语言支持语义搜索命令行工具词嵌入w2vgrep
semantic-grep是一款开源的语义搜索命令行工具,基于词嵌入技术实现超越字符串匹配的智能搜索。它支持多语言,提供类似grep的使用体验,具有相似度阈值设置、上下文显示和彩色输出等特性。通过命令行参数或JSON文件配置,可在文件或标准输入中进行高效的语义搜索,适用于开发者和文本分析工作。
Vellum AI - 专业LLM应用开发与管理的一站式平台
语义搜索AI系统LLM应用AI工具提示工程Vellum平台
Vellum AI是一个专业的LLM应用开发和管理平台。它为提示工程、语义搜索、提示链接、评估和监控提供了全面的工具。用户可以利用该平台快速将AI系统从原型转化为生产环境,并进行持续优化。Vellum AI支持多种LLM应用场景,具备处理大规模请求的能力,有效提升企业AI应用的开发和部署效率。
Lilac - 高效LLM数据集分析与优化工具
语义搜索LLMAI工具数据处理聚类数据集分析
Lilac是一款专为大型语言模型(LLM)数据质量提升设计的分析工具。它集成了数据搜索、量化和编辑功能,提供语义聚类、关键词检索和字段比较等分析方法。Lilac可在20分钟内完成百万级数据点的聚类和标题生成,每分钟可嵌入5亿个标记,实现快速处理大规模数据集、识别数据概念,并筛选适合特定任务的数据。此外,Lilac还支持PII检测和重复数据识别等特性。凭借高效的数据处理能力和直观的操作界面,Lilac成为数据科学家和AI从业者优化产品的重要助手。
Context Clue - AI文档分析与知识管理解决方案
语义搜索LLMAI工具AI知识库文档研究自动化文档创建
Context Clue是一款先进的AI文本分析和知识管理工具,提供文档摘要、模板化文档创建和语义搜索等功能。这个多语言支持的解决方案注重数据隐私,采用开源和API优先架构,易于集成现有系统。适用于研究、客户服务和法律分析等领域,Context Clue旨在提升企业的信息处理效率和洞察能力。
Vantage Discovery - 智能化搜索与产品发现平台 Vantage Discovery
语义搜索AI搜索AI工具个性化推荐产品发现Vantage Discovery
Vantage Discovery是一个基于人工智能的SaaS平台,提供智能搜索、产品发现和个性化推荐功能。平台利用语义理解和用户意图分析技术,支持自然语言搜索、多模态搜索和相似商品推荐。它能快速处理大量商品数据,帮助企业提升订单价值和优化购物体验。Vantage Discovery操作简便,部署迅速,为企业提供了高效的搜索和发现解决方案。
VolansDB - 多模态数据引擎支持SQL直接查询非结构化数据
AI代理语义搜索AI工具SQL查询多模态LLM非结构化数据
VolansDB是一款多模态数据引擎,支持使用SQL直接查询和分析表格、图像和视频等非结构化数据。内置AI代理可实现数据提取、分类和语义搜索,无需复杂ETL流程。平台连接多种数据源,提供成本可视化和缓存机制,帮助数据分析师高效处理大规模非结构化数据。适用于生成式AI应用分析、创意优化等场景。
txtai.js - JavaScript应用的语义搜索和NLP功能解决方案
Github开源项目语义搜索txtai嵌入式数据库JavaScript客户端API绑定
txtai.js是txtai的JavaScript客户端,支持语义搜索和LLM编排。该项目提供embeddings、提取式问答、零样本分类等功能,可通过npm安装。开发者可以使用txtai.js连接txtai API,将高级NLP功能轻松集成到JavaScript应用中。
Top2Vec - 自动化主题检测和语义搜索的创新技术
Github开源项目自然语言处理机器学习语义搜索主题建模Top2Vec
Top2Vec是一种创新的主题建模和语义搜索算法。它能自动检测文本主题,生成主题、文档和词向量的联合嵌入。该算法无需停用词列表和词形还原,可处理短文本,并提供内置搜索功能。通过识别文档密集聚类,Top2Vec为文本分析和信息检索提供了强大的解决方案。
txtai.rs - Rust语言的嵌入式数据库与AI工作流库
Github开源项目语义搜索Rusttxtai嵌入式数据库API绑定
txtai.rs是txtai API的Rust语言客户端库,提供嵌入式数据库功能,支持语义搜索、大型语言模型编排和语言工作流。库易于安装,并提供多个示例,涵盖嵌入式数据库操作、抽取式问答、零样本分类和管道工作流。Rust开发者可通过该库将txtai的功能整合到项目中,实现高效的文本AI应用开发。
SemanticFinder - 浏览器端实时语义搜索与文档对话工具
Github开源项目语义搜索前端开发嵌入模型SemanticFindertransformers.js
SemanticFinder是一款基于transformers.js的浏览器端语义搜索和文档对话工具。它利用最新的嵌入模型,在浏览器中完成嵌入计算和余弦相似度计算,无需服务器端推理。用户可在2秒内快速搜索大型文本,如圣经或《悲惨世界》。该工具支持多语言,可自定义参数,并提供Chrome扩展程序版本。SemanticFinder将所有处理在本地完成,保护用户数据隐私,是一个高效灵活的语义搜索解决方案。
sample-apps - Vespa搜索和推荐系统示例应用集合
Github开源项目机器学习语义搜索搜索引擎Vespa向量检索
Sample-apps项目展示了Vespa的多种应用场景,包括基础推荐、语义搜索、检索增强生成(RAG)和多向量索引等。该项目通过电商搜索、新闻推荐和大规模图像检索等实例,展示了Vespa的实际应用能力。开发者可以参考album-recommendation、news和billion-scale-image-search等多个示例应用,快速掌握Vespa的基础和高级功能实现。
meme_search - 基于人工智能的表情包索引和检索系统
Github开源项目AI语义搜索图像检索开源组件Meme Search
Meme Search是一个开源的表情包索引和检索系统。该项目利用Python和人工智能技术,实现了表情包的内容和文本索引功能。系统采用开源组件构建,包括图像文本提取、向量嵌入和搜索等功能,全部在本地处理。用户可以添加自己的表情包,通过语义搜索快速找到所需内容,并支持直接从应用程序拖放分享到其他应用。该系统为表情包管理和使用提供了一种新的解决方案。
ai-powered-search - 现代搜索引擎的AI驱动技术实践
Github开源项目自然语言处理机器学习语义搜索AI搜索引擎Apache Solr
AI-Powered Search项目展示了现代搜索引擎的AI驱动技术,包括语义搜索、检索增强生成和个性化搜索等。项目基于Python和PySpark开发,支持多种搜索引擎和向量数据库。通过Docker容器和Jupyter Notebooks,开发者可以实践《AI-Powered Search》一书中的代码示例,深入学习构建智能搜索引擎的先进技术。
pdfGPT - 基于GPT的PDF智能问答工具 提高文档阅读效率
Github开源项目OpenAI语义搜索嵌入PDF处理pdfGPT
pdfGPT是一个开源的PDF文档智能问答工具。它采用文本分割和深度平均网络编码技术,实现PDF内容的语义搜索。通过整合OpenAI功能,pdfGPT生成精确答案并提供页码引用。系统兼容多种模型如GPT-4,同时提供友好界面和API。这一工具显著提高了PDF文档的信息获取效率,适用于研究、学习等多种场景。
vietnamese-bi-encoder - 越南语句子相似度模型PhoBERT的应用与语义搜索支持
Github开源项目模型训练语义搜索模型Huggingfacesentence-transformersPhoBERT句子相似度
项目依托sentence-transformers框架及PhoBERT-base-v2模型,旨在优化越南语句子相似度与聚类任务。通过结合MS Macro、SQuAD v2及Zalo 2021数据集进行训练,其在语义搜索和法律文本检索表现上有所提升。支持用户通过安装sentence-transformers库及HuggingFace的API和Widget多种方式轻松上手。
HyperTag - 语义搜索和标签系统集成的智能文件管理工具
Github开源项目语义搜索CLI工具文件组织标签系统HyperTag
HyperTag整合了灵活的标签系统和先进的语义搜索功能,为文件管理提供创新解决方案。这款工具可无缝应用于现有文件结构,支持包括PDF在内的文本文档和图像的智能搜索。通过命令行界面和实验性网页应用,HyperTag旨在优化文件组织和检索流程,显著提升信息访问效率。其核心设计理念是缩短思考到文件获取的时间,为用户带来更智能、高效的文件管理体验。
qdrant - 面向AI应用的向量相似性搜索引擎和数据库
Github开源项目神经网络Qdrant向量搜索引擎AI应用语义搜索热门
Qdrant是一个面向AI应用的向量相似性搜索引擎和数据库,提供了一个便捷的API用于存储、搜索和管理数据点。它支持扩展筛选,可用于各种基于神经网络或语义匹配的应用,如分面搜索等。Qdrant支持完全托管的云服务,包括免费层。具备高性能和可扩展性,适用于各种规模的部署。
相关文章
CLIP-Retrieval: 构建高效的多模态语义检索系统
3 个月前
txtai: 一个强大的开源嵌入式数据库和语言模型工作流框架
3 个月前
SGPT: 基于GPT的语义搜索句子嵌入
3 个月前
Jarvis: 为Joplin打造的智能AI助手插件
3 个月前
基于Next.js、Pinecone和Langchain构建语义搜索应用
3 个月前
IntelliNode:统一访问各种AI模型的强大工具
3 个月前
深入探讨基于OpenAI和Pinecone的语义搜索引擎实现
3 个月前
Semantra: 一款强大的语义搜索工具
3 个月前
LLM-Search: 革新本地文档检索的高级RAG系统
3 个月前