#embeddings

open-text-embeddings - 使用多源模型的OpenAI API兼容文本向量生成工具
open-text-embeddingsOpenAI APIembeddingssentence-transformersLangChainGithub开源项目
该项目创建了与OpenAI API兼容的文本向量生成端点,支持多种开源句子转换模型,包括BAAI/bge-large-en、intfloat/e5-large-v2、sentence-transformers等。提供详细的本地和云端部署指南,方便用户在多种环境下运行服务器,实现高效查询与存储。用户也可通过Colab在线测试,体验开源文本向量生成的便捷性。
DataChad - 利用嵌入技术、向量数据库和大型语言模型的数据问答应用
DataChadlangchainsembeddingsvector数据库大语言模型Github开源项目
DataChad是一个利用嵌入技术、向量数据库和大型语言模型的应用。用户可以上传文件、路径或URL,创建知识库和智能FAQ。系统将数据拆分为文本块嵌入,并存储在activeloop的数据库中。使用选择的LLM模型和知识库进行相似性搜索,生成最佳答案。应用支持本地和流式部署,提供详细配置选项与用户贡献功能。
context - Python库查询与代码生成的多功能CLI工具
PythonCLI工具APIOpenAIembeddingsGithub开源项目
Fleet Context是一款覆盖1221个顶级Python库的CLI工具和API。它支持库问答和代码生成,兼容所有OpenAI模型。用户可通过命令行或API使用,支持嵌入向量下载和数据库查询。丰富的元数据显著提升了检索质量。测评结果表明,Fleet Context在代码生成方面比GPT-4提高了37分。