Vespa 示例应用
有关运营示例应用,请参阅 examples/operations。另请参阅 PyVespa 示例。
入门 - 基础示例应用
基础专辑推荐
album-recommendation 是 Vespa 的入门应用。学习如何为简单的推荐和搜索用例配置模式。
简单混合语义搜索
simple semantic search 应用展示了使用 HNSW
的索引向量搜索,在 Vespa 内部使用 transformer 语言模型创建嵌入向量,以及混合文本和语义排序。该应用还演示了使用原生 Vespa 嵌入器。
检索增强生成 (RAG)
retrieval-augmented-generation 示例应用展示了如何使用基于 API 和本地 LLM 构建端到端 RAG 管道。
每个字段索引多个向量
Vespa 多向量索引与 HNSW 应用展示了如何为长文档的语义搜索在每个文档字段中索引多个向量。
用于自然分区数据的 Vespa 流模式
vector-streaming-search 应用展示了如何使用向量流搜索。另请参阅 博客文章。
ColBERT 令牌级嵌入
colbert 应用展示了如何使用 Vespa colbert-embedder 进行可解释的语义搜索,其准确性优于常规文本嵌入模型。
长文档的 ColBERT 令牌级嵌入
colbert-long 应用展示了如何使用 Vespa colbert-embedder 对较长文档进行可解释的语义搜索。
SPLADE 用于排序的稀疏学习权重
splade 应用展示了如何使用 Vespa splade-embedder 进行使用稀疏向量表示的语义搜索。
多语言语义搜索
multilingual 示例应用展示了使用多语言文本嵌入模型进行多语言语义搜索。
自定义嵌入
custom-embeddings 应用展示了如何为下游任务自定义冻结文档嵌入。
更高级的示例应用
新闻搜索和推荐教程
news 示例应用用于 Vespa 教程。该应用展示了基本的搜索功能。
它还展示了如何构建一个推荐系统,其中在共享的用户/项目嵌入空间中进行近似最近邻搜索,用于检索向用户推荐的内容。该应用还展示了在 Vespa 中使用 父子 关系。
十亿级图像搜索
billion-scale-image-search 应用展示了使用 CLIP 检索进行十亿级图像搜索。它具有计算与存储分离、查询时向量相似度去重、PCA 降维等特性。
最先进的文本排序
msmarco-ranking 应用展示了如何使用 Transformer (BERT) 模型表示最先进的文本排序。它使用 MS Marco 段落排序数据集,并具有双编码器、交叉编码器和延迟交互模型(ColBERT)的特性。
另请参阅更简单的 text-search 应用,该应用展示了使用 BM25/Vespa nativeRank 的传统文本搜索。
下一代电子商务搜索
use-case-shopping 应用创建了一个端到端的电子商务购物引擎。该用例还捆绑了一个前端应用。它使用 Amazon 产品数据集。它展示了使用 Vespa 构建下一代电子商务搜索。另请参阅 commerce-product-ranking 示例应用,了解使用学习排序技术(包括 XGBoost
和 LightGBM
)来改进产品搜索排序。
即时搜索和查询建议
incremental-search 应用展示了即时搜索功能,用户每次按键都会检索匹配的文档。它还展示了搜索建议(查询自动完成)。
Vespa 作为 ML 推理服务器(模型推理)
model-inference 应用展示了如何将 Vespa 用作无状态 ML 模型推理服务器,Vespa 负责将 ML 模型分发到多个服务容器,提供横向扩展和安全部署。模型版本控制和特征处理管道。
注意:带有 pom.xml 的应用是 Java/Maven 项目,必须在部署前构建。有关更多信息,请参阅 开发者指南。