Project Icon

stark

大规模半结构化检索基准,推动LLM性能提升

STaRK提供一个大规模的半结构化检索基准,涵盖产品搜索、学术论文检索和生物医学查询,旨在评估和提升LLM在文本与关系型知识库中的检索效果。该基准含有多样化和现实的查询,要求上下文相关推理,为未来研究提供有力支持。STaRK已在Hugging Face平台发布,并可以通过pip包直接加载,支持用户互动查询的探索性界面。更多详情请访问官方网站。

MMStar - 大型视觉语言模型评估的新标准
GithubMMStar人工智能基准测试多模态评估开源项目视觉语言模型
MMStar是一个创新的多模态评估基准,包含1500个精选的视觉关键样本。它解决了现有评估中的视觉冗余和数据泄露问题,提高了多模态性能评估的准确性。MMStar涵盖6大核心能力和18个细分维度,每个核心能力均衡分配250个样本。项目提供评估工具、数据集和在线排行榜,为视觉语言模型研究指明新方向。
llm_benchmarks - 大语言模型评估基准集合
GithubLLM人工智能开源项目机器学习自然语言处理语言理解
llm_benchmarks是一个全面的大语言模型评估基准集合,涵盖知识理解、推理能力、多轮对话和内容摘要等方面。该项目包含MMLU、ARC、GLUE等知名数据集,用于测试模型在不同任务中的表现。这一标准化工具为评估大语言模型性能提供了可靠依据,有助于相关技术的发展与应用。
FalkorDB - 为大语言模型优化的高性能知识图谱数据库
FalkorDBGithubOpenCypherRedis图数据库开源项目知识图谱
FalkorDB是一款专为大型语言模型设计的知识图谱数据库。它采用稀疏矩阵和线性代数技术实现低延迟图查询,支持属性图模型和OpenCypher查询语言。FalkorDB提供多种编程语言的客户端库,可轻松集成到Redis中,为AI应用提供高效的知识检索能力。
marqo - 向量搜索引擎 ,实现文本和图像内容的矢量化处理及检索
GithubMarqo向量搜索嵌入生成开源项目数据索引机器学习
Marqo 作为全面的端到端向量搜索引擎,不仅实现文本和图像内容的矢量化处理及检索,更支持最新机器学习模型。其简洁的API设计允许开发者轻松实行多样的语义搜索操作,且无需独立处理数据嵌入问题。Marqo 的云服务部署有效降低响应时间,同时提供可伸缩的计算资源、持续可靠的服务及全时技术支持。
rag-stack - 基于RAG技术的企业级智能问答平台
GithubRAGstack企业知识库向量数据库开源LLM开源项目检索增强生成
RAGstack是一个基于检索增强生成(RAG)技术的企业级智能问答平台。该项目支持Llama 2、Falcon和GPT4All等开源大语言模型,利用Qdrant向量数据库实现高效文档检索。RAGstack提供简洁的服务器和用户界面,支持PDF文档上传和智能问答。系统可在本地运行,也可轻松部署到各大主流云平台,为企业提供安全可控的私有化知识问答解决方案。
storm - 基于网络搜索的多视角问答主题大纲生成
GithubSTORM互联网搜索多视角提问开源项目文章生成论文
STORM 是一个基于大语言模型的系统,通过互联网搜索生成类似维基百科的文章。该系统分为预写和撰写两个阶段,通过多视角提问和模拟对话自动化研究过程中的问题生成,从而提升文章的深度和广度。最新更新包括支持用户自定义文件的 VectorRM、新的开发者演示界面以及对 Bing 搜索的支持。该系统适用于知识探索和维基百科编辑的预写阶段。通过 pip 安装知识风暴库以体验 STORM 的知识探索功能。
Splade_PP_en_v1 - SPLADE++稀疏文档检索模型的工业级优化实现
GithubHuggingfaceSPLADE++关键词扩展开源项目文档检索检索效率模型稀疏表示
基于SPLADE++的文档检索模型优化实现,通过FLOPS和令牌预算的调整实现高效检索。模型以bert-base-uncased为基础,在47.27ms的检索延迟下达到37.22的MRR@10性能,适合工业级搜索应用部署。
stanza-en - 英文语言处理的高级工具集
GithubHuggingfaceNLP模型Stanza实体识别开源项目模型语法分析语言分析
Stanza提供英文语言的精准高效分析,从文本处理到句法分析与实体识别,均使用先进的NLP模型。了解更多信息,请访问其官方网站和GitHub仓库。
splade - 优化查询和文档检索的SPLADE稀疏模型
BEIR基准GithubSPLADE信息检索开源项目模型训练
SPLADE项目使用BERT的MLM头和稀疏正则化来学习查询和文档的稀疏扩展,优化了检索性能。项目包含训练、索引和检索的代码,并支持在BEIR基准测试中评估。最新版本通过硬负样本采样、蒸馏和改进的预训练语言模型初始化,显著提升了检索效果。此外,SPLADE的稀疏表示优化了倒排索引的使用,提供了显式词汇匹配和可解释性等优点。经过优化的训练和正则化,SPLADE在域内外测试中表现优异,延迟性能与BM25相当。
haystack - 用于构建端到端LLM应用程序的高级框架,支持广泛的NLP功能
GithubHaystackLLM开源项目文档检索热门自然语言问答语义搜索
Haystack是一个综合性的LLM框架,能够实现从文档检索到问题回答的多种功能。用户可以灵活选择使用OpenAI、Cohere、Hugging Face等提供的模型,或是自定义部署在各大平台的模型。该框架支持包括语义搜索、答案生成和大规模文档处理等广泛的NLP任务,同时还支持使用现成模型或对其进行微调,基于用户反馈持续优化模型性能。适用于企业级应用开发,帮助用户解决复杂的NLP问题。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号