Logo

#搜索引擎

Logo of trieve
trieve
Trieve 提供自托管解决方案,支持语义密集向量搜索、拼写容错搜索、子句高亮显示、推荐、RAG API 路由等功能。用户可自定义模型并优化混合搜索,Trieve 还支持流行度排名、重复检测等,适用于本地或公司VPC的高效搜索基础设施搭建。
Logo of llms_paper
llms_paper
llms_paper是一个高级学术资源库,专注于顶会论文的记录与整理,涵盖多模态、PEFT、小样本QA问答等多个领域。该项目深入探讨了LLMs在医疗、法律等多个行业中智能问答系统的应用,并展示了LLMs在多模态交互及数据解析方面的有效性。为算法工程师和研究人员提供最新的研究成果与实用技术笔记,是深入LLMs领域的理想资源。
Logo of nucliadb
nucliadb
NucliaDB是一款专为存储和搜索非结构化数据设计的强大数据库。它支持向量、全文本和图形索引的混合搜索,由Rust和Python编写,能处理大规模数据集并支持多租户系统。通过Nuclia云平台,无需额外的数据提取、丰富和推理操作。其主要功能包括存储文本、文件、向量、标签和注释,进行语义搜索和高效数据导出,支持云端数据提取、资源备份及分布式搜索。
Logo of Awesome-Deep-Learning-Papers-for-Search-Recommendation-Advertising
Awesome-Deep-Learning-Papers-for-Search-Recommendation-Advertising
该项目汇集了搜索、推荐和广告领域的前沿深度学习论文,收录了100多篇顶级会议论文。内容涵盖嵌入、匹配、排序(如CTR/CVR预测)、后排序、迁移学习和强化学习等关键技术,包括DSSM、YouTube DNN等经典模型。收录了Google、Facebook、Alibaba等顶级科技公司的研究成果,为从业者提供全面的学习资源和研究参考。通过这些精选论文,读者可深入了解行业前沿技术和实践应用。
Logo of MS-MARCO-Web-Search
MS-MARCO-Web-Search
MS-MARCO-Web-Search是一个基于ClueWeb22的大规模网络数据集,包含数百万真实查询点击标签。它提供丰富的文本、视觉和语义信息,设置了嵌入模型、嵌入检索和端到端检索三个挑战任务。该数据集旨在推动机器学习和信息检索系统研究,并验证方法在大规模数据上的有效性。
Logo of SearchEngine
SearchEngine
该项目系统地介绍搜索引擎核心技术,包括基础概念、相关性评估、查询处理、召回策略和排序算法。内容涵盖BERT模型在相关性判断中的应用,以及查询词处理和推荐系统的优化方法。项目详细讲解了倒排索引、向量召回、BERT模型应用等关键技术,并探讨了查询词分词、意图识别、排序模型训练等实际问题。通过幻灯片和视频资源,为开发者和研究人员提供搜索引擎技术的深入学习材料,这些内容对于理解和实现现代搜索引擎至关重要。
Logo of Vortex
Vortex
Vortex是一个面向科研领域的智能搜索平台,整合了超过2.2亿篇学术论文。该平台运用AI技术提供文献检索、摘要生成和洞见综合等功能,旨在提升研究效率。Vortex的特点包括精准搜索、相关性解释、AI分析和实时对话模式,为研究人员提供全面的学术资源支持,助力科研工作者更有效地进行学术探索。
Logo of Loop54
Loop54
Loop54为电商提供个性化技术解决方案,专注于优化网站搜索、导航和推荐功能。其AI算法能够利用有限数据实现精准的一对一个性化,快速提升用户体验和销售业绩。这项技术适用于不同规模的企业,无需长期数据积累即可部署,帮助企业获得与行业巨头相当的个性化能力。
Logo of ID Ranking
ID Ranking
ID Ranking提供多种免费AI驱动的SEO工具,包括关键词规划、排名检查、密度分析和搜索引擎爬虫模拟器。平台还集成了HTTP状态检测、域名IP转换、图片编辑、反向图片搜索和视频下载等功能。通过先进的爬虫和AI技术,ID Ranking致力于解决从关键词研究到内容生成再到排名监控的全链路SEO问题,为用户提供全面的搜索引擎优化解决方案。
Logo of TrackGPTs
TrackGPTs
TrackGPTs汇集超过70万个GPT模型,涵盖教育、生产力、生活方式、研究、写作和编程等领域。网站提供集中展示、分类浏览和搜索功能,方便用户快速找到所需的AI助手。通过TrackGPTs,可以轻松探索和比较各类GPT模型的特点与功能。
Logo of AI-MTHRFCKR
AI-MTHRFCKR
AI-MTHRFCKR是一个全面的人工智能应用资源库,涵盖艺术、图像、音频和商业等多个领域。项目通过系统分类,提供AI项目示例、工具和技术,方便用户快速了解AI在不同领域的应用。资源库持续更新,展示AI技术的最新进展,为对AI感兴趣的人提供丰富的学习和探索资源。
Logo of sample-apps
sample-apps
Sample-apps项目展示了Vespa的多种应用场景,包括基础推荐、语义搜索、检索增强生成(RAG)和多向量索引等。该项目通过电商搜索、新闻推荐和大规模图像检索等实例,展示了Vespa的实际应用能力。开发者可以参考album-recommendation、news和billion-scale-image-search等多个示例应用,快速掌握Vespa的基础和高级功能实现。
Logo of terrier-core
terrier-core
terrier-core是一个开源搜索引擎平台,专为大规模文档集合设计。它提供先进的索引和检索功能,支持快速开发和评估大规模检索应用。该平台兼容TREC和CLEF测试集,适用于文本检索研究。最新版本集成Python接口PyTerrier,便于在Jupyter或Colab环境中进行实验。
Logo of gerev
gerev
AI企业搜索引擎,助力快速查找内部对话、文档与页面。支持Slack、Confluence、Jira等多种集成,适用于故障排除和问题定位。提供云托管与自托管版本,支持自然语言查询。
Logo of elasticsearch-labs
elasticsearch-labs
该项目收录了可执行的Python笔记本、示例应用和资源,用于测试Elastic平台的各种功能。通过本项目,可以学习如何利用Elasticsearch作为向量数据库,支持混合和语义搜索,并构建检索增强生成、摘要和问答等应用场景。还可以测试Elastic的前沿功能,例如Elastic Learned Sparse Encoder和递归排序融合。项目还支持与OpenAI、Hugging Face等集成,为AI/ML驱动的应用提供基础,探索更多高级搜索体验。
Logo of orama
orama
Orama提供全文本、向量和混合搜索功能,适用于浏览器、服务器、移动应用和边缘设备,并且体积小于2KB。主要功能包括向量搜索、混合搜索、筛选器、地理搜索、字段提升、容错和精确匹配。通过插件系统,用户可以扩展功能,支持30种语言的词干提取和标记。Orama易于安装和使用,文档详细并有社区支持,是理想的轻量级搜索解决方案。
Logo of shodan-python
shodan-python
shodan-python是Shodan搜索引擎的官方Python库和命令行接口。它提供API访问方式,用于搜索和分析互联网连接设备的数据。主要功能包括快速IP查询、实时数据流处理、网络警报设置、漏洞搜索、批量数据下载和DNS数据库访问。该工具可用于安全研究、网络监控和数据分析等领域。
Logo of chatgpt-google-extension
chatgpt-google-extension
该浏览器扩展将ChatGPT功能整合到Google等主流搜索引擎中。支持多个搜索平台,兼容OpenAI API和ChatGPT Plus。具有Markdown渲染、代码高亮和暗黑模式等功能,可自定义触发方式和切换语言。这一工具通过AI辅助,优化了搜索流程,提高了信息获取的效率。
Logo of searxng-docker
searxng-docker
searxng-docker项目提供快速部署SearXNG私密搜索实例的解决方案。该项目集成Caddy反向代理、SearXNG搜索引擎和Valkey内存数据库,利用Docker技术实现简单安装和配置。支持多架构Docker镜像,并附有详细使用指南和更新方法,便于维护和升级。适合希望在短时间内搭建私密搜索服务的用户。
Logo of mymind
mymind
mymind是一款创新型个人信息管理平台,为用户提供私密空间存储和整理各类数字内容。该工具运用人工智能技术,自动组织和可视化笔记、图片、引用和重点内容,无需手动分类标记。平台支持快速保存和智能检索,方便用户轻松找到所需信息。mymind注重隐私保护,界面设计简洁,旨在提高信息管理效率,让用户节省整理时间,更专注于创意和生产力。
Logo of Ayraa
Ayraa
Ayraa是一款智能工作知识助手平台,专为专业人士和快速成长团队设计。该平台整合多种工作应用,提供高效的搜索和问答功能。核心特性包括AI搜索引擎、会议转录、浏览器AI助手和URL管理等。Ayraa旨在提高工作效率,减轻信息负担,同时注重数据安全和隐私保护。适用于产品、销售等各类团队,Ayraa为用户构建个性化知识库,大幅提升工作效率。
Logo of AwesomeGPTs
AwesomeGPTs
AwesomeGPTs是一个专业的OpenAI GPTs目录和搜索平台。网站收录超过10,000个自定义GPTs,涵盖多个领域和应用场景。用户可以轻松浏览热门GPTs、搜索特定功能,并分享自创GPTs。平台致力于帮助用户充分探索和利用OpenAI的GPT技术,挖掘其在各行业中的应用潜力。
Logo of Tavily
Tavily
Tavily是一款为AI助手和LLMs优化的搜索引擎API。它提供实时、准确的搜索结果,提升AI决策能力,减少幻觉和偏见。支持深度研究和智能查询,单次API调用即可获取可信且精选的信息。Tavily为AI应用提供可靠的实时知识连接,受到全球AI领域专业人士的认可。
Logo of minisearch
minisearch
MiniSearch是一款JavaScript编写的轻量级内存全文搜索引擎。它支持精确匹配、前缀搜索、模糊匹配和字段提升等功能,适用于数据量适中的全文搜索场景。MiniSearch可在浏览器和Node.js环境运行,支持实时索引更新和自动建议功能。无外部依赖且资源占用少,非常适合需快速响应的客户端搜索应用。
Logo of obsidian-omnisearch
obsidian-omnisearch
Omnisearch是Obsidian的智能搜索引擎插件,采用BM25算法和智能权重系统实现即时相关结果展示。支持笔记、PDF和图片搜索,具备防错别字和文件类型过滤功能。插件提供快速切换器式工作流和键盘优先操作,显著提升笔记检索效率。此外,其可选的本地HTTP服务器功能允许从Obsidian外部进行查询,扩展了应用场景。
Logo of retriv
retriv
retriv是一个Python搜索引擎库,支持稀疏、密集和混合检索模式。它利用Numba进行向量运算加速,整合了PyTorch、Transformers和Faiss等工具,实现了高效的检索功能。该库提供自动调优,支持多语言处理,并可通过简单的API快速构建搜索系统。
Logo of search_with_lepton
search_with_lepton
Search with Lepton 使用户能够使用不到500行代码搭建自己的对话式搜索引擎。此项目支持LLM和搜索引擎集成,提供可定制的用户界面以及可分享的缓存搜索结果。支持多种搜索引擎选项,包括Bing和Google,并提供一键部署到Lepton AI的功能。无论是通过简单的配置还是高级定制,用户都能迅速搭建并运行高效的搜索解决方案。
Logo of awesome-ai-tools
awesome-ai-tools
全面了解各种顶级生成式AI工具与大语言模型,如OpenAI API、ChatGPT和Claude 3等。从文本生成、编程到图像、视频和音频生成,这里提供最完整的AI工具推荐,并支持免费提交和展示自己的AI产品。探索最新AI工具,紧跟技术创新前沿。
Logo of meilisearch
meilisearch
Meilisearch是一款易于安装和维护的高速搜索引擎,提供混合搜索、即时搜索等功能,适用于广泛的应用场景。支持多租户、地理搜索和多语言处理,通过Meilisearch Cloud实现无缝集成,无需额外服务器部署或手动更新。Meilisearch帮助开发者轻松实现高效搜索,提高用户体验。
Logo of askaitools-community-edition
askaitools-community-edition
AskAITools Community Edition是开源AI搜索引擎框架,提供基础前端和搜索功能。采用混合搜索架构,结合关键词和语义搜索,实现高效准确的结果。易于定制,适用于构建垂直搜索引擎或内部文档搜索系统。技术栈包括Next.js、Supabase和OpenAI,支持灵活部署和二次开发。
Logo of MarginaliaSearch
MarginaliaSearch
MarginaliaSearch是一个创新开源搜索引擎项目,致力于开发新的互联网内容发现方法。作为实验性工坊和公共服务,该项目旨在突出互联网的人性化和非商业化特征。MarginaliaSearch采用低成本硬件和精简运营模式,提供独特搜索体验。支持自托管部署,可用于个人数据检索。项目未来计划通过赠款、捐赠和商业API授权维持发展。
Logo of SearchGPTool
SearchGPTool
SearchGPTool是一款GPT驱动的免费搜索引擎,提供精准的搜索结果、增强的过滤功能和个性化推荐。这款AI-powered search engine利用先进的人工智能技术提升搜索体验,使信息检索更加高效。适用于日常查询和专业研究,满足多样化的搜索需求,提供直观快速的搜索平台。作为一个free GPT search tool,SearchGPTool旨在为用户带来智能、便捷的搜索体验。
Logo of 秘塔AI搜索
秘塔AI搜索
秘塔AI搜索作为一款创新的智能搜索引擎,提供无广告、直达结果的搜索体验。平台支持全网、文库、学术和播客等多种搜索范围,并包含中英文文献库检索功能。通过扫描二维码可在手机端免费使用,实现便捷高效的信息获取。
Logo of Nightbloom
Nightbloom
Nightbloom是专为Midjourney AI生成图像设计的搜索引擎平台,提供丰富的AI艺术作品资源。平台功能包括图像搜索、收藏夹、风格指南和博客,为创意爱好者和专业人士打造探索AI艺术的综合环境。通过便捷的搜索和浏览功能,用户可以在AI生成艺术中寻找灵感,发掘独特创意。
Logo of GenDelve
GenDelve
GenDelve融合量子场景模拟与创意内容生成,提供多样化工具界面。平台特色包括量子物理模拟器、宇宙模因生成器和跨维度搜索引擎,将科学、艺术与技术相结合。用户可在此探索量子概念、创作数字艺术并进行跨学科研究,体验前沿科技带来的无限可能。无论您是科研工作者、艺术家还是科技爱好者,GenDelve都能激发您的创造力,帮助您在量子计算和人工智能领域开拓新视野。
Logo of Consensus
Consensus
Consensus运用AI技术革新学术搜索领域,涵盖超2亿篇跨学科研究论文。平台提供快速文献综述、关键见解和主题综合功能,显著提升研究效率。其专有搜索工具和过滤系统帮助用户精准定位高质量论文。Consensus注重结果的准确性和可靠性,每条信息均直接关联原始研究,为学术探索提供坚实基础。该工具适用于科研人员、学生及各领域专业人士,推动学术研究的创新与发展。
Logo of rank_bm25
rank_bm25
Rank-BM25是一个开源的Python文本检索库,实现了多种BM25算法变体,如Okapi BM25、BM25L和BM25+。该项目提供简洁的API,支持文档索引、评分和排序。用户可自行处理文本预处理,灵活应用于各类检索任务。Rank-BM25适合构建小型搜索引擎或用于信息检索研究,具有易用性和可扩展性。
Logo of kumo-search
kumo-search
kumo search是一个端到端搜索引擎框架,运行在EA平台上。它支持全文检索、倒排索引、排序等功能,适用于数据量中等、业务复杂的垂直领域搜索。该框架允许使用Python编写业务逻辑,通过AOT编译器自动生成C++代码,实现快速迭代。kumo search提供多个基础库和服务项目,包括向量引擎和综合搜索引擎,为搭建全面搜索解决方案提供支持。
Logo of agent-search
agent-search
AgentSearch是一个创新框架,通过结合多家提供商的LLM技术与搜索引擎,增强搜索代理性能。支持搜索结果总结、查询生成与深度检索,还能部署个性化本地搜索解决方案,提供多样的API接入选项。
Logo of resin
resin
Resin是一款基于向量空间索引的搜索引擎,可作为HTTP服务使用或嵌入式库操作。用户能远程或本地写入文档,并通过HTTP GET或POST查询,实现复杂查询结构和高效字段读取。文档数据库使用文档集合形式存储数据,并应用自定义模型和索引策略。该引擎支持多种消息格式和优化工具,适用于处理大规模数据集并提供子秒级短语搜索。
Logo of dark-web-osint-tools
dark-web-osint-tools
dark-web-osint-tools项目整合了多种暗网开源情报(OSINT)工具,涵盖暗网搜索引擎、洋葱链接获取与扫描、数据爬取等功能。该资源库包含Katana、OnionSearch、TorBot等实用工具,为研究人员和网络安全专业人士提供了探索和分析暗网信息的有力支持。这些工具有助于深入挖掘暗网数据,提高情报搜集效率,为相关领域的研究和实践提供了有价值的技术支持。
Logo of googleimagesrestored
googleimagesrestored
Google Images Restored是一款浏览器扩展,旨在恢复2019年8月6日前的Google图片搜索界面。该扩展重现了经典的搜索布局和功能,适用于Chrome和Firefox浏览器。为获得完整的传统搜索体验,建议配合使用Disable Google Lens扩展。此扩展还原了包括布局和功能在内的完整搜索体验,帮助用户重拾熟悉高效的图片搜索方式。
Logo of duckduckgo_search
duckduckgo_search
duckduckgo_search是一个基于DuckDuckGo搜索引擎的Python库,支持文本、图片、视频、新闻等多类型搜索。该库还提供AI聊天、即时答案查询、翻译功能,以及文件和图片下载能力。通过同步和异步API以及代理支持,满足多样化的网络搜索和内容获取需求。
Logo of Globe Explorer
Globe Explorer
Globe Explorer平台聚焦全球热门话题,提供分类展示和互动探讨功能。用户可通过直观界面浏览感兴趣的内容,支持登录注册以促进社区交流。平台设有默认、专业和turbo专业研究等多种模式,满足不同需求。通过视觉化呈现,Globe Explorer鼓励用户深入参与全球性话题探索。
Logo of Everypixel
Everypixel
Everypixel集成50余个优质图源,通过AI技术提供高效图片搜索服务。平台囊括免费和付费图库,支持智能检索和价格对比功能。其简化的搜索流程和全面的资源整合,为设计、营销及内容创作等领域提供便捷的图片获取解决方案。
Logo of Big Metrics
Big Metrics
Big Metrics是一款专业SEO分析工具,深度挖掘Google Search Console数据价值。提供GSC数据分析、关键词优化、页面爬虫、内容编辑等功能,全面提升SEO效果。可预测趋势、区分品牌流量、检测关键词冲突,提供可操作的SEO洞察。通过直观报告和灵活分段,简化SEO分析流程,适合SEO分析师和营销人员使用。
Logo of Spacum
Spacum
Spacum作为创新搜索平台,整合了多样化搜索功能和独特的用户收益机制。提供Web、图片、视频和新闻等全面搜索服务,同时允许用户在搜索过程中获取收益。平台重视用户隐私,配备安全搜索、多语言选项和暗黑模式等功能。另外,Spacum通过联盟营销计划为用户开辟额外收入渠道,实现了搜索服务与盈利模式的有机结合,代表了互联网工具的新发展方向。
Logo of 开搜AI
开搜AI
开搜AI是一款智能搜索引擎,提供精准的知识问答服务。作为先进的浏览器搜索工具,它能自动总结重点、生成大纲和思维导图,支持下载功能。系统从海量文献中筛选有用信息,提升信息获取效率。特点包括快速响应、无广告干扰,为用户带来便捷高效的搜索体验。
Logo of havenask
havenask
Havenask是阿里巴巴开源的分布式搜索引擎,支持千亿级数据实时检索和百万级QPS查询。它采用C++底层构建,提供SQL查询支持和丰富的插件机制。Havenask具有高性能、低延迟和灵活定制的特点,可快速迭代算法,适用于构建各类智能搜索服务。该项目已在阿里巴巴集团多个业务中广泛应用。
Logo of awesome-pretrained-models-for-information-retrieval
awesome-pretrained-models-for-information-retrieval
该项目汇集了信息检索领域预训练模型相关的重要论文资源。内容涵盖第一阶段检索、重排序、联合学习等核心技术,以及大语言模型应用和多模态检索等前沿主题。项目提供了全面的文献综述,有助于研究人员和从业者了解该领域的最新进展和发展方向。资源列表系统梳理了稀疏检索、密集检索等关键技术,为相关研究提供了宝贵的参考。