#网站爬虫
gpt-crawler - 网站爬取工具 快速构建GPT知识库
GPT Crawler网站爬虫知识文件生成自定义GPTOpenAIGithub开源项目
gpt-crawler是一款网站爬取工具,用于生成知识文件并创建定制GPT或AI助手。支持灵活配置爬取参数,包括URL、选择器和页面限制。生成的数据可上传至OpenAI平台,快速构建专属GPT或AI助手。工具提供本地运行、Docker容器和API服务等多种使用方式,适用于不同场景。开发者和内容创作者可借此高效构建特定领域的AI应用。
UseScraper - 高性能网络爬虫与数据采集API平台
AI工具网页抓取网站爬虫APIJavaScript渲染数据提取
UseScraper是一款高性能网络爬虫和数据采集API平台。支持快速网页抓取和整站爬取,具备JavaScript渲染功能,可输出多种格式数据。采用按量付费模式,配备自动代理和并行处理技术,有效规避速率限制。该平台适用于各类网页数据采集需求,提供高效便捷的网络数据获取解决方案。
docs-scraper - 文档网站爬虫工具 为Meilisearch生成搜索索引
Meilisearch文档搜索网站爬虫全文检索开源搜索引擎Github开源项目
docs-scraper是一款为文档网站设计的爬虫工具,可将爬取内容索引到Meilisearch中。支持自定义配置文件定义爬取范围和选择器,适应不同文档结构。提供Docker部署和GitHub Action集成,易于整合现有工作流。使用docs-scraper可快速为文档网站构建高效搜索功能。
laravel-site-search - Laravel全站搜索包 快速爬取与高效索引
全文搜索网站爬虫搜索索引LaravelMeilisearchGithub开源项目
laravel-site-search是一个Laravel全站搜索包,可自定义爬取和索引网站内容。基于Meilisearch提供快速搜索,支持多并发爬取以提高效率。该包为开发者提供了实现站内搜索功能的完整解决方案,类似于私有化的搜索引擎。它具有配置灵活性高,易于与Laravel集成的特点,为创建高效、个性化的站内搜索提供了便利。
python-seo-analyzer - Python网站SEO分析与优化工具
PythonSEO分析网站爬虫技术SEOBeautifulSoup4Github开源项目
python-seo-analyzer是一个开源的SEO分析工具,可爬取网站结构、统计文本内容并识别技术SEO问题。支持命令行和API调用,能分析标题标签、额外标签和内部链接。输出JSON或HTML格式报告,便于网站SEO优化。该工具支持Python 3.6+环境,可通过pip安装或使用Docker运行。