Logo

#数据采集

Logo of DongTai-agent-java
DongTai-agent-java
DongTai-agent-java是一个针对Java应用的数据采集工具。通过重写类字节码,工具收集必要数据并发送到dongtai-OpenAPI服务,随后由云引擎处理这些数据以检测安全漏洞。其主要组件包括管理代理生命周期和配置的agent.jar、进行字节码桩和数据处理的dongtai-core.jar、用于BootStrap ClassLoader注入的dongtai-inject.jar及用于请求和响应数据展示的dongtai-servlet.jar。广泛应用于DevOps、安全测试、第三方组件管理、代码审计及0 Day漏洞挖掘。
Logo of Crawler
Crawler
这是一个开源项目,专注于抖音、快手、哔哩哔哩等主流社交媒体平台的数据采集。项目提供API接口,支持关键词搜索、内容详情获取、评论采集和媒体资源下载。该项目旨在帮助开发者了解平台特性,强调合法合规使用,仅供学习和研究。
Logo of PhantomBuster
PhantomBuster
PhantomBuster提供100多个自动化功能,用于数据采集和外联。该工具可从多个网站提取潜在客户信息、丰富数据并发送外联消息,无需编码即可使用。它可节省大量重复性工作时间,加速企业增长。目前已有超10万家企业使用PhantomBuster实现营销自动化。
Logo of Databar.ai
Databar.ai
Databar.ai提供无需编码的数据收集和处理自动化服务。平台集成1200多个API连接器,支持从网络和第三方API轻松获取数据,并通过100多个数据源进行丰富。具备实时数据可视化功能,可将数据灵活输出。适用于销售、市场营销、金融、人力资源等领域,助力企业高效获取和应用数据。
Logo of crawlers
crawlers
Norconex Crawlers是一个开源的网络和文件系统爬虫框架,提供全面的数据采集和处理功能。该框架支持灵活的数据存储方式,可扩展性强,跨平台兼容。它既可通过命令行配置文件运行,也能作为Java库集成到应用中。Norconex Crawlers适用于搜索引擎数据采集等多种场景,是一个功能完善的爬虫解决方案。
Logo of MediaCrawler
MediaCrawler
MediaCrawler是一款开源的社交媒体数据爬虫工具,支持小红书、抖音、快手等多个主流平台。该工具可采集视频、图片、评论等内容,提供关键词搜索、指定ID爬取等功能。项目采用Playwright技术简化逆向过程,并集成了登录态缓存、IP代理等实用特性。MediaCrawler为社交媒体数据分析提供了便捷的数据采集解决方案。
Logo of Nimble Data
Nimble Data
Nimble Data提供专业的网络数据采集服务,包括高质量住宅代理IP和先进网络抓取工具。平台特色包括AI优化的代理基础设施和现代浏览器指纹技术。Nimble Pricing提供灵活的定价方案,支持针对网页、搜索引擎结果、电商数据和地图信息的数据采集。企业和开发者可以通过免费试用体验高效、灵活的数据采集解决方案。
Logo of My Email Extractor
My Email Extractor
My Email Extractor是一款Chrome扩展工具,用于自动提取网站的邮箱和联系信息。它可以快速批量提取邮箱、电话号码和社交媒体资料,支持单页面提取和域名到邮箱的查找。该工具提供lead生成、市场研究和数据自动化功能,有免费版和付费专业版可选。My Email Extractor适用于需要收集销售线索和市场信息的用户。
Logo of Scanlist
Scanlist
Scanlist是AI驱动的智能营销工具,提供实时商业联系人信息扫描与提取。它利用人工智能生成个性化消息和高质量营销文案,支持LinkedIn潜在客户导出,并提供邮箱验证和数据丰富服务。适用于销售、营销及招聘团队,助力提升工作效率。
Logo of examples-of-web-crawlers
examples-of-web-crawlers
该项目汇集了多个Python爬虫实例,内容涵盖网页抓取、数据分析等领域。实例包括淘宝模拟登录、天猫商品数据爬取、微信自动消息发送和高清壁纸下载等。代码结构清晰,注释详尽,适合爬虫学习者参考。项目还介绍了多线程爬虫和代理池等进阶技术,为Python爬虫技能提升提供了实践途径。
Logo of Webscrape AI
Webscrape AI
Webscrape AI是一款智能网页数据采集工具,无需编程技能即可使用。用户只需输入目标URL和所需数据项,AI爬虫便能自动完成数据采集。该工具具有高精度、高效率、可定制化和成本效益等优势,适合各类企业使用。Webscrape AI提供基础版、专业版和批量版等多种订阅方案,是一个基于SaaS模式的自动化数据采集解决方案。
Logo of Stride
Stride
Stride是一款AI驱动的邮件营销工具,专注于从社交媒体平台收集高质量邮箱地址。其核心功能包括Scanner和List Builder,可分别从Twitter等平台的新增和现有粉丝中获取邮件列表。该工具生成的邮件列表具有高质量、及时更新和价格实惠的特点。这些邮件可用于电商推广、新闻通讯发送和活动策划等多种营销场景,有助于提高企业转化率和扩大客户群。Stride还提供营销支持服务和免费博客资源,适合各类企业优化邮件营销策略。
Logo of LinkAgent
LinkAgent
LinkAgent是一个基于Java的开源代理框架,利用JVM字节码技术实现Java应用的数据采集和功能控制,无需修改源代码。它采用模块化架构,包含simulator-agent、instrument-simulator和instrument-modules组件,支持多种中间件并可自定义扩展。这一工具适用于应用性能监控、故障诊断和系统优化等领域。
Logo of TikTokDownloader
TikTokDownloader
TikTokDownloader是一个开源项目,用于下载抖音和TikTok平台的无水印视频、图集和直播内容。它支持批量下载账号作品、收藏内容,并可采集详细数据。该工具提供命令行和Web界面,具有多线程下载、代理设置等功能,适合需要采集视频数据的用户使用。
Logo of Aasaan
Aasaan
Aasaan是一个快速启用在线商店的电子商务平台。通过支持条形码扫描等功能,帮助商家高效管理库存和产品信息。平台简化了在线零售流程,使商家能轻松将业务拓展到互联网,扩大市场覆盖和销售机会。
Logo of Webtap.ai
Webtap.ai
Webtap.ai是一个创新的网页数据抓取平台,通过先进的AI技术实现全面的网页数据获取。平台支持自然语言查询,无需编码即可抓取数据。其功能包括自动解决验证码、数据识别转换、适应网站变化等,提供全方位的数据抓取解决方案。Webtap.ai支持多种数据导出格式,未来还将推出API接口,为用户带来灵活高效的数据获取体验。
Logo of awesome-web-archiving
awesome-web-archiving
该项目汇集了网络存档领域的各类工具、软件和资源。涵盖网页获取、回放、搜索和分析等环节,覆盖了网络存档的完整流程。包含开源软件、培训材料和社区资源,为网络档案管理员、研究人员和开发者提供参考。项目内容全面,适合不同经验水平的用户查阅和使用。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号