Project Icon

autoscraper

自动化智能高效的Python网页抓取工具

AutoScraper 是一款为简化网页爬取而设计的智能工具,能够自动学习爬取规则,获取网页中的文本、URL及HTML标签值。兼容Python 3,支持从Git、PyPI或源代码安装,允许使用代理和自定义请求参数,并且可以保存和加载模型,满足各种复杂的网页数据抓取需求。

nsfw_data_scraper - 自动化图像收集脚本,适用于多种分类任务
GithubNSFW Data Scraper图像分类开源项目数据集脚本训练
该项目提供一套脚本,用于自动收集数万张图像,帮助训练图像分类器。支持的分类包括色情、Hentai、性感、中性和安全工作绘图。数据收集通过Docker完成,支持多种数据源,如subreddits和Danbooru2018。项目包含从URL获取到数据集划分的完整流程,并支持训练卷积神经网络模型,已实现91%的分类准确率。
blackmaria - Python库,用于通过自然语言进行网页抓取
Black MariaGithubGuardrailsPython库开源项目网页抓取自然语言处理
Black Maria是一个用于通过自然语言进行网页抓取的Python库。用户只需导出OPEN_AI_KEY环境变量并安装blackmaria库,即可开始使用。通过guardrails提供详细指令,获取针对特定网页的结构化数据,适合开发者和数据分析师。
automa - 浏览器自动化工具 简化重复任务的智能解决方案
AutomaChrome扩展Github任务自动化工作流开源项目浏览器自动化
Automa是一款创新的浏览器扩展,通过连接功能块实现自动化操作。这款工具能够自动填充表单、执行重复任务、截取屏幕和抓取网站数据,还可设置任务执行时间。Automa支持Chrome和Firefox浏览器,提供marketplace用于分享和下载工作流。此外,它还能生成独立的Chrome扩展,进一步拓展自动化应用范围。
yagooglesearch - 智能模拟人类行为的Google搜索Python库
GithubGoogle搜索HTTP代理Python库yagooglesearch开源项目网页抓取
yagooglesearch是一个用于执行智能Google搜索的Python库。该工具模拟真实人类搜索行为,避免触发Google的限制机制。它提供可调节的客户端属性、HTTP 429检测与恢复、随机延迟、代理支持等功能,实现高效稳定的Google搜索。
autokeras - 机器学习自动化工具,简化图像分类任务
AutoKerasAutoMLGithubPython开源项目机器学习深度学习
AutoKeras是由德州农工大学DATA实验室开发的开源项目,旨在简化机器学习流程。通过Keras的AutoML系统,用户能够轻松完成图像分类等任务。支持Python 3.7及以上版本和TensorFlow 2.8.0及以上版本,安装方便,只需使用pip命令。提供详细的官方教程和相关书籍资源,社区鼓励贡献和参与。
django-autoslug - Django自动生成唯一且国际化友好的URL Slug
AutoSlugFieldDjangoGithubPythonURL优化开源项目数据库模型
django-autoslug是一个Django库,用于自动生成和管理URL友好的slug。它能从其他字段自动填充内容,确保唯一性,并支持自定义slugify函数以优化国际化。适用于Python 3.8+和Django 3.2+环境,该库简化了SEO友好URL的创建过程,有助于提升网站的可用性和搜索引擎优化。
DrissionPage - Python网页自动化工具 结合浏览器控制和数据包处理
DrissionPageGithub开源项目数据包处理浏览器控制爬虫工具网页自动化
DrissionPage是一个Python网页自动化工具,集成了浏览器控制和数据包处理功能。项目特点包括简洁的语法、用户友好的设计和便捷功能,适用于数据采集和复杂网页交互场景。DrissionPage旨在提高网页自动化操作的效率和简便性,为开发者提供web自动化解决方案。
AutoPR - AI代码自动化管理工具
AIAutoPRGitHub ActionsGithubPoetryworkflow开源项目
AutoPR 是一个基于AI的工具,能够自动生成代码摘要、管理TODO事项、保存API调用历史,并通过拉取请求标签自动总结变更。用户可以通过YAML文件自定义工作流,并与GitHub Actions集成,实现自动化代码管理。
katana - 下一代高效网络爬虫与数据采集框架
GithubKatanaWeb抓取开源项目爬虫框架网络安全自动化
Katana是一款基于Go语言开发的高性能网络爬虫框架,专为自动化流程设计。它支持无头和有头两种爬取模式,能够解析JavaScript、自动填充表单,并提供精确的范围控制。Katana具有多样化的输入输出选项,高度可配置,适用于各类网络数据采集任务。其灵活架构使其成为执行复杂爬取任务的理想工具。
autotab-starter - 将浏览器操作演示快速转换为可审计的代码
ChromeGithubPythonautotab开源项目自动化记录
autotab提供高效的方式,将浏览器操作演示快速转换为可审计的代码。本项目无需任何依赖,支持快速的浏览器自动化设置和操作记录。通过Chrome浏览器和Python虚拟环境,用户可以轻松配置凭据并使用命令行录制和播放自动化操作。autotab简化了自动化脚本的创建过程,使开发者能专注于核心功能开发。现已推出V1版本,加入Discord频道获取最新更新和功能预览。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号