🚀 简介
欢迎使用由Ultralytics更新和维护的Bing图像抓取工具。该存储库包含了原始代码(来自https://github.com/hardikvasa/google-images-download)的更新版本,使用户能够高效地从Bing抓取和下载图像,用于机器学习、数据分析或个人项目等各种应用。
🐳 Docker运行
详情请访问Docker GitHub存储库:google-images-download-by-docker
$ docker run -d -p 80:80 --name image_searcher saitamatechno/google_images_download:v1.0
📋 要求
要使用此软件,请确保您安装了Python 3.8或更高版本以及所有必要的依赖项。可以通过在终端中运行以下命令来安装依赖项:
$ pip install -r requirements.txt
requirements.txt
文件位于这里,其中包括selenium
等依赖项。
⚙️ 安装
要在您的机器上设置图像抓取器,请克隆此存储库并按以下方式安装依赖项:
$ git clone https://github.com/ultralytics/google-images-download
$ cd google-images-download
$ pip install -r requirements.txt
🖥️ 如何运行
按照以下步骤运行图像抓取器:
-
确保您的机器上安装了Google Chrome。如果没有,请从这里下载并安装。
-
从这里下载并更新与您的Chrome版本相对应的chromedriver。
-
执行脚本。使用
--url
参数从特定的Bing URL下载图像,或使用--search
参数进行Bing搜索词下载。默认情况下,图像将保存在./images
目录中。请注意,在下载过程中,任何导致错误的图像都会被跳过。
使用URL下载图像的示例用法:
$ python3 bing_scraper.py --url 'https://www.bing.com/images/search?q=flowers' --limit 10 --download --chromedriver /path/to/your/chromedriver
使用搜索词下载图像的示例用法:
$ python3 bing_scraper.py --search '蜜蜂在花朵上' --limit 10 --download --chromedriver /path/to/your/chromedriver
# 预期输出日志将显示下载过程和遇到的任何错误。
📜 引用项目
如需在您的作品中致谢使用本软件,请参考原始存储库,可在这里找到。
🤝 贡献
我们热烈欢迎社区的贡献。您的支持和贡献对于使这个开源软件变得更好是无价的。无论您发现了bug、有功能建议,还是想贡献代码,请查看贡献指南。此外,请花点时间填写我们的调查;您的反馈有助于我们不断改进。非常感谢🙏所有的贡献者!
🔏 许可证
我们提供两种类型的许可证以满足各种使用场景:
AGPL-3.0许可证
这种许可证非常适合从事非商业项目的个人或团队。它鼓励开放、协作以及知识和改进的共享。有关详细信息,请参阅许可证。
企业许可证
对于商业应用,企业许可证提供了一种解决方案,使您能够将Ultralytics软件集成到您的产品中,而不受AGPL-3.0的限制。这种许可证适用于AGPL-3.0的具体要求不适合的商业产品。如果您对企业解决方案感兴趣,请通过Ultralytics许可与我们联系以获取更多信息。
📬 联系方式
如果您遇到任何问题或有功能请求,请访问我们的GitHub问题页面。对于一般讨论、问题或与社区联系,请加入我们充满活力的Discord社区。