项目介绍:fake-useragent
fake-useragent 是一个 Python 库,旨在提供一种便捷的方式生成浏览器的用户代理字符串(user-agent strings)。该项目以真实世界的数据数据库为基础,允许开发者在其程序中模拟不同的浏览器请求,从而提高应用的灵活性和多样性。
功能特点
- 预下载数据:用户代理数据提前从 user-agents.net 下载,并被打包在项目中使用。
- 支持最新和次新的浏览器版本:该项目支持当前最新的浏览器版本以及一个次新的版本。
- 本地获取用户代理信息:能够本地获取桌面和移动端的用户代理字符串。
- 支持 Python 3.x:完全支持 Python 3 版本的开发环境。
安装指南
用户只需运行以下命令来安装 fake-useragent:
pip install fake-useragent
或者在有多个 Python/pip 版本的情况下,可以使用 pip3
:
pip3 install fake-useragent
基本使用方法
下面展示了一些简单的使用示例,更高级的用法还可以参考 README 文件中的其他章节:
from fake_useragent import UserAgent
ua = UserAgent()
# 获取一个随机的浏览器用户代理字符串
print(ua.random)
# 获取特定浏览器的用户代理字符串
print(ua.chrome)
print(ua.google)
print(ua['google chrome'])
print(ua.firefox)
print(ua.ff)
print(ua.safari)
高级功能
自 v1.2.0 版起,fake-useragent 提供了一些额外的高级特性:
-
自定义浏览器列表:通过
browsers
参数指定用户代理字符串来自的浏览器列表,例如仅从 Edge 和 Chrome 获取:ua = UserAgent(browsers=['edge', 'chrome']) ua.random
-
指定操作系统:通过
os
参数指定用户代理用于的操作系统,例如仅从 Linux 获取:ua = UserAgent(os='linux') ua.random
-
指定平台类型:通过
platforms
参数来挑选平台类型,如仅获取移动设备的用户代理:ua = UserAgent(platforms='mobile') ua.random
-
版本过滤:通过
min_version
参数设置获取更高版本的用户代理字符串,指定最小版本为 120.0:ua = UserAgent(min_version=120.0) ua.random
用户代理 Python 字典
自 v1.3.0 版起,可以通过提供的方法获取完整的 Python 字典格式的用户代理信息,而不仅仅是字符串:
ua.getRandom
ua.getFirefox
ua.getChrome
ua.getSafari
ua.getEdge
请注意,这些属性可能在未来的版本中发生变化。
可能遇到的问题
若遇到问题,请确保使用的是最新版本,可以通过以下命令更新:
pip install --upgrade fake-useragent
开发者指南
- 用户代理数据:数据以 JSONlines 格式存储在项目的
src/fake_useragent/data
目录中。 - 虚拟环境:建议使用 Python 的虚拟环境来安装 Pip 包。
- 本地安装和测试:提供了相关脚本用于本地安装调试和测试代码的工具。
fake-useragent 是一个简单易用、功能强大的工具,用于管理浏览器用户代理数据,它通过提供随机的、特定的用户代理字符串帮助开发者在网络请求中隐藏真实信息,有效提升应用的对抗性与兼容性。