Python SEO 分析器
这是一个SEO工具,用于分析网站结构、爬取网站、统计网站正文中的词语数量,并对任何技术性SEO问题发出警告。
需要Python 3.6+、BeautifulSoup4和urllib3。
安装
PIP
pip3 install pyseoanalyzer
Docker
docker run sethblack/python-seo-analyzer [参数 ...]
命令行使用
如果不使用网站地图运行,它将从主页开始爬取。
seoanalyze http://www.domain.com/
或者你可以指定网站地图的路径来初始化要扫描的URL列表。
seoanalyze http://www.domain.com/ --sitemap path/to/sitemap.xml
可以生成HTML格式的分析输出,而不是json。
seoanalyze http://www.domain.com/ --output-format html
API
analyze
函数返回一个包含爬取结果的字典。
from seoanalyzer import analyze
output = analyze(site, sitemap)
print(output)
为了分析标题标签(h1-h6)和其他额外的标签,可以向analyze
函数传递以下选项
from seoanalyzer import analyze
output = analyze(site, sitemap, analyze_headings=True, analyze_extra_tags=True)
print(output)
默认情况下,analyze
函数也会分析所有现有的内部链接,这可能会耗费较长时间。
可以通过向analyze
函数传递以下选项来更改此默认行为,只分析提供的URL
from seoanalyzer import analyze
output = analyze(site, sitemap, follow_links=False)
print(output)
另外,你也可以在seoanalyzer文件夹中以脚本方式运行分析。
python -m seoanalyzer https://www.sethserver.com/ -f html > results.html
注意事项
如果在命令行或通过Python API遇到requests.exceptions.SSLError
,请尝试使用:
而不是