GitHub 创新图谱
本仓库包含了自 2020 年起按季度和经济体汇总的 GitHub 公开活动结构化数据文件。
通过提供 GitHub 创新图谱等产品,我们希望为可能受益于全球软件开发活动数据的研究和公共政策提供信息。我们欢迎开发者、数据分析师、研究人员、政策制定者以及所有其他感兴趣的利益相关者探索数据、发现洞见并创建可视化等。
GitHub 创新图谱提供以下领域的数据:
更多信息请参阅数据表。
探索创新图谱数据
要概览数据集,请查看 GitHub 创新图谱网站上的图表和表格。
要更深入地探索数据并进行自己的分析,欢迎 fork 本仓库,使用您选择的探索性数据分析工具探索结构化数据文件,并在我们的讨论页面分享您的发现。
局限性
GitHub 创新图谱数据集包含 (1) 公开活动 (2) 在 GitHub 上 (3) 按经济体汇总 (4) 按季度统计的数据。因此,该数据集不适用于理解:
- 私有活动;
- GitHub 之外的活动;
- 比经济体更细粒度的地理级别;或
- 比季度更细粒度的时间级别。
此外,在 GitHub 上开发者较少的经济体(通常与经济体人口相关)在该数据集中的相关数据也较少。
有关局限性的更多信息,请参阅数据表。
创新图谱数据的代表性
包含多少个经济体?
我们努力发布尽可能多的关于 GitHub 上公开活动的数据。然而,开发者数量因经济体而异,在某些情况下,出于对开发者隐私的谨慎考虑,我们不会发布在特定季度内相关活动的唯一开发者少于 100 人的经济体的具体统计数据。您可以在数据表中找到有关我们方法的更多信息。
下面的热力图显示了每个数据文件按季度报告的经济体数量:
按季度按数据文件的经济体数量
您也可以在data/representativeness_data 目录中找到此热力图的 CSV 文件。
包含哪些经济体?
我们使用比联合国认可的成员国更广泛的定义来汇总经济体的 GitHub 活动。例如,AQ 报告了驻扎在南极洲的开发者的活动。下面的热力图报告了每个经济体按季度的数据文件数量:
您也可以在data/representativeness_data 目录中找到此热力图的 CSV 文件。
许可证
本项目根据 CC0-1.0 许可发布。
维护者
请参阅 CODEOWNERS
支持
请参阅 SUPPORT