Ip2region 是什么
Ip2region 是一个离线IP地址定位库和IP定位数据管理框架,查询效率达到微秒级别,为众多主流编程语言提供了 xdb
数据生成和查询客户端实现。
Ip2region 特性
1、IP 数据管理框架
xdb
支持亿级别的 IP 数据段行数,默认的 region 信息格式固定为:国家|区域|省份|城市|ISP
,缺失的地域信息默认为0。
region 信息支持完全自定义,例如:你可以在 region 中添加特定业务需求的数据,如GPS信息、国际统一地域信息编码、邮编等。这意味着你可以完全利用 ip2region 来管理自己的 IP 定位数据。
2、数据去重和压缩
xdb
格式生成程序会自动去重和压缩部分数据,默认的全部 IP 数据生成的 ip2region.xdb 数据库大小为 11MiB,随着数据详细度的增加,数据库大小也会逐渐增大。
3、极速查询响应
即使是完全基于 xdb
文件的查询,单次查询响应时间也在十微秒级别,可通过以下两种方式开启内存加速查询:
vIndex
索引缓存:使用固定的512KiB
内存空间缓存 vector index 数据,减少一次 IO 磁盘操作,保持平均查询效率稳定在10-20微秒之间。xdb
整个文件缓存:将整个xdb
文件全部加载到内存,内存占用等同于xdb
文件大小,无磁盘 IO 操作,保持微秒级别的查询效率。
xdb
数据查询
API 介绍、使用文档和测试程序请参考对应 searcher
查询客户端下的 ReadMe 介绍,全部查询 binding 实现情况如下:
完成情况 | 状态 | 编程语言 | 描述 | 贡献者 |
---|---|---|---|---|
:white_check_mark: | 已完成 | golang | golang xdb 查询客户端实现 | Lion |
:white_check_mark: | 已完成 | php | php xdb 查询客户端实现 | Lion |
:white_check_mark: | 已完成 | java | java xdb 查询客户端实现 | Lion |
:white_check_mark: | 已完成 | lua | 纯 lua xdb 查询客户端实现 | Lion |
:white_check_mark: | 已完成 | c | ANSC c xdb 查询客户端实现 | Lion |
:white_check_mark: | 已完成 | lua_c | lua c 扩展 xdb 查询客户端实现 | Lion |
:white_check_mark: | 已完成 | rust | rust xdb 查询客户端实现 | gongzhengyang |
:white_check_mark: | 已完成 | python | python xdb 查询客户端实现 | 厉害的花花 |
:white_check_mark: | 已完成 | nodejs | nodejs xdb 查询客户端实现 | Wu Jian Ping |
:white_check_mark: | 已完成 | csharp | csharp xdb 查询客户端实现 | Alen Lee |
:white_check_mark: | 已完成 | erlang | erlang xdb 查询客户端实现 | leihua996 |
待开始 | php_ext | php c 扩展 xdb 查询客户端实现 | 待确定 | |
:white_check_mark: | 已完成 | nginx | nginx 扩展 xdb 查询客户端实现 | Wu Jian Ping |
:white_check_mark: | 已完成 | C++ | C++ xdb 查询客户端实现 | Yunbin Liu |
以下工具链实现由社区开发者通过第三方仓库贡献:
完成情况 | 状态 | 编程语言 | 描述 | 贡献者 |
---|---|---|---|---|
:white_check_mark: | 已完成 | ruby-ip2region | ruby xdb 查询客户端实现 | jicheng1014 |
:white_check_mark: | 已完成 | Ip2regionTool | ip2region数据转换工具 | orestonce |
xdb
数据生成
API 介绍、使用文档和测试程序请参考如下 maker
生成程序下的 ReadMe 文档:
完成情况 | 状态 | 编程语言 | 描述 | 贡献者 |
---|---|---|---|---|
:white_check_mark: | 已完成 | golang | golang xdb 生成程序实现 | Lion |
:white_check_mark: | 已完成 | java | java xdb 生成程序实现 | Lion |
待开始 | c | ANSC c xdb 生成程序实现 | Lion | |
:white_check_mark: | 已完成 | python | python xdb 生成程序实现 | leolin49 |
:white_check_mark: | 已完成 | csharp | csharp xdb 生成程序实现 | Alan Lee |
:white_check_mark: | 已完成 | rust | rust xdb 生成程序实现 | KevinWang |
:white_check_mark: | 已完成 | C++ | C++ xdb 生成程序实现 | Yunbin Liu |
xdb
数据更新
ip2region 旨在研究 IP 数据的存储和快速查询的设计和实现,并没有原始 IP 数据的支撑,也不会有商用版本。
本项目自带的 ./data/ip.merge.txt
原始数据已经很久没有更新,也不会再更新。对于数据精度和更新频率要求很高的使用场景,建议购买第三方商用数据。你可以使用如下几种方式来尝试自己更新数据:
手动编辑更新
你可以基于 ip2region 自带的 ./data/ip.merge.txt
原始 IP 数据,使用 ip2region 提供的编辑工具来自行修改。目前数据源有如下几种方式:
- ip2region 社区提供的数据(请参考页面底部的公众号关注社区通知)
- ip2region Github/Gitee 中带有
[数据源补充]
标签的 Issue - 其他自定义数据:例如客户提供的数据,或者通过 GPS 和 WIFI 定位得到的数据,或者来自其他平台的合法合规的数据
原始 IP 数据编辑工具使用方法请参考如下的 maker
生成程序下的 ReadMe 文档:
是否完成 | 状态 | 编程语言 | 描述 | 贡献者 |
---|---|---|---|---|
:white_check_mark: | 已完成 | golang | golang 原始 IP 数据编辑器 | Lion |
待开始 | java | java 原始 IP 数据编辑器 | Lion | |
:white_check_mark: | 已完成 | C++ | C++ 原始 IP 数据编辑器 | Yunbin Liu |
检测自动更新
如果你想通过自己的 API 或数据源来更新数据,你可以参考以下视频分享的 基于检测算法
的更新算法来自己编写一个更新程序:
相关备注
1、并发查询必读
xdb 整个缓存的查询都是并发安全的,基于文件的查询都不是并发安全的实现。不同进程/线程/协程需要通过创建不同的查询对象来安全使用。在并发量很大的情况下,基于文件查询的方式可能会导致打开文件数过多的错误,请修改内核的最大允许打开文件数(fs.file-max=一个更高的值),或者将整个xdb加载到内存进行安全并发使用。
2、技术资源分享
- xdb 数据结构分析:"ip2region xdb 数据结构和查询过程详解"
- xdb 查询过程分析:"ip2region xdb 数据结构和查询过程详解"
- xdb 生成过程分析:"ip2region xdb 二进制数据生成过程详解"
- xdb 数据更新方法:"ip2region 数据更新和 xdb 数据编辑器的使用"
3、技术信息博客
请先关注微信公众号 lionsoul-org (狮子的魂)