Project Icon

buntdb

Go语言实现的高性能内存键值存储

BuntDB是一个Go语言实现的内存键值存储库。它具备数据持久化、ACID事务、并发控制等特性,支持自定义索引和地理空间数据。BuntDB适用于对速度要求高的项目,提供简单API、多种索引类型和数据过期等功能。作为嵌入式数据库,BuntDB为Go应用提供高性能的数据存储选择。

BuntDB
Godoc LICENSE

BuntDB是一个用纯Go语言编写的低级内存键值存储。它能持久化到磁盘,符合ACID原则,并使用锁机制支持多个读取器和单个写入器。它支持自定义索引和地理空间数据。对于需要可靠数据库并且偏好速度而非数据大小的项目来说,它是理想的选择。

特性

入门

安装

要开始使用BuntDB,请安装Go并运行go get

$ go get -u github.com/tidwall/buntdb

这将获取该库。

打开数据库

BuntDB的主要对象是DB。要打开或创建数据库,使用buntdb.Open()函数:

package main

import (
	"log"

	"github.com/tidwall/buntdb"
)

func main() {
	// 打开data.db文件。如果不存在则创建。
	db, err := buntdb.Open("data.db")
	if err != nil {
		log.Fatal(err)
	}
	defer db.Close()

	...
}

也可以通过使用:memory:作为文件路径来打开一个不会持久化到磁盘的数据库。

buntdb.Open(":memory:") // 打开一个不会持久化到磁盘的文件。

事务

所有读写操作都必须在事务内进行。BuntDB一次只能打开一个写事务,但可以同时有多个并发的读事务。每个事务都维护一个稳定的数据库视图。换句话说,一旦事务开始,该事务的数据就不能被其他事务更改。

事务在一个暴露Tx对象的函数中运行,该对象代表事务状态。在事务内部,所有数据库操作都应该使用这个对象执行。在事务内部时,你不应该访问原始的DB对象。这样做可能会产生副作用,比如阻塞你的应用程序。

当事务失败时,它会回滚,并撤销在该事务期间对数据库所做的所有更改。有一个单一的返回值可用于关闭事务。对于读写事务,以这种方式返回错误将强制事务回滚。当读写事务成功时,所有更改都会持久化到磁盘。

只读事务

当你不需要对数据进行更改时,应该使用只读事务。只读事务的优点是可以有多个并发运行。

err := db.View(func(tx *buntdb.Tx) error {
	...
	return nil
})

读写事务

当你需要对数据进行更改时,应该使用读写事务。一次只能有一个读写事务运行。所以确保在完成后尽快关闭它。

err := db.Update(func(tx *buntdb.Tx) error {
	...
	return nil
})

设置和获取键值对

要设置一个值,你必须打开一个读写事务:

err := db.Update(func(tx *buntdb.Tx) error {
	_, _, err := tx.Set("mykey", "myvalue", nil)
	return err
})

要获取值:

err := db.View(func(tx *buntdb.Tx) error {
	val, err := tx.Get("mykey")
	if err != nil{
		return err
	}
	fmt.Printf("值为 %s\n", val)
	return nil
})

获取不存在的值将导致ErrNotFound错误。

迭代

数据库中的所有键值对都按键排序。要迭代键:

err := db.View(func(tx *buntdb.Tx) error {
	err := tx.Ascend("", func(key, value string) bool {
		fmt.Printf("键: %s, 值: %s\n", key, value)
		return true // 继续迭代
	})
	return err
})

还有AscendGreaterOrEqualAscendLessThanAscendRangeAscendEqualDescendDescendLessOrEqualDescendGreaterThanDescendRangeDescendEqual。请查看文档以获取有关这些函数的更多信息。

自定义索引

最初,所有数据都存储在一个B树中,每个项目有一个键和一个值。所有这些项目都按键排序。这对于快速从键获取值或迭代键很有用。欢迎浏览B树实现

你还可以创建自定义索引,允许对值进行排序和迭代。自定义索引也使用B树,但它更灵活,因为它允许自定义排序。

例如,假设你想创建一个用于排序名字的索引:

db.CreateIndex("names", "*", buntdb.IndexString)

这将创建一个名为names的索引,用于存储和排序所有值。第二个参数是用于过滤键的模式。*通配符参数表示我们想接受所有键。IndexString是一个内置函数,对值执行不区分大小写的排序。

现在你可以添加各种名字:

db.Update(func(tx *buntdb.Tx) error {
	tx.Set("user:0:name", "tom", nil)
	tx.Set("user:1:name", "Randi", nil)
	tx.Set("user:2:name", "jane", nil)
	tx.Set("user:4:name", "Janet", nil)
	tx.Set("user:5:name", "Paula", nil)
	tx.Set("user:6:name", "peter", nil)
	tx.Set("user:7:name", "Terri", nil)
	return nil
})

最后你可以迭代索引:

db.View(func(tx *buntdb.Tx) error {
	tx.Ascend("names", func(key, val string) bool {
	fmt.Printf(buf, "%s %s\n", key, val)
		return true
	})
	return nil
})

输出应该是:

user:2:name jane
user:4:name Janet
user:5:name Paula
user:6:name peter
user:1:name Randi
user:7:name Terri
user:0:name tom

模式参数可以用来过滤键,像这样:

db.CreateIndex("names", "user:*", buntdb.IndexString)

现在只有键前缀为user:的项目会被添加到names索引中。

内置类型

除了IndexString,还有IndexIntIndexUintIndexFloat。 这些是用于索引的内置类型。你可以选择使用这些或创建自己的类型。

所以要创建一个按年龄键数字排序的索引,我们可以使用:

db.CreateIndex("ages", "user:*:age", buntdb.IndexInt)

然后添加值:

db.Update(func(tx *buntdb.Tx) error {
	tx.Set("user:0:age", "35", nil)
	tx.Set("user:1:age", "49", nil)
	tx.Set("user:2:age", "13", nil)
	tx.Set("user:4:age", "63", nil)
	tx.Set("user:5:age", "8", nil)
	tx.Set("user:6:age", "3", nil)
	tx.Set("user:7:age", "16", nil)
	return nil
})
db.View(func(tx *buntdb.Tx) error {
	tx.Ascend("ages", func(key, val string) bool {
	fmt.Printf(buf, "%s %s\n", key, val)
		return true
	})
	return nil
})

输出应该是:

user:6:age 3
user:5:age 8
user:2:age 13
user:7:age 16
user:0:age 35
user:1:age 49
user:4:age 63

空间索引

BuntDB通过在R树中存储矩形来支持空间索引。R树的组织方式类似于B树,两者都是平衡树。但是,R树特别之处在于它可以操作多维数据。这对于地理空间应用非常有用。

要创建空间索引,请使用CreateSpatialIndex函数:

db.CreateSpatialIndex("fleet", "fleet:*:pos", buntdb.IndexRect)

然后IndexRect是一个内置函数,它将矩形字符串转换为R树可以使用的格式。这个函数开箱即用很容易使用,但你可能会发现创建一个从不同格式渲染的自定义函数更好,比如Well-known textGeoJSON

要向fleet索引添加一些经纬度点:

db.Update(func(tx *buntdb.Tx) error {
	tx.Set("fleet:0:pos", "[-115.567 33.532]", nil)
	tx.Set("fleet:1:pos", "[-116.671 35.735]", nil)
	tx.Set("fleet:2:pos", "[-113.902 31.234]", nil)
	return nil
})

然后你可以在索引上运行Intersects函数:

db.View(func(tx *buntdb.Tx) error {
	tx.Intersects("fleet", "[-117 30],[-112 36]", func(key, val string) bool {
		...
		return true
	})
	return nil
})

这将获取所有三个位置。

k-最近邻

使用Nearby函数按照从近到远的顺序获取所有位置:

db.View(func(tx *buntdb.Tx) error {
	tx.Nearby("fleet", "[-113 33]", func(key, val string, dist float64) bool {
		...
		return true
	})
	return nil
})

空间括号语法

括号语法[-117 30],[-112 36]是BuntDB独有的,用于处理内置的矩形。但你不局限于这种语法。在CreateSpatialIndex期间你选择使用的任何Rect函数都将用于处理参数,在这种情况下是IndexRect

  • 2D矩形: [10 15],[20 25] 最小XY: "10x15", 最大XY: "20x25"

  • 3D矩形: [10 15 12],[20 25 18] 最小XYZ: "10x15x12", 最大XYZ: "20x25x18"

  • 2D点: [10 15] XY: "10x15"

  • 经纬度点: [-112.2693 33.5123] 纬度经度: "33.5123 -112.2693"

  • 经纬度边界框: [-112.26 33.51],[-112.18 33.67] 最小纬度经度: "33.51 -112.26", 最大纬度经度: "33.67 -112.18"

注意: 经度是Y轴且在左侧,纬度是X轴且在右侧。

你也可以用-inf+inf表示无穷大。 例如,你可能有以下点([X Y M]其中XY是一个点,M是时间戳):

[3 9 1]
[3 8 2]
[4 8 3]
[4 7 4]
[5 7 5]
[5 6 6]

然后你可以通过调用Intersects来搜索所有M在2-4之间的点。

tx.Intersects("points", "[-inf -inf 2],[+inf +inf 4]", func(key, val string) bool {
	println(val)
	return true
})

这将返回:

[3 8 2]
[4 8 3]
[4 7 4]

JSON 索引

可以在JSON文档中的单个字段上创建索引。BuntDB在底层使用GJSON

例如:

package main

import (
	"fmt"

	"github.com/tidwall/buntdb"
)

func main() {
	db, _ := buntdb.Open(":memory:")
	db.CreateIndex("last_name", "*", buntdb.IndexJSON("name.last"))
	db.CreateIndex("age", "*", buntdb.IndexJSON("age"))
	db.Update(func(tx *buntdb.Tx) error {
		tx.Set("1", `{"name":{"first":"Tom","last":"Johnson"},"age":38}`, nil)
		tx.Set("2", `{"name":{"first":"Janet","last":"Prichard"},"age":47}`, nil)
		tx.Set("3", `{"name":{"first":"Carol","last":"Anderson"},"age":52}`, nil)
		tx.Set("4", `{"name":{"first":"Alan","last":"Cooper"},"age":28}`, nil)
		return nil
	})
	db.View(func(tx *buntdb.Tx) error {
		fmt.Println("按姓氏排序")
		tx.Ascend("last_name", func(key, value string) bool {
			fmt.Printf("%s: %s\n", key, value)
			return true
		})
		fmt.Println("按年龄排序")
		tx.Ascend("age", func(key, value string) bool {
			fmt.Printf("%s: %s\n", key, value)
			return true
		})
		fmt.Println("按30-50岁年龄范围排序")
		tx.AscendRange("age", `{"age":30}`, `{"age":50}`, func(key, value string) bool {
			fmt.Printf("%s: %s\n", key, value)
			return true
		})
		return nil
	})
}

结果:

按姓氏排序
3: {"name":{"first":"Carol","last":"Anderson"},"age":52}
4: {"name":{"first":"Alan","last":"Cooper"},"age":28}
1: {"name":{"first":"Tom","last":"Johnson"},"age":38}
2: {"name":{"first":"Janet","last":"Prichard"},"age":47}

按年龄排序
4: {"name":{"first":"Alan","last":"Cooper"},"age":28}
1: {"name":{"first":"Tom","last":"Johnson"},"age":38}
2: {"name":{"first":"Janet","last":"Prichard"},"age":47}
3: {"name":{"first":"Carol","last":"Anderson"},"age":52}

按30-50岁年龄范围排序
1: {"name":{"first":"Tom","last":"Johnson"},"age":38}
2: {"name":{"first":"Janet","last":"Prichard"},"age":47}

多值索引

BuntDB可以在单个索引上连接多个值。 这类似于传统SQL数据库中的多列索引

在这个例子中,我们在"name.last"和"age"上创建一个多值索引:

db, _ := buntdb.Open(":memory:")
db.CreateIndex("last_name_age", "*", buntdb.IndexJSON("name.last"), buntdb.IndexJSON("age"))
db.Update(func(tx *buntdb.Tx) error {
	tx.Set("1", `{"name":{"first":"Tom","last":"Johnson"},"age":38}`, nil)
	tx.Set("2", `{"name":{"first":"Janet","last":"Prichard"},"age":47}`, nil)
	tx.Set("3", `{"name":{"first":"Carol","last":"Anderson"},"age":52}`, nil)
	tx.Set("4", `{"name":{"first":"Alan","last":"Cooper"},"age":28}`, nil)
	tx.Set("5", `{"name":{"first":"Sam","last":"Anderson"},"age":51}`, nil)
	tx.Set("6", `{"name":{"first":"Melinda","last":"Prichard"},"age":44}`, nil)
	return nil
})
db.View(func(tx *buntdb.Tx) error {
	tx.Ascend("last_name_age", func(key, value string) bool {
		fmt.Printf("%s: %s\n", key, value)
		return true
	})
	return nil
})

// 输出:
// 5: {"name":{"first":"Sam","last":"Anderson"},"age":51}
// 3: {"name":{"first":"Carol","last":"Anderson"},"age":52}
// 4: {"name":{"first":"Alan","last":"Cooper"},"age":28}
// 1: {"name":{"first":"Tom","last":"Johnson"},"age":38}
// 6: {"name":{"first":"Melinda","last":"Prichard"},"age":44}
// 2: {"name":{"first":"Janet","last":"Prichard"},"age":47}

降序索引

任何索引都可以通过用buntdb.Desc包装其less函数来降序排列。

db.CreateIndex("last_name_age", "*",
    buntdb.IndexJSON("name.last"),
    buntdb.Desc(buntdb.IndexJSON("age")),
)

这将创建一个多值索引,其中姓氏是升序,年龄是降序。

排序规则i18n索引

使用外部collate包,可以创建按指定语言排序的索引。这类似于传统数据库中的SQL COLLATE关键字

安装:

go get -u github.com/tidwall/collate

例如:

import "github.com/tidwall/collate"

// 用法语不区分大小写排序
db.CreateIndex("name", "*", collate.IndexString("FRENCH_CI"))

// 指定数字应该按数值排序("2" < "12")
// 并使用逗号表示小数点
db.CreateIndex("amount", "*", collate.IndexString("FRENCH_NUM"))

JSON索引也支持排序规则:

db.CreateIndex("last_name", "*", collate.IndexJSON("CHINESE_CI", "name.last"))

查看collate项目以获取更多信息。

数据过期

可以通过在Set函数中使用SetOptions对象来设置TTL来自动驱逐项目。

db.Update(func(tx *buntdb.Tx) error {
	tx.Set("mykey", "myval", &buntdb.SetOptions{Expires:true, TTL:time.Second})
	return nil
})

现在mykey将在一秒钟后自动删除。你可以通过使用相同的键/值再次设置值来移除TTL,但options参数设置为nil。

迭代时删除

BuntDB目前不支持在迭代过程中删除键。 作为解决方法,你需要在迭代器完成后删除键。

var delkeys []string
tx.AscendKeys("object:*", func(k, v string) bool {
	if someCondition(k) == true {
		delkeys = append(delkeys, k)
	}
	return true // 继续
})
for _, k := range delkeys {
	if _, err = tx.Delete(k); err != nil {
		return err
	}
}

仅追加文件

BuntDB使用AOF(仅追加文件),这是一个记录所有由Set()Delete()等操作引起的数据库更改的日志。

该文件的格式如下:

set key:1 value1
set key:2 value2
set key:1 value3
del key:2
...

当数据库再次打开时,它将回读aof文件并按确切顺序处理每个命令。 这个读取过程在数据库打开时只发生一次。 从那时起,该文件只会被追加。 正如你可能猜到的,这个日志文件会随着时间的推移变得很大。 有一个后台程序会在日志文件变得太大时自动缩小它。 还有一个Shrink()函数,它会重写aof文件,使其只包含数据库中的项目。 缩小操作不会锁定数据库,因此在缩小过程中可以继续进行读写事务。

持久性和fsync

默认情况下,BuntDB每秒钟在aof文件上执行一次fsync。这意味着可能会丢失最多一秒钟的数据。如果你需要更高的持久性,可以将可选的数据库配置设置Config.SyncPolicy设为Always

Config.SyncPolicy有以下选项:

  • Never - fsync由操作系统管理,较不安全
  • EverySecond - 每秒fsync一次,快速且更安全,这是默认设置
  • Always - 每次写入后fsync,非常持久,但较慢

配置

以下是一些可用于更改数据库各种行为的配置选项。

  • SyncPolicy 调整数据同步到磁盘的频率。该值可以是Never、EverySecond或Always。默认为EverySecond。
  • AutoShrinkPercentage 被后台进程用来在aof文件大小大于上次缩小后文件大小的百分比时触发aof文件的缩小。例如,如果此值为100,上次缩小过程生成了100MB的文件,那么新的aof文件必须达到200MB才会触发缩小。默认为100。
  • AutoShrinkMinSize 定义了在自动缩小可以发生之前aof文件的最小大小。默认为32MB。
  • AutoShrinkDisabled 关闭自动后台缩小。默认为false。

要更新配置,你应该调用ReadConfig,然后调用SetConfig。例如:

var config buntdb.Config
if err := db.ReadConfig(&config); err != nil {
    log.Fatal(err)
}
if err := db.SetConfig(config); err != nil {
    log.Fatal(err)
}

性能

BuntDB有多快?

这里是在Raft Store实现中使用BuntDB的一些基准测试示例。

你也可以从项目根目录运行标准Go基准测试工具:

go test --bench=.

BuntDB-基准测试

有一个专门的工具是为BuntDB基准测试而创建的。

以下是在MacBook Pro 15" 2.8 GHz Intel Core i7上运行基准测试的结果:

$ buntdb-benchmark -q
GET: 4609604.74 operations per second
SET: 248500.33 operations per second
ASCEND_100: 2268998.79 operations per second
ASCEND_200: 1178388.14 operations per second
ASCEND_400: 679134.20 operations per second
ASCEND_800: 348445.55 operations per second
DESCEND_100: 2313821.69 operations per second
DESCEND_200: 1292738.38 operations per second
DESCEND_400: 675258.76 operations per second
DESCEND_800: 337481.67 operations per second
SPATIAL_SET: 134824.60 operations per second
SPATIAL_INTERSECTS_100: 939491.47 operations per second
SPATIAL_INTERSECTS_200: 561590.40 operations per second
SPATIAL_INTERSECTS_400: 306951.15 operations per second
SPATIAL_INTERSECTS_800: 159673.91 operations per second

要安装这个工具:

go get github.com/tidwall/buntdb-benchmark

联系方式

Josh Baker @tidwall

许可证

BuntDB源代码可在MIT 许可证下使用。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号