test_vbtree/Readme.md
2019-08-28 19:22:23 +08:00

3.3 KiB
Raw Blame History

优先队列的一些理解与测试

优先队列(PriorityQueue)

最经典的就是Heap的应用, 效率也相当高, 当时操作仅限Put Pop. 无法实现Rank, Index等操作, 很多时候结构使用局限性较大. 甚至会出现一些每次需要Index, Rank的时候, 先Copy一个数组, Sort(排序一次), 通过数组Index. 数据量非常小的情景下, 实则怎么操作都没什么大问题. 量巨大的时候, 效率异常低下. 所以以下是我曾经为了优先队列的一些研究.


  • SkipList

跳表是一个随机化的数据结构可以被看做二叉树的一个变种它在性能上和红黑树AVL树不相上下但是跳表的原理非常简单目前在Redis和LeveIDB中都有用到。 它采用随机技术决定链表中哪些节点应增加向前指针以及在该节点中应增加多少个指针。跳表结构的头节点需有足够的指针域,以满足可能构造最大级数的需要,而尾节点不需要指针域。 采用这种随机技术跳表中的搜索、插入、删除操作的时间均为O(logn)然而最坏情况下时间复杂性却变成O(n)。相比之下,在一个有序数组或链表中进行插入/删除操作的时间为O(n)最坏情况下为O(n)。

  • 这里更正以下, 我个人认为跳表的效率远不如红黑树,AVL, 而且有大量测试都验证不如. 如果有异议可以纠正我错误.

  • Size Balance Tree

简称SBT 可以从链接山查看具体介绍, 拥有与跳表一样的Rank, Select(Index), 等属性, 在并行上处理不如跳表, 平衡树put,remove的操作都涉及范围内的旋转与调整, 需要锁树, 但是链表, 可以只锁相邻节点. 达到高效的并行处理.

  • 通过各种语言和测试, 并不像论文所述, 并不优于AVL 和 RBTree. 感觉有夸大的嫌疑. 如果有异议可以纠正我错误.

  • Vague Balance Tree

简称[VBT] 这个树是我根据宽度平衡的一些构想并实现, 我在这个树结构的时候完全不知道SBT的存在(知道我不会写了). 通过大量的结果测试写出课根据一个平衡因子作旋转, 具体以后再写. 实测性能不输RBTree(红黑), AVLTree, SBT SkipList并且有 SBT等同的属性. 在一些特殊倾斜的数据集会略输.


rm -f bin/main
g++ -std=c++17 -Wall -Wextra -g -O2 -Wno-unused-parameter -Wno-unused-function -Iinclude -Llib src/sbt.h src/vbtree.h src/main.cpp -o bin/main
基于5000000数据量的测试
vec.dat 加载...

case: 1
792 ns/op
end RBTree Case <Put> Benchmark
基于5000000数据量的测试
vec.dat 加载...

case: 1_1
747 ns/op
end RBTree Case <Get> Benchmark
基于5000000数据量的测试
vec.dat 加载...

case: 2
688 ns/op
end VBTree Case <Put> Benchmark
基于5000000数据量的测试
vec.dat 加载...

case: 2_1
706 ns/op
end VBTree Case <Get> Benchmark
基于5000000数据量的测试
vec.dat 加载...

case: 3
1029 ns/op
end SBT Case <Put> Benchmark
基于5000000数据量的测试
vec.dat 加载...

case: 3_1
675 ns/op
end SBT Case <find(Get)> Benchmark
基于5000000数据量的测试
vec.dat 加载...

case: 4
1455 ns/op
end SkipList Case <insert(Put)> Benchmark
基于5000000数据量的测试
vec.dat 加载...

case: 4_1
1451 ns/op
end SkipList Case <search(Get)> Benchmark