近日,山东大学计算机科学与技术学院体系结构与嵌入式研究团队在键值存储系统设计研究中取得重大进展,在数据库领域顶级学术会议ACM SIGMOD 2024(International Conferenceon Management of Data)以长文形式发表论文“ChainKV: A Semantics-Aware Key-Value Store for Ethereum System”。计算机科学与技术学院硕士研究生陈泽豪是该论文的第一作者,申兆岩副教授担任本论文的通讯作者,论文的指导教师包括贾智平教授和蔡晓军副教授。
整体架构示意图
基于日志结构合并树(Log-Structure Merged tree, LSM-tree)的键值(key-value, KV)存储被以太坊(Ethereum)等区块链系统的存储引擎广泛采用。然而,键值存储技术与区块链技术的简单堆叠忽略了区块链语义,使得区块链存储面临较大的读写放大问题。此外,随着以太坊网络的扩展,规模巨大的数据量进一步加剧了存储负担。目前多数研究都集中在分片、数据归档、去中心化的分布式存储等方面减轻存储层的负担,而忽略了以太坊语义与存储引擎特性之间的不兼容性。本论文以Ethereum区块链平台为例,从数据语义的角度深入分析了当前区块链系统在运行过程中面临的I/O瓶颈。为解决上述瓶颈,本论文创新性地提出了基于区块链数据语义的键值存储引擎设计,它负责提取区块链协议层中的区块数据语义并将它们传递到底层的键值存储引擎中。在超过460M个区块的数据集下,实验结果表明本论文提出的方法可以在现有Ethereum系统的基础上分别提升1.99倍同步性能和4.20倍的交易处理速度。另外,本论文的系列工作“Block-LSM: An Ether-aware Block-ordered LSM-tree based Key-Value Storage Engine”已被IEEEICCD 2021(International Conference on Computer Design)收录并获选Best Paper Session。
ACM SIGMOD会议关注数据库管理系统和数据管理技术的原理、技术和应用,是数据库领域具有最高学术地位的国际性学术会议。IEEEICCD会议涵盖了计算机系统及其部件的研究、设计和实现等广泛主题,是体系结构领域的国际顶级会议之一。