近日,KaiwuDB 与中国人民大学相助的论文 FOSS: A Self-Learned Doctor for Query Optimizer 被数据库领域顶会The 40th IEEE International Conference on Data Engineering (ICDE 2024) 录用。论文中提出了具备自学习、自诊断能力的盘问优化器 FOSS,推动了基于 AI 算法的学习型盘问优化技术立异生长。KaiwuDB 高级研发工程师、人大信息学院博士孙路明为配相助者。
ICDE 是电气与电子工程师协会(IEEE)举办的旗舰集会,与 SIGMOD、VLDB 并称数据库三大顶会,也是中国盘算机学会 ( CCF ) 推荐的 A 类国际集会,主要聚焦设计、构建、治理和评估高级数据密集型系统和应用等研究问题,在国际上享有盛誉并具有广泛的学术影响力。此次在荷兰召开的ICDE 2024大会,吸引到北京大学、清华大学、中国人民大学、浙江大学、MIT、斯坦福等高校及全球知名科技企业参会,配合探讨数据库、数据处理领域的先进技术问题。
近年来,数据库研究人员提出了多个基于 AI 算法的学习型盘问优化器,它们或者通过自下而上的方法重新学习构建盘问计划,或者通过提示(Hint)引导或者限制古板优化器的执行计划生成历程。虽然这些要领取得了一些乐成,但它们却面临训练效率低下、计划搜索空间有限等方面的挑战。
而本篇论文提出的 FOSS —— 基于深度强化学习的盘问优化新框架,与引导古板优化器行为的黑盒要领差别,FOSS 是一个白盒要领,通过优化古板盘问优化器生成的计划,更好地利用专家优化知识。其行为类似一个诊疗盘问计划的医生,它从古板优化器生成的原始计划开始优化,发明其中的性能问题,通过系列优化行动逐步革新计划中的次优节点。别的, FOSS 还接纳了差池称的收益模型来评估两个计划之间的性能差别。为了提高 FOSS 的训练效率,我们将 FOSS 与古板优化器集成以形成一个模拟情况。利用该模拟情况,FOSS 可以自动快速生成大宗高质量的模拟经验,然后从这些经验中学习以提高其优化能力。论文在 Join Order Benchmark, TPC-DS 和 Stack Overflow 等多组数据集和负载上评估了 FOSS 的性能。实验结果标明:FOSS 在模型收敛速度、盘问优化效果上优于现有学习型盘问优化器,与 PostgreSQL 默认盘问优化器相比,更是获得了最高 8.33 倍的加速效果。通过引入该技术,数据库盘问性能、响应时间及用户体验或将有效提升,适用于 OLAP、HTAP 等数据密集型场景的盘问需求。
作为业内首款漫衍式、多模融合、支持原生AI 的数据库产品,KaiwuDB 恒久致力于为 AIoT 等重点场景提供更富厚的数据运管能力和更卓越的数据库性能,力求不绝在 SQL 优化、数据库自治等重点技术上实现突破。未来也将始终坚持以先进技术打磨产品,加速学术研究与工业应用融合,为中国数据库技术立异生长、数据处理效能提升等方面孝敬新思路,为政企客户同伴提供高性能、高可用、易运维的数据效劳,助力工业数字化升级与应用立异。