Apache Kyuubi (Incubating)

单位: 网易数帆

开源类型: 开源产品

Apache Kyuubi (Incubating)是一个 Thrift JDBC/ODBC 服务,目前对接了 Apache Spark 计算框架,支持多租户和分布式等特性,可以满足企业内诸如 ETL、BI 报表等应用。可以为企业级数据湖探索提供标准化的接口,赋予用户调动整个数据湖生态数据的能力,使得用户能够像处理普通数据一样处理大数据。当前主要围绕各类主流计算框架,打造一个面向 Serverless SQL on Lakehouse 的服务。 通过 Kyuubi 预置的 Engine 模块,用户无需理解 Spark 逻辑,门槛极低,用户只需通过 JDBC 及 SQL 操作数据专注自身业务开发即可,资源弹性伸缩,0运维。支持资源管理器,Engine 生命周期,Spark 动态资源分配3级不同粒度全方位的资源弹性策略;支持 YARN/Kubernetes同时调度,保障历史作业安全迁移上云;Spark 自适应查询引擎(AQE)及 Kyuubi AQE plus,提供澎湃动力。 支持 Spark 所有官方数据源及第三方数据源;支持 Spark DSv2 元数据管理,直观进行数据湖构建及管理;支持 Apache Iceberg/Hudi, DeltaLake 等主流数据湖框架,一个接口一个引擎一份数据,提供统一的分析查询、数据摄取、数据湖管理平台。