数据仓库

摘自 PostgreSQL Wiki
跳转至导航跳转至搜索

数据仓库特性

  • 磁盘位图索引(有人愿意完成 GP 补丁吗?)
  • 处理 COPY 中的错误
  • 并行查询
  • 窗口函数
  • 合并
  • 并行索引构建

请注意,这里与 Simon Riggs 的开发项目 规划之间有许多重叠之处。

磁盘位图索引

处理 COPY 中的错误

由 pg_loader 处理,优先级较低

并行查询

主要有两种类型:单节点和多节点并行性,要获得一些提高 SeqScan 性能的功能相当容易,但要获得一些应用到执行器更深层次的功能则比较困难。困难在于

  • 计划程序更改
  • 如何管理查询从节点池
  • 由哪个从节点访问数据的哪些部分来决定

值得注意的是,在大多数多节点并行架构中,最后两点根本不是问题,因为每个节点一个查询从节点,并且每个节点仅针对已静态分区到它的数据进行操作,通常使用哈希分区方案。

窗口函数

SQL:2003 特性

合并

SQL:2003 特性

并行索引构建

Josh Berkus:不确定这将如何确切地起作用,但它可以为 Oracle 带来显著提速

幻灯片

OVERVIEW OF "DATA WAREHOUSING WITH POSTGRESQL" 由 Gabriele Bartolini 在 2009 年 PGDay.EU 上展示(数据仓库@PostgreSQL