考虑使用此方法时有一些注意事项

显示全部楼层 · 2023-11-26 12:00:13

它仅适用于副本（不适用于常规插入）使用清单是有问题的，因为无法保证文件的顺序表只能有一个排序键（不支持交错样式）排序列应为 NOT NULL 并且表应 100% 排序（或为空）新行的排序顺序高于现有行，包括标记为删除的行。使用 RA3 节点进行独立计算和存储扩展 2019 年， Amazon 为 Redshift 引入了 RA3 节点。他们使用大型 SSD 进行本地缓存，并结合自动数据驱逐、数据预取和其他数据管理技术。使用 RA3 节点，您可以分离计算和存储。您可以根据计算需求扩展集群，从而降低总体分析成本。 RA3节点背后的基本思想是使用S3来存储所有永久数据并使用本地磁盘进行缓存。

您可以按需从 S3 获取数据。此外，Redshift 还可以识别经常使用的数据（即热数据），并将其保留在本地以加快计算速度。您可以通过AWS管理控制台创建RA3节点集群。使用 Amazon Redshift Spectrum 处理不 电子邮件营销列表 常用的数据 Amazon Redshift 推出时具有颠覆性的定价。为了比较成本，我们考虑了存储 1TB 数据一年的价格（美元/TB/年）。由于 ds2.8xlarge 节点的 3 年承诺，价格降至 934 美元/TB/年。这个价格点在数据仓库领域是闻所未闻的。 Amazon Redshift 客户的平均数据量每年都会增加一倍。事实上，这就是为什么关注性能改进很重要的原因之一——因为随着数据量的增长，管理性能成为一个更大的挑战。

在某些时候，将所有这些数据存储在 Amazon Redshift 中的成本变得令人望而却步。“永远”保留多年的数据历史可能会变得昂贵。由于监管原因，删除数据可能不是一种选择。 Amazon Redshift 价格取决于您的集群大小。换句话说，计算和存储是耦合的。即使您可能不需要 vCPU 的额外计算能力，您也必须不断添加存储节点。然而，由于在 Amazon Redshift 上存储数据的成本较低，因此常见的初始行为是将所有历史原始数据存储在 Redshift 中。但数据量正在增长。您可能还想使用更快但更昂贵的密集计算节点。许多公司不想做出超过一年期限的资本承诺。输入 Amazon Redshift Spectrum。