考虑使用此方法时有一些注意事项

[复制链接]
查看316 | 回复0 | 2023-11-26 12:00:13 | 显示全部楼层 |阅读模式
它仅适用于副本(不适用于常规插入) 使用清单是有问题的,因为无法保证文件的顺序 表只能有一个排序键(不支持交错样式) 排序列应为 NOT NULL 并且表应 100% 排序(或为空) 新行的排序顺序高于现有行,包括标记为删除的行。 使用 RA3 节点进行独立计算和存储扩展 2019 年,  Amazon 为 Redshift 引入了 RA3 节点。他们使用大型 SSD 进行本地缓存,并结合自动数据驱逐、数据预取和其他数据管理技术。使用 RA3 节点,您可以分离计算和存储。您可以根据计算需求扩展集群,从而降低总体分析成本。 RA3节点背后的基本思想是使用S3来存储所有永久数据并使用本地磁盘进行缓存。

您可以按需从 S3 获取数据。此外,Redshift 还可以识别经常使用的数据(即热数据),并将其保留在本地以加快计算速度。您可以通过AWS管理控制台创建RA3节点集群。 使用 Amazon Redshift Spectrum 处理不 电子邮件营销列表 常用的数据 Amazon Redshift 推出时具有颠覆性的定价。为了比较成本,我们考虑了存储 1TB 数据一年的价格(美元/TB/年)。由于 ds2.8xlarge 节点的 3 年承诺,价格降至 934 美元/TB/年。这个价格点在数据仓库领域是闻所未闻的。 Amazon Redshift 客户的平均数据量每年都会增加一倍。事实上,这就是为什么关注性能改进很重要的原因之一——因为随着数据量的增长,管理性能成为一个更大的挑战。



在某些时候,将所有这些数据存储在 Amazon Redshift 中的成本变得令人望而却步。“永远”保留多年的数据历史可能会变得昂贵。由于监管原因,删除数据可能不是一种选择。 Amazon Redshift 价格取决于您的集群大小。换句话说,计算和存储是耦合的。即使您可能不需要 vCPU 的额外计算能力,您也必须不断添加存储节点。 然而,由于在 Amazon Redshift 上存储数据的成本较低,因此常见的初始行为是将所有历史原始数据存储在 Redshift 中。但数据量正在增长。您可能还想使用更快但更昂贵的密集计算节点。许多公司不想做出超过一年期限的资本承诺。 输入 Amazon Redshift Spectrum。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则