Parquet 中的 COPY 包含 SMALLINT
COPY 现在支持从 Parquet 格式文件加载到使用 SMALLINT 数据类型的列。有关更多信息,请参阅从列式数据格式中执行 COPY 操作。
2019 年 1 月 2 日
列式格式中的 COPY
COPY 现支持在 Amazon S3 上从使用 Parquet 和 ORC 列式数据格式的文件中进行加载。有关更多信息,请参阅从列式数据格式中执行 COPY 操作。
2018 年 5 月 17 日
SQA 的动态最大运行时
默认情况下,工作负载管理 (WLM) 现在根据集群的工作负载分析为短查询加速 (SQA) 最大运行时动态分配值。有关更多信息,请参阅 短查询的最大运行时间。
2018 年 5 月 17 日
STL_LOAD_COMMITS 中的新列
STL_LOAD_COMMITS 系统表有一个新列:file_format。
2018 年 5 月 10 日
STL_HASHJOIN 和其他系统日志表中的新列
STL_HASHJOIN 系统表有三个新列:hash_segment、hash_step 和 checksum。此外,checksum 已添加到 STL_MERGEJOIN、STL_NESTLOOP、STL_HASH、STL_SCAN、STL_SORT、STL_LIMIT 和 STL_PROJECT。
2018 年 5 月 17 日
STL_AGGR 中的新列
STL_AGGR 系统表有两个新列:resizes 和 flushable。
2018 年 4 月 19 日
REGEX 函数的新选项
对于 REGEXP_INSTR 和 REGEXP_SUBSTR 函数,您现在可以指定要使用的匹配项的出现次数以及是否执行区分大小写的匹配。REGEXP_INSTR 还您让您指定是否返回匹配项的第一个字符的位置,或匹配项结尾后第一个字符的位置。
2018 年 3 月 22 日
系统表中的新列
STL_COMMIT_STATS 系统表中添加了 tombstonedblocks、tossedblocks 和 batched_by 列。向 STV_SLICES 系统视图中添加了 localslice 列。
2018 年 3 月 22 日
在外部表中添加和删除列
ALTER TABLE 现在对 Amazon Redshift Spectrum 外部表支持 ADD COLUMN 和 DROP COLUMN。
2018 年 3 月 22 日
Redshift Spectrum 新 AWS 区域
Redshift Spectrum 现已在孟买和圣保罗区域推出。有关受支持的 区域的列表,请参阅Amazon Redshift Spectrum 区域。
2018 年 3 月 22 日
表限制增加为 20,000
最大表数现在对于 8xlarge 集群节点类型为 20000。对于 large 和 xlarge 节点类型,此限制为 9,900。有关更多信息,请参阅 限制和配额。
2018 年 3 月 13 日
Redshift Spectrum 支持 JSON 和 Ion
使用 Redshift Spectrum,您可以引用包含采用 JSON 或 Ion 数据格式的标量数据。有关更多信息,请参阅 CREATE EXTERNAL TABLE。
2018 年 2 月 26 日
适用于 Redshift Spectrum 的 IAM 角色串联
您可以串联 AWS Identity and Access Management (IAM) 角色,以便您的集群可以未附加到该集群的其他角色,包括属于其他 AWS 账户的角色。有关更多信息,请参阅 在 Amazon Redshift Spectrum 中链接 IAM 角色。
2018 年 2 月 1 日
ADD PARTITION 支持 IF NOT EXISTS
ALTER TABLE 的 ADD PARTITION 子句现在支持 IF NOT EXISTS 选项。有关更多信息,请参阅 ALTER TABLE。
2018 年 1 月 11 日
外部表的 DATE 数据
Redshift Spectrum 外部表现在支持 DATE 数据类型。有关更多信息,请参阅 CREATE EXTERNAL TABLE。
2018 年 1 月 11 日
Redshift Spectrum 新 AWS 区域
Redshift Spectrum 现已在新加坡、悉尼、首尔和法兰克福区域可用。有关受支持的 AWS 区域的列表,请参阅Amazon Redshift Spectrum 区域。
2017 年 11 月 16 日
Amazon Redshift 工作负载管理 (WLM) 中的短查询加速
短查询加速 (SQA) 让选定的短时查询优先于长时查询。SQA 在专用空间中执行短时查询,因此 SQA 查询不会被迫排在队列中的长时查询后面等待。使用 SQA,短时查询会更快地开始执行,用户会更快地看到结果。有关更多信息,请参阅 使用短查询加速。
2017 年 11 月 16 日
WLM 重新分配跳过的查询
Amazon Redshift 工作负载管理 (WLM) 现在将有资格的被跳过查询重新分配到新队列,而不是取消并重新启动该查询。当 WLM 重新分配查询时,它会将查询移动到新队列并继续执行,这将节省时间和系统资源。没有重新分配资格的被跳过查询将会重新启动或取消。有关更多信息,请参阅 WLM 查询队列跳过。
2017 年 11 月 16 日
用户的系统日志访问权限
在大多数对用户可见的系统日志表中,默认情况下,由其他用户生成的行对普通用户是不可见的。要允许普通用户查看用户可见表中的所有行 (包括由其他用户生成的行),请运行 ALTER USER 或 CREATE USER 并将 SYSLOG ACCESS 参数设置为 UNRESTRICTED。
2017 年 11 月 16 日
结果缓存
借助 结果缓存 ,当您运行查询时,Amazon Redshift 会缓存结果。当您再次运行查询时,Amazon Redshift 会检查有无查询结果的有效缓存副本。如果在结果缓存中找到匹配项,Amazon Redshift 会使用缓存的结果而不运行查询。默认情况下,结果缓存处于打开状态。要禁用结果缓存,请将 enable_result_cache_for_session 配置参数设置为 off。
2017 年 11 月 16 日
列元数据函数
PG_GET_COLS 和 PG_GET_LATE_BINDING_VIEW_COLS 返回 Amazon Redshift 表、视图和后期绑定视图的列元数据。
2017 年 11 月 16 日
针对 CTAS 的 WLM 队列跳过
Amazon Redshift 工作负载管理 (WLM) 现在支持针对 CREATE TABLE AS (CTAS) 语句以及只读查询(例如 SELECT 语句)的查询队列跳过。有关更多信息,请参阅 WLM 查询队列跳过。
2017 年 10 月 19 日
Amazon Redshift Spectrum 清单文件
当您创建 Redshift Spectrum 外部表时,可以指定一个清单文件,用以列出数据文件在 Amazon S3 上的位置。有关更多信息,请参阅 CREATE EXTERNAL TABLE。
2017 年 10 月 19 日
Amazon Redshift Spectrum 新 AWS 区域
Redshift Spectrum 现已在欧洲 (爱尔兰) 和亚太 (东京) 区域推出。有关受支持的 AWS 区域的列表,请参阅Amazon Redshift Spectrum 限制。
2017 年 10 月 19 日
Amazon Redshift Spectrum 添加的文件格式
现在,您可以创建基于 Regex、OpenCSV 和 Avro 数据文件格式的 Redshift Spectrum 外部表。有关更多信息,请参阅 CREATE EXTERNAL TABLE。
2017 年 10 月 5 日
Amazon Redshift Spectrum 外部表的 Pseudocolumns
您可以在 Redshift Spectrum 外部表中选择 $path 和 $size pseudocolumns 来查看被引用数据文件在 Amazon S3 中的位置和大小。有关更多信息,请参阅 Pseudocolumns。
2017 年 10 月 5 日
用于验证 JSON 的函数
您可以使用 IS_VALID_JSON 和 IS_VALID_JSON_ARRAY 函数来检查 JSON 格式设置是否有效。其他 JSON 函数现在有可选 null_if_invalid 参数。
2017 年 10 月 5 日
LISTAGG DISTINCT
您可以将 DISTINCT 子句与 LISTAGG 聚合函数以及 LISTAGG 开窗函数一起使用,以便在串联之前从指定的表达式中消除重复的值。
2017 年 10 月 5 日
以大写形式查看列名称
要以大写形式查看 SELECT 结果中的列名称,您可以将 describe_field_name_in_uppercase 配置参数设置为 true。
2017 年 10 月 5 日
跳过外部表中的标头行
您可以将 skip.header.line.count 命令中的 CREATE EXTERNAL TABLE 属性设置为在 Redshift Spectrum 数据文件的开头跳过标头行。
2017 年 10 月 5 日
扫描行数
WLM 查询监控规则使用 scan_row_count 指标返回扫描步骤中的行数。行计数是在筛选标记为删除的行 (虚影行) 之前和应用用户定义的查询筛选之前发出的行的总数。有关更多信息,请参阅 预置的 Amazon Redshift 的查询监控指标。
2017 年 9 月 21 日
SQL 用户定义的函数
标量 SQL 用户定义的函数 (UDF) 纳入了一个 SQL SELECT 子句,该子句在此函数被调用并返回单个值时执行。有关更多信息,请参阅 标量 SQL UDF。
2017 年 8 月 31 日
后期绑定视图
后期绑定视图未绑定到基础数据库对象,例如表和用户定义的函数。因此,视图与其引用的对象之间不存在依赖关系。即使引用的对象不存在,您也可以创建视图。由于不存在依赖关系,删除或更改引用的对象不会影响视图。在查询视图之前,Amazon Redshift 不会检查依赖关系。要创建后期绑定视图,请使用 CREATE VIEW 语句指定 WITH NO SCHEMA BINDING 子句。有关更多信息,请参阅 CREATE VIEW。
2017 年 8 月 31 日
OCTET_LENGTH 函数
OCTET_LENGTH 将以字节数形式返回指定字符串的长度。
2017 年 8 月 18 日
支持 ORC 和 Grok 文件类型
Amazon Redshift Spectrum 现在支持 Redshift Spectrum 数据文件的 ORC 和 Grok 数据格式。有关更多信息,请参阅 Amazon Redshift Spectrum 中用于查询的数据文件。
2017 年 8 月 18 日
现在支持 RegexSerDe
Amazon Redshift Spectrum 现在支持 RegexSerDe 数据格式。有关更多信息,请参阅 Amazon Redshift Spectrum 中用于查询的数据文件。
2017 年 7 月 19 日
向 SVV_TABLES 和 SVV_COLUMNS 中添加了新列
向 domain_name 中添加了 remarks 和 SVV_COLUMNS 列。向 SVV_TABLES 中添加了备注列。
2017 年 7 月 19 日
SVV_TABLES 和 SVV_COLUMNS 系统视图
SVV_TABLES 和 SVV_COLUMNS 系统视图提供有关本地和外部表及视图的列信息和其他详情。
2017 年 7 月 7 日
Amazon Redshift Spectrum 与 Amazon EMR Hive 元数据存储配合使用时,不再需要 VPC
Redshift Spectrum 取消了以下要求:使用 Amazon EMR Hive 元数据存储时,Amazon Redshift 集群和 Amazon EMR 集群必须位于同一个 VPC 及同一个子网中。有关更多信息,请参阅 在 Amazon Redshift Spectrum 中使用外部目录。
2017 年 7 月 7 日
用 UNLOAD 创建较小的文件
预设情况下,UNLOAD 会在 Amazon S3 中创建多个文件,每个文件的最大大小为 6.2 GB。要创建较小的文件,请在使用 UNLOAD 命令时指定 MAXFILESIZE。您可以将最大文件大小指定为 5 MB 到 6.2 GB。有关更多信息,请参阅 UNLOAD。
2017 年 7 月 7 日
TABLE PROPERTIES
现在,您可以为 CREATE EXTERNAL TABLE 或 ALTER TABLE 设置 TABLE PROPERTIES numRows 参数以更新表统计数据,从而反映表中的行数。
2017 年 6 月 6 日
ANALYZE PREDICATE COLUMNS
为了节省时间和集群资源,您可以选择仅分析可能用作谓词的列。使用 PREDICATE COLUMNS 子句运行 ANALYZE 时,分析操作仅包括已在联接、筛选条件或 group by 子句中使用的列,或用作排序键或分配键的列。有关更多信息,请参阅 分析表。
2017 年 5 月 25 日
适用于 Amazon Redshift Spectrum 的 IAM 策略
要仅使用 Redshift Spectrum 授予对 Amazon S3 存储桶的访问权限,您可以包括允许访问用户代理 AWS
Redshift/Spectrum 的条件。有关更多信息,请参阅 适用于 Amazon Redshift Spectrum 的 IAM 策略。
2017 年 5 月 25 日
Amazon Redshift Spectrum 递归扫描
Redshift Spectrum 现在扫描子文件夹以及 Amazon S3 中所指定文件夹内的文件。有关更多信息,请参阅 Redshift Spectrum 的外部表。
2017 年 5 月 25 日
查询监控规则
使用 WLM 查询监控规则,您可以为 WLM 查询定义基于指标的性能边界,并指定查询超出这些边界时需要采取的操作—log、hop 或 abort。您将在工作负载管理 (WLM) 配置中定义查询监控规则。有关更多信息,请参阅 WLM 查询监控规则。
2017 年 4 月 21 日
Amazon Redshift Spectrum
使用 Redshift Spectrum,您可以在 Amazon S3 中高效地查询和检索文件中的数据,而无需将数据加载到表中。Redshift Spectrum 查询针对大型数据集执行速度非常快,因为 Redshift Spectrum 直接在 Amazon S3 中扫描数据文件。很多处理发生在 Amazon Redshift Spectrum 层中,而大多数数据位于 Amazon S3 中。多个集群可同时查询 Amazon S3 上的同一数据集,而无需为每个集群复制数据。有关更多信息,请参阅Amazon Redshift Spectrum。
2017 年 4 月 19 日
支持 Redshift Spectrum 的新系统表
已添加以下新的系统视图来支持 Redshift Spectrum:
SVL_S3QUERY
SVL_S3QUERY_SUMMARY
SVV_EXTERNAL_COLUMNS
SVV_EXTERNAL_DATABASES
SVV_EXTERNAL_PARTITIONS
SVV_EXTERNAL_TABLES
PG_EXTERNAL_SCHEMA
2017 年 4 月 19 日
APPROXIMATE PERCENTILE_DISC 聚合函数
现在可以使用 APPROXIMATE PERCENTILE_DISC 聚合函数。
2017 年 4 月 4 日
使用 KMS 的服务器端加密
您现在可以使用 AWS Key Management Service 密钥进行服务器端加密 (SSE-KMS),将数据卸载到 Amazon S3。此外,COPY 现在可以从 Amazon S3 透明加载 KMS 加密的数据文件。有关更多信息,请参阅 UNLOAD。
2017 年 2 月 9 日
新的授权语法
您现在可以使用 IAM_ROLE、MASTER_SYMMETRIC_KEY、ACCESS_KEY_ID、SECRET_ACCESS_KEY 和 SESSION_TOKEN 参数为 COPY、UNLOAD 和 CREATE LIBRARY 命令提供授权和访问信息。新的授权语法为 CREDENTIALS 参数提供了单一字符串参数,是更具灵活性的方案。有关更多信息,请参阅 授权参数。
2017 年 2 月 9 日
Schema 上限提高
每集群现在最多可以创建 9,900 个 schemas。有关更多信息,请参阅 CREATE SCHEMA。
2017 年 2 月 9 日
默认表编码
CREATE TABLE 和 ALTER TABLE 现在向大多数新列分配 LZO 压缩编码。默认情况下,会向定义为排序键的列、定义为 BOOLEAN、REAL 或 DOUBLE PRECISION 数据类型的列以及临时表分配 RAW 编码。有关更多信息,请参阅 ENCODE。
2017 年 2 月 6 日
ZSTD 压缩编码
Amazon Redshift 现在支持 ZSTD 列压缩编码。
2017 年 1 月 19 日
PERCENTILE_CONT 和 MEDIAN 聚合函数
PERCENTILE_CONT 和 MEDIAN 现在可作为聚合函数和窗口函数使用。
2017 年 1 月 19 日
用户定义的函数 (UDF) 用户日志记录
您可以使用 Python 日志记录模块在 UDF 中创建用户定义的错误和警告消息。执行查询后,您可以查询 SVL_UDF_LOG 系统视图以检索记录的消息。有关用户定义消息的更多信息,请参阅在 Python UDF 中记录错误和警告
2016 年 12 月 8 日
ANALYZE COMPRESSION 估计的压缩量
ANALYZE COMPRESSION 命令现在可报告每一列的磁盘空间预估压缩百分比。有关更多信息,请参阅 ANALYZE COMPRESSION。
2016 年 11 月 10 日
连接限制
您现在可以设置允许用户同时打开的数据库连接的数量限制。您也可以限制数据库并行连接数量。有关更多信息,请参阅CREATE USER和CREATE DATABASE。
2016 年 11 月 10 日
COPY 排序顺序增强
如果您以排序键顺序加载数据,COPY 现在可以自动将新行添加到表中已排序区域。有关启用此增强功能的具体要求,请参阅 按排序键顺序加载数据
2016 年 11 月 10 日
压缩 CTAS
CREATE TABLE AS (CTAS) 现在可以根据列的数据类型自动为新表分配压缩编码。有关更多信息,请参阅 继承列和表属性。
2016 年 10 月 28 日
有时区数据类型的时间戳
Amazon Redshift 现在支持使用时区 (TIMESTAMPTZ) 数据类型的时间戳。此外,已添加几个新功能以支持新的数据类型。有关更多信息,请参阅 日期和时间函数。
2016 年 9 月 29 日
分析阈值
为了减少 ANALYZE 操作的处理时间并提高整体系统性能,在自上次运行 ANALYZE 命令以来更改的行数百分比低于 analyze_threshold_percent 参数指定的分析阈值的情况下,Amazon Redshift 将跳过对表的分析。默认情况下,analyze_threshold_percent 为 10。
2016 年 8 月 9 日
新 STL_RESTARTED_SESSIONS 系统表
在 Amazon Redshift 重新启动会话时, STL_RESTARTED_SESSIONS 将记录新的进程 ID (PID) 和旧 PID。
2016 年 8 月 9 日
更新了“日期和时间函数”文档
添加了函数概要(其中包含指向 日期和时间函数 的链接),并更新了函数参考以确保一致性。
2016 年 6 月 24 日
STL_CONNECTION_LOG 中新增了一些列
STL_CONNECTION_LOG 系统表有两个用于跟踪 SSL 连接的新列。如果您定期向 Amazon Redshift 表加载审核日志,则需要向目标表添加以下新列:sslcompression 和 sslexpansion。
2016 年 5 月 5 日
MD5 哈希密码
通过提供密码和用户名的 MD5 哈希字符串,您可为 CREATE USER 或 ALTER USER 命令指定密码。
2016 年 4 月 21 日
STV_TBL_PERM 中的新列
backup 系统视图中的 STV_TBL_PERM 列指示表是否包含在集群快照中。有关更多信息,请参阅 BACKUP。
2016 年 4 月 21 日
无备份表
对于不会包含关键数据的表(如暂存表),您可在 CREATE TABLE 或 CREATE TABLE AS 语句中指定 BACKUP NO 来防止 Amazon Redshift 在自动或手动快照中包含表。使用无备份表可节省创建快照并从快照还原时的处理时间,并可减少在 Amazon S3 上占用的存储空间。
2016 年 4 月 7 日
VACUUM 删除阈值
默认情况下,VACUUM 命令现在将回收空间,以使至少 95% 的剩余行不会被标记为删除。因此,与回收 100% 的已删除行相比,VACUUM 在删除阶段所耗的时间通常少得多。您可以在运行 VACUUM 命令时包含 TO threshold PERCENT 参数,从而更改某个表的默认阈值。
2016 年 4 月 7 日
SVV_TRANSACTIONS 系统表
SVV_TRANSACTIONS 系统视图记录当前锁定到数据库中的表的事务的相关信息。
2016 年 4 月 7 日
使用 IAM 角色访问其他 AWS 资源
要在您的集群和其他 AWS 资源(如 Amazon S3、DynamoDB、Amazon EMR 或 Amazon EC2)之间移动数据,您的集群必须具有访问相应资源和执行所需操作的权限。作为为 COPY、UNLOAD 或 CREATE LIBRARY 命令提供访问密钥对的更安全的替代方法,您现在可以指定您的集群用于身份验证和授权的 IAM 角色。有关更多信息,请参阅 基于角色的访问控制。
2016 年 3 月 29 日
VACUUM 排序阈值
现在,当任意表中有 95% 的行已有序时,VACUUM 命令会为该表跳过排序阶段。您可以在运行 VACUUM 命令时包含 TO threshold PERCENT 参数,从而更改某个表的默认排序阈值。
2016 年 17 月 3 日
STL_CONNECTION_LOG 中新增了一些列
STL_CONNECTION_LOG 系统表新增了三列内容。如果您定期向 Amazon Redshift 表加载审核日志,则需要向目标表添加以下新列:sslversion、sslcipher 和 mtu。
2016 年 17 月 3 日
使用 bzip2 压缩执行 UNLOAD
您现在可以选择使用 bzip2 压缩执行 UNLOAD。
2016 年 2 月 8 日
ALTER TABLE APPEND
ALTER TABLE APPEND 通过从现有的源表移动数据,将行附加到目标表。由于是移动数据而不是复制数据,因此相比类似的 CREATE TABLE AS 或 INSERT INTO 操作,ALTER TABLE APPEND 通常要快得多。
2016 年 2 月 8 日
WLM 查询队列跳过
如果工作负载管理 (WLM) 由于 WLM 超时而取消一个只读查询(例如一个 SELECT 语句),WLM 会尝试将查询路由到下一个匹配的队列。有关更多信息,请参阅WLM 查询队列跳过。
2016 年 1 月 7 日
ALTER DEFAULT PRIVILEGES
您可以使用 ALTER DEFAULT PRIVILEGES 命令定义要应用到由指定用户在未来创建的对象的一组默认访问权限。
2015 年 12 月 10 日
bzip2 文件压缩
COPY 命令支持从使用 bzip2 压缩的文件加载数据。
2015 年 12 月 10 日
NULLS FIRST 和 NULLS LAST
您可以指定 ORDER BY 子句是将 NULLS 放在结果集的第一个还是最后一个。有关更多信息,请参阅ORDER BY 子句和窗口函数语法摘要。
2015 年 11 月 19 日
CREATE LIBRARY 的 REGION 关键字
如果包含 UDF 库文件的 Amazon S3 存储桶与您的 Amazon Redshift 集群不在同一个 AWS 区域内,您可以使用 REGION 选项指定数据所在的区域。有关更多信息,请参阅 CREATE LIBRARY。
2015 年 11 月 19 日
用户定义的标量函数 (UDF)
现在,您可以创建自定义的用户定义标量函数,以实施 Python 2.7 标准库中的 Amazon Redshift 支持的模块或您自己的基于 Python 编程语言的自定义 UDF 提供的非 SQL 处理功能。有关更多信息,请参阅 Amazon Redshift 中用户定义的函数。
2015 年 9 月 11 日
WLM 配置中的动态属性
WLM 配置参数现在支持动态应用一些属性。其他属性保持静态更改,并需要重启关联的集群以便能应用配置更改。有关更多信息,请参阅WLM 动态和静态配置属性和实施工作负载管理。
2015 年 8 月 3 日
LISTAGG 函数
LISTAGG 函数 和 LISTAGG 窗口函数 返回通过串联一组列值而创建的字符串。
2015 年 7 月 30 日
淘汰的参数
max_cursor_result_set_size 配置参数已淘汰。光标结果集的大小受到集群的节点类型的限制。有关更多信息,请参阅 游标约束。
2015 年 7 月 24 日
修订了 COPY 命令的文档
COPY 命令的参考内容进行了大范围的修订,以让材料更加友好、易读。
2015 年 7 月 15 日
从 Avro 格式 COPY
COPY 命令支持从 Amazon S3、Amazon EMR 上的数据文件以及从使用 SSH 的远程主机上加载 Avro 格式的数据。有关更多信息,请参阅AVRO和从 Avro 中复制的示例。
2015 年 7 月 8 日
STV_STARTUP_RECOVERY_STATE
STV_STARTUP_RECOVERY_STATE 系统表记录在执行集群重新启动操作期间临时锁定的表的状态。Amazon Redshift 对于正在处理以解决集群重新启动后过时的事务的表,会临时锁定这些表。
2015 年 5 月 25 日
排名函数的可选 ORDER BY
对于部分开窗排名函数,现在可以使用可选的 ORDER BY 子句。有关更多信息,请参阅 CUME_DIST 开窗函数、DENSE_RANK 窗口函数、RANK 窗口函数、NTILE 窗口函数、PERCENT_RANK 开窗函数 和 ROW_NUMBER 窗口函数。
2015 年 5 月 25 日
交错排序键
交错排序键对于排序键中的每个列给予相同的权重。使用交错排序键而不是默认的复合键可以显著提升对辅助排序列使用限制性谓词的查询的性能,对于大型表尤其如此。当使用多个查询对同一个表中的不同列进行筛选时,交错排序还能提升整体性能。有关更多信息,请参阅排序键和CREATE TABLE。
2015 年 5 月 11 日
修订的优化查询性能主题
查询性能优化 已经扩展,加入了用于分析查询性能的新查询和更多示例。此外,此主题经过修订,内容更清晰、完整。设计查询的 Amazon Redshift 最佳实践 介绍了更多有关如何编写查询以改进性能的信息。
2015 年 3 月 23 日
SVL_QUERY_QUEUE_INFO
SVL_QUERY_QUEUE_INFO 视图详细总结了查询在 WLM 查询队列或提交队列中所用的时间。
2015 年 2 月 19 日
SVV_TABLE_INFO
您可以使用 SVV_TABLE_INFO 视图诊断和解决会影响查询性能的表设计问题,包括与压缩编码、分配键、排序方式、数据分配偏斜、表大小和统计数据相关的问题。
2015 年 2 月 19 日
UNLOAD 使用服务器端文件加密
UNLOAD 命令现在自动使用 Amazon S3 服务器端加密 (SSE) 来加密所有卸载数据文件。服务器端加密又增加了一层安全性,而且对性能只有少许或几乎没有影响。
2014 年 10 月 31 日
CUME_DIST 开窗函数
CUME_DIST 开窗函数 计算某个窗口或分区中某个值的累积分布。
2014 年 10 月 31 日
MONTHS_BETWEEN 函数
MONTHS_BETWEEN 函数 确定两个日期之间相隔的月数。
2014 年 10 月 31 日
NEXT_DAY 函数
NEXT_DAY 函数 返回比给定日期晚的指定日期的第一个实例的日期。
2014 年 10 月 31 日
PERCENT_RANK 开窗函数
PERCENT_RANK 开窗函数 计算某个给定行的百分比排名。
2014 年 10 月 31 日
RATIO_TO_REPORT 开窗函数
RATIO_TO_REPORT 开窗函数 计算某个窗口或分区中一个值与值的总和的比率。
2014 年 10 月 31 日
TRANSLATE 函数
TRANSLATE 函数 使用指定的替换字符替换指定表达式中出现的所有指定字符。
2014 年 10 月 31 日
NVL2 函数
NVL2 函数 根据指定表达式的结果是 NULL 或 NOT NULL,返回这两个值中的一个。
2014 年 10 月 16 日
MEDIAN 开窗函数
MEDIAN 开窗函数 计算某个窗口或分区中值的范围的中间值。
2014 年 10 月 16 日
GRANT 和 REVOKE 命令的 ON ALL TABLES IN SCHEMA schema_name 子句
GRANT 和 REVOKE 命令已更新为可以使用 ON ALL TABLES IN SCHEMA schema_name 子句。使用此子句,您可以使用一个命令更改 schema 中所有表的权限。
2014 年 10 月 16 日
DROP SCHEMA、DROP TABLE、DROP USER 和 DROP VIEW 命令的 IF EXISTS 子句
DROP SCHEMA、DROP TABLE、DROP USER 和 DROP VIEW 命令已经更新为可以使用 IF EXISTS 子句。如果指定的对象不存在,使用此子句可让命令不执行任何更改并且返回消息,而不是以错误终止命名。
2014 年 10 月 16 日
CREATE SCHEMA 和 CREATE TABLE 命令的 IF NOT EXISTS 子句
CREATE SCHEMA 和 CREATE TABLE 命令已经更新为可以使用 IF NOT EXISTS 子句。如果指定的对象已经存在,使用此子句可让命令不执行任何更改并且返回消息,而不是以错误终止命名。
2014 年 10 月 16 日
COPY 支持 UTF-16 编码
COPY 命令现在支持从使用 UTF-16 编码以及 UTF-8 编码的数据文件加载。有关更多信息,请参阅 ENCODING。
2014 年 9 月 29 日
新的工作负载管理教程
教程:配置手动工作负载管理 (WLM) 队列 为您介绍了配置工作负载管理 (WLM) 队列以改进查询处理和分配查询的流程。
2014 年 9 月 25 日
AES 128 位加密
当使用 Amazon S3 客户端加密从数据文件加载数据时,COPY 命令现在支持 AES 128 位加密和 AES 256 位加密。有关更多信息,请参阅 从 Amazon S3 中加载加密的数据文件。
2014 年 9 月 29 日
PG_LAST_UNLOAD_COUNT 函数
PG_LAST_UNLOAD_COUNT 函数返回在最近的 UNLOAD 操作中处理的行数。有关更多信息,请参阅 PG_LAST_UNLOAD_COUNT。
2014 年 9 月 15 日
新的查询故障排除部分
查询故障排除 提供了快速参考,帮助您识别和解决一些在使用 Amazon Redshift 查询时可能会遇到的最常见问题和最严重问题。
2014 年 7 月 7 日
新的加载数据教程
教程:从 Amazon S3 加载数据 为您演练从 Amazon S3 存储桶中的数据文件将数据加载到您的 Amazon Redshift 数据库表中的完整过程。
2014 年 7 月 1 日
PERCENTILE_CONT 开窗函数
PERCENTILE_CONT 开窗函数 是一个假定连续分布模型的逆分布函数。该函数具有一个百分比值和一个排序规范,并返回一个在有关排序规范的给定百分比值范围内的内插值。
2014 年 6 月 30 日
PERCENTILE_DISC 开窗函数
PERCENTILE_DISC 开窗函数 是一个假定离散分布模型的逆分布函数。该函数具有一个百分位数值和一个排序规范,并从集合中返回一个元素。
2014 年 6 月 30 日
GREATEST 和 LEAST 函数
GREATEST 和 LEAST 函数 函数从表达式列表返回最大或最小值。
2014 年 6 月 30 日
跨区域 COPY
COPY 命令支持从与 Amazon Redshift 集群位于不同区域的 Amazon S3 存储桶或 Amazon DynamoDB 表加载数据。有关更多信息,请参阅 COPY 命令参考中的REGION。
2014 年 6 月 30 日
“最佳实践”已扩充
Amazon Redshift 最佳实践已经扩充、重新组织,并移至导航层次结构中的顶级,以便读者更容易发现。
2014 年 5 月 28 日
UNLOAD 到单个文件
UNLOAD 命令通过添加 PARALLEL OFF 选项,可以依次将表数据卸载到 Amazon S3 上的一个文件。如果数据的大小超过文件大小上限 (6.2 GB),UNLOAD 将创建更多文件。
2014 年 5 月 6 日
REGEXP 函数
REGEXP_COUNT、REGEXP_INSTR 和 REGEXP_REPLACE 函数根据正则表达式模式匹配处理字符串。
2014 年 5 月 6 日
从 Amazon EMR 执行 COPY 操作
COPY 命令支持直接从 Amazon EMR 集群加载数据。有关更多信息,请参阅 从 Amazon EMR 中加载数据。
2014 年 4 月 18 日
WLM 并发限制增加
现在,您可以将工作负载管理 (WLM) 配置在用户定义的查询队列中并发运行最多 50 个查询。这一增加为用户提供了更大的灵活性,可以通过修改 WLM 配置来管理系统性能。有关更多信息,请参阅实施手动 WLM。
2014 年 4 月 18 日
用于管理光标大小的新配置参数
max_cursor_result_set_size 配置参数定义了大型查询的每个光标结果集可以返回的数据大小(以兆字节为单位)。此参数值也会影响集群的并发光标数量,让您能够配置用于增加或减少集群光标数量的值。
有关更多信息,请参阅本指南中的DECLARE和《Amazon Redshift 管理指南》中的配置游标结果集的最大大小。
2014 年 3 月 28 日
从 JSON 格式数据执行的 COPY 操作
COPY 命令支持从 Amazon S3 上的数据文件以及从使用 SSH 的远程主机上加载 JSON 格式的数据。有关更多信息,请参阅 从 JSON 格式数据执行的 COPY 操作 使用说明。
2014 年 3 月 25 日
新系统表 STL_PLAN_INFO
STL_PLAN_INFO 表补充了 EXPLAIN 命令,作为另一种查看查询计划的方式。
2014 年 3 月 25 日
新函数 REGEXP_SUBSTR
通过搜索正则表达式模式,REGEXP_SUBSTR 函数 返回从字符串提取的字符。
2014 年 3 月 25 日
STL_COMMIT_STATS 的新列
STL_COMMIT_STATS 表添加了两个新的列:numxids 和 oldestxid。
2014 年 3 月 6 日
从 SSH 执行 COPY 支持 gzip 和 lzop
当通过 SSH 连接加载数据时,COPY 命令支持 gzip 和 lzop 压缩。
2014 年 2 月 13 日
新函数
ROW_NUMBER 窗口函数 返回当前行的数字。STRTOL 函数 将指定基数的数字的字符串表达式转换为相当的整数值。PG_CANCEL_BACKEND 和 PG_TERMINATE_BACKEND 让用户可以取消查询和会话连接。已经添加 LAST_DAY 函数来实现对 Oracle 的兼容性。
2014 年 2 月 13 日
新系统表
STL_COMMIT_STATS 系统表提供与提交性能相关的指标,包括提交的各个阶段的时间以及提交的数据块的数量。
2014 年 2 月 13 日
FETCH 单一节点集群
对单一节点集群使用光标时,可以使用 FETCH 命令提取的最大行数是 1000。单一节点集群不支持使用 FETCH FORWARD ALL。
2014 年 2 月 13 日
DS_DIST_ALL_INNER 重新分配策略
EXPLAIN 计划输出中的 DS_DIST_ALL_INNER 指明整个内部表已重新分配到一个切片,因为外部表使用 DISTSTYLE ALL。有关更多信息,请参阅联接类型示例和评估查询计划。
2014 年 1 月 13 日
查询的新系统表
Amazon Redshift 已添加新的系统表,客户可以使用它们来评估查询的执行情况,以进行优化和进行问题排查。有关更多信息,请参阅 SVL_COMPILE, STL_SCAN, STL_RETURN, STL_SAVESTL_ALERT_EVENT_LOG。
2014 年 1 月 13 日
单节点光标
单一节点集群现在支持光标。单一节点集群一次能打开两个光标,结果集最大为 32 GB。在单一节点集群上,我们建议将 ODBC 缓存大小参数设置为 1000。有关更多信息,请参阅 DECLARE。
2013 年 12 月 13 日
ALL 分配方式
ALL 分配可以显著缩短特定类型查询的执行时间。当表使用 ALL 分配方式时,该表的一个副本将分配到每个节点。因为该表有效地与其他每个表并置,因此在执行查询期间无需重新分配。ALL 分配并不适用于所有表,因为它会增加存储要求和加载时间。有关更多信息,请参阅 用于优化查询的数据分配。
2013 年 11 月 11 日
从远程主机执行 COPY
除了从 Amazon S3 上的数据文件和 Amazon DynamoDB 表加载表之外,COPY 命令还可以从 Amazon EMR 集群、Amazon EC2 实例和其他使用 SSH 连接的远程主机加载文本数据。Amazon Redshift 使用多个同时的 SSH 连接来并行读取和加载数据。有关更多信息,请参阅 从远程主机中加载数据。
2013 年 11 月 11 日
使用的 WLM 内存百分比
您可以在工作负载管理 (WLM) 配置中为每个查询指定具体的内存百分比,来实现工作负载的平衡。有关更多信息,请参阅 实施手动 WLM。
2013 年 11 月 11 日
APPROXIMATE COUNT(DISTINCT)
使用 APPROXIMATE COUNT(DISTINCT) 的查询执行速度更快,相对错误率大约为 2%。APPROXIMATE COUNT(DISTINCT) 行数使用 HyperLogLog 算法。有关更多信息,请参见 COUNT 函数。
2013 年 11 月 11 日
用于检索最近的查询详细信息的新 SQL 函数
四个新的 SQL 函数可以检索有关最近查询和 COPY 命令的详细信息。这四个新函数让查询系统日志表更简单易行,而且在很多时候,可以无需访问系统表即提供必要的详细信息。有关更多信息,请参阅 PG_BACKEND_PID, PG_LAST_COPY_ID, PG_LAST_COPY_COUNT, PG_LAST_QUERY_ID。
2013 年 11 月 1 日
UNLOAD 的 MANIFEST 选项
UNLOAD 命令的 MANIFEST 选项可以补充 COPY 命令的 MANIFEST 选项。使用带 MANIFEST 选项的 UNLOAD 命令可自动创建一个清单文件,该文件显式列出了卸载操作在 Amazon S3 上创建的数据文件。然后您可以在 COPY 命令中使用该清单文件来加载数据。有关更多信息,请参阅将数据卸载到 Amazon S3和UNLOAD 示例。
2013 年 11 月 1 日
COPY 的 MANIFEST 选项
您可以使用带 MANIFEST 选项的 COPY 命令来显式列出将要从 Amazon S3 加载的数据文件。
2013 年 10 月 18 日
用于对查询进行问题排查的系统表
为用于对查询进行问题排查的系统表添加了文档。用于日志记录的 STL 视图 部分闲置包含以下系统表的文档:STL_AGGR、STL_BCAST、STL_DIST、STL_DELETE、STL_HASH、STL_HASHJOIN、STL_INSERT、STL_LIMIT、STL_MERGE、STL_MERGEJOIN、STL_NESTLOOP、STL_PARSE、STL_PROJECT、STL_SCAN、STL_SORT、STL_UNIQUE 和 STL_WINDOW。
2013 年 10 月 3 日
CONVERT_TIMEZONE 函数
CONVERT_TIMEZONE 函数 将一个时区的时间戳转换为另一个时区的时间戳,包含用于自动调整为夏令时的选项。
2013 年 10 月 3 日
SPLIT_PART 函数
SPLIT_PART 函数 用指定的分隔符拆分字符串,并返回指定位置的部分内容。
2013 年 10 月 3 日
STL_USERLOG 系统表
STL_USERLOG 记录创建、修改或删除数据库用户时发生的更改的详细信息。
2013 年 10 月 3 日
LZO 列编码和 LZOP 文件压缩。
LZO 列压缩编码兼具极高的压缩率和良好的性能。从 Amazon S3 进行 COPY 支持加载使用 LZOP 压缩进行压缩的文件。
2013 年 9 月 19 日
JSON、正则表达式和游标
添加了对分析 JSON 字符串的支持,使用正则表达式的模式匹配,以及使用光标通过 ODBC 连接检索大型数据集。有关更多信息,请参阅JSON 函数、模式匹配条件和DECLARE。
2013 年 9 月 10 日
COPY 的 ACCEPTINVCHAR 选项
通过指定带 ACCEPTINVCHAR 选项的 COPY 命令,您可以成功地加载包含无效的 UTF-8 字符的数据。
2013 年 8 月 29 日
COPY 的 CSV 选项
COPY 命令现在支持从 CSV 格式的输入文件加载。
2013 年 8 月 9 日
CRC32
CRC32 函数 执行循环冗余检验。
2013 年 8 月 9 日
WLM 通配符
工作负载管理 (WLM) 支持在向队列添加用户组和查询组时使用通配符。有关更多信息,请参阅 通配符。
2013 年 8 月 1 日
WLM 超时
要限制允许查询在给定 WLM 队列中停留的时间,您可以为每个队列设置 WLM 超时。有关更多信息,请参阅 WLM 超时。
2013 年 8 月 1 日
新的 COPY 复制选项“auto”和“epochsecs”
COPY 命令可执行自动的日期和时间格式识别。新的时间格式“epochsecs”和“epochmillisecs”可让 COPY 加载纪元格式的数据。
2013 年 7 月 25 日
CONVERT_TIMEZONE 函数
CONVERT_TIMEZONE 函数 将一个时区的时间戳转换为另一个时区的时间戳。
2013 年 7 月 25 日
FUNC_SHA1 函数
FUNC_SHA1 函数 使用 SHA1 算法转换字符串。
2013 年 7 月 15 日
max_execution_time
要限制允许使用的队列时间,您可以在配置 WLM 期间设置 max_execution_time 参数。有关更多信息,请参阅 修改 WLM 配置。
2013 年 7 月 22 日
四字节的 UTF-8 字符
VARCHAR 数据类型现在支持四字节的 UTF-8 字符。不支持 5 个字节或更长的 UTF-8 字符。有关更多信息,请参阅 存储和范围。
2013 年 7 月 18 日
SVL_QERROR
SVL_QERROR 系统视图已淘汰。
2013 年 7 月 12 日
文件历史记录进行了修订
“文档历史记录”页面现在显示文档的更新日期。
2013 年 7 月 12 日
STL_UNLOAD_LOG
STL_UNLOAD_LOG 记录卸载操作的详细信息。
2013 年 7 月 5 日
JDBC 提取大小参数
为了避免在使用 JDBC 检索大型数据集时出现客户端内存不足错误,您可通过设置 JDBC 提取大小参数来使您的客户端能够成批提取数据。有关更多信息,请参阅 设置 JDBC 提取大小参数。
2013 年 6 月 27 日
UNLOAD 加密的文件
UNLOAD 现在支持向 Amazon S3 上的加密文件卸载表数据。
2013 年 5 月 22 日
临时凭证
COPY 和 UNLOAD 现在支持使用临时凭证。
2013 年 4 月 11 日
已添加说明
“设计表”和“加载数据”的讨论更加清晰并有所扩充。
2013 年 2 月 14 日
添加了最佳实践
添加了设计表的 Amazon Redshift 最佳实践和Amazon Redshift 加载数据的最佳实践。
2013 年 2 月 14 日
阐明了密码限制
阐明了针对 CREATE USER 和 ALTER USER 的密码限制,做出多处小修订。
2013 年 2 月 14 日
新指南
本指南是 Amazon Redshift 开发人员指南的第一个版本。
2013 年 2 月 14 日