Schema Revolution

Iceberg schema更新是仅元数据的更改。执行schema更新时,不会更改任何数据文件。

Iceberg 格式支持以下Schema revolution更改:

  • 添加 – 将新列添加到表或嵌套结构中。
  • 删除 – 从表或嵌套结构中删除现有列。
  • 重命名 – 重命名嵌套结构中的现有列或字段。
  • 更新 – 扩大列、结构字段、映射键、映射值或列表元素的类型。
  • 重新排序 – 更改嵌套结构中列或字段的顺序。

运行下面的查询以向表中添加新列。将查询复制并粘贴到 Athena 查询编辑器中,然后单击 “运行” 按钮

ALTER TABLE default.customers_iceberg ADD COLUMNS (segment string)

就总收入而言,customer_id=32412 是最大的消费者,因此我们将该客户放入 XL 细分市场:

update default.customers_iceberg set segment ='XL' where "customer_id" = 32412

image-20231202080836469

我们来看看更新后的数据。将下面的查询复制并粘贴到 Athena 查询编辑器中,然后单击运行按钮:

select * from "customers_iceberg"where "customer_id" = 32412

image-20231202080922471