联合查询

Athena可以和关系数据库、数据仓库、对象存储和非关系数据存储运行联合查询。

联合 SQL 查询实现了从数据所在的位置就地查询,使用熟悉的 SQL 跨多个数据源 JOIN 数据进行快速分析,并将结果存储在 Amazon S3 中以供后续使用。Athena 联合查询还引入了 SDK,可以编写自己的数据源连接器来查询自定义数据存储:

img

Athena 使用在 Lambda 上运行的数据源连接器来执行联合查询,数据源连接器是一段可以在目标数据源和 Athena 之间进行转换的代码,可以将连接器视为 Athena 查询引擎的扩展。

当针对数据源提交查询时,Athena 会调用相应的连接器来识别需要读取的表部分,并管理并发。根据提交查询的用户,连接器可以提供或限制对特定数据元素的访问。