AWS (Amazon Web Services)のS3バケットに保存されたデータの検索・分析を容易にする”Amazon Athena”。
ログデータなど、大量のデータを扱う上で非常に重宝されるサービスです。
今回は、Amazon Athenaのサービス概要や機能、メリットを簡単にまとめてみました。
目次
Amazon Athenaは、S3に保存されたデータを簡単に検索および分析することができます。
検索にはデータベースと同じようにSQLクエリを用いることができます。
データ分析プロジェクトのために大量のデータを検索する必要がある場合に有用なことはもちろんのこと、CloudTrail・VPCフローログなど、セキュリティの観点でも大いに活用メリットがあります。
特にデータ分析プロジェクトに必要なリソースを追加することなく、必要なデータを素早く照会できるという手軽さも魅力です。
Amazon Athenaは主に以下のメリットを持っています。
テーブル定義をすると、あとはS3バケットにファイルを置くだけで、SQLを用いた検索ができるようになリマス。
データの追加変更も非常に簡単です。
オンデマンドの課金方式をとっており、検索に使用した分だけのコストがかかります。
※大量のデータを扱う場合には、適切なパーティション設定が必要です。
Amazon Athenaは、CSV・TSV・JSONやその他ログ形式に対応しています。
VPCフローログやCloudTrailなどのログも簡単に扱えるのは大きなメリットです。
Amazon AthenaはSQLで検索できるようにするため、DBやSQLの基礎知識は必須です。
また対象データの保管にはAmazon S3を用いるため、権限設定を細かくする場合には各種AWSサービスの仕様も知っておいた方が良いです。
いかがでしょうか。
今回は、Amazon Athenaというサービスの機能やメリットを簡単にまとめました。
このコラムでは紹介しきれなかった機能やメリットがたくさんあります。
データ分析やセキュリティ観点など、活用ケースは様々です。
ぜひ、実際に触って活用してみてください。