技術 AWS lambdaでAthenaをETLする環境構築 AWS lambdaでAthenaを実行する際boto3での実行はデフォルトで可能だが、dataframeでの加工や処理を行いたくなるケースがある。 自前でレイヤーを作る方法は以前にも紹介したが、いくつかハマったポイントがあったのでメモ。 2023.02.26 技術
技術 AWS lambdaでPythonカスタムレイヤーを作成する AWS lambdaのPythonにおいて標準ライブラリ以外のモジュールを使う場合、 ・lambdaパッケージ内にライブラリを内包させる ・外部からカスタムレイヤーを含める というやり方があるが、lambdaを複数登録して運用する場合、都度パッケージ内にライブラリを含めるのは手間である。特にバージョンアップをする際には改修コストが大きい。 そこで、カスタムレイヤーの利用方法を整理する。 2022.12.16 技術
小ネタ AWS Glueで作成したパーティションがAthenaで認識されない AWS Glueで既存のテーブルに対して書き込む場合、 additionalOptions = {"enableUpdateCatalog": True} write_dynamic_frame.from_catalog(他略, additional_options=additionalOptions) を用いることで対応できるはずが、実際AthenaでSHOW PARTITIONSをしても認識できなかった。 一方で、Clawlerを用いることでパーティションを認識はできた。 そこで公式ドキュメントとの差分を調査。 2022.09.04 小ネタ