dely Tech Blog

クラシル・TRILLを運営するdely株式会社の開発ブログです

データサイエンスチームの取り組み Presto勉強会

f:id:sakura818uuu:20190826152215p:plain

はじめに

こんにちは。データサイエンスチームのsakura (@818uuu) です。
クラシルの検索改善を担当しています。

データサイエンスチームでは今月 Presto勉強会 を毎日行っていました。
本記事ではその取り組みをご紹介しようと思います。

Prestoとは

Prestoとは、Amazon Athenaで使用されている分散SQLエンジンのことを指します。
※本勉強会ではPrestoで動く「SQL記法」を勉強しています。

概要

Presto勉強会の概要です。

[内容] Prestoの公式ドキュメントを読み知見を深める
[目的] Prestoの知られざる機能などを学び、開発効率化に活かす
[時間] 毎日ランチに行く前の10〜20分
[参加者] データサイエンスチームメンバー(3人〜4人)

f:id:sakura818uuu:20190826150059p:plain
こんなかんじでディスプレイに映しながら話し合いました

Presto勉強会を一言でいうと
「毎日ランチ前にチームでPrestoの公式ドキュメントを読む取り組み」です。

実施内容

f:id:sakura818uuu:20190820175434p:plain
このページの単元を一つずつ読んでいきました

上記のドキュメントに従い1日大体1章ごと進めていきました。
わからないところは実際にAthenaでクエリを書いて試しながら進めていきました。

f:id:sakura818uuu:20190826115411p:plain
json_size関数を試している図 (公式ドキュメントだけでは理解するのが難しかったため)

取り組んでみた感想

複数人で公式ドキュメントを読む機会はなかなかないので貴重な経験となりました。

一番驚いたことは、ドキュメントの読み取り一つでも自分とメンバー間に違いがあったことです。
人によって読み取り方が様々で、
「この一行からそこまで読み取ることが出来るんだ」
「このメンバーだとそういった応用例まで考えているのか」
と技術ドキュメントの読み取り方の勉強としても参考になりました。


また、いくつか今後業務で活かせそうな関数も発見することができました。

f:id:sakura818uuu:20190826113346j:plain:w300
今後活かせそうな関数などをメモしています

もちろん、bool_and()to_iso8601(x) などこれいつ使うんだと思った関数もたくさんありました笑
一通り全ての関数に目を学んだことで「Prestoで出来ること/出来ないこと」を把握できたのがよかったと思います。

おわりに

Presto勉強会で公式ドキュメントを一通り読んだことで、チーム全体でPrestoへの理解が深まりました。
この勉強会で得た知見を業務に活用していきたいと思います。


データサイエンスチームでは、Presto勉強会やサーベイチャレンジなど様々な取り組みを行っています。もしご興味があればご応募・ご連絡ください: )

www.wantedly.com