分析基盤アンケート調査してみたvol.4〈Retty データ分析チーム〉

f:id:pcads_media:20211008180426p:plain

こんにちは!TECH Street編集部です。

IT・テクノロジー人材のためのコミュニティ「TECH Street(テックストリート)」は、コミュニティメンバーの興味・関心事をテーマに独自調査を定期的に実施しております。

今回注目するのは「分析基盤」。各社の「分析基盤」におけるよりリアルな実態に迫るべく、データ分析チームの体制から、データ保護の観点での情報管理の工夫まで、アンケート調査した結果を連載で紹介していきます♬

第4弾は、Retty株式会社 データ分析チームのアンケート結果を紹介します!

 

使用している技術やサービス

✅データ分析活用に使っている技術やサービスをそれぞれ教えて下さい。

①蓄積ツール
Google Cloud Storage
Amazon S3
BigQuery

②加工ツール
BigQuery
Dataform
Airflow

③分析ツール
BigQuery
Python
スプレッドシート

④可視化ツール
Looker
DataPortal

 

組織体制

✅データ分析の専門チームの有無を教えて下さい。また、ある場合は何名体制か教えて下さい。

社員4名(+ 内定者インターン3名)

 

データ取得

✅データの鮮度について、どのくらいの頻度でデータ取得をしているか教えて下さい。 

基本的には日次更新。毎時更新のデータも一部あり。

 

データ保護

✅データ保護の観点でどのように情報管理されているか、貴社ならではの工夫を教えて下さい。 

(1)    データカタログを用意して、メタデータと機密レベルを社内共有している。また機密レベルに従ってカラムのドロップとマスクを適用している。

(2)    BigQueryのユーザー権限が透過的に用いられるように、各種データ可視化ツールのアクセス制御を運用している。

 

課題と取り組み

✅データ分析における課題と、課題対して今取り組んでいることがあれば教えて下さい。

古くに自前で開発したログ基盤の品質課題->Cloudに移行するか検討中
SLAの定義と運用化 / データパイプラインの監視体制の強化

 

学び

✅データ分析における最新情報のキャッチアップや学びはどこから得ているか教えて下さい。

(1)    書籍
1     10年戦えるデータ分析入門 SQLを武器にデータ活用時代を生き抜く (Informatics &IDEA)
2    イシューからはじめよ――知的生産の「シンプルな本質」
3    論点思考
(2)    サイト
1    BigQuery: https://cloud.google.com/bigquery/docs/release-notes
2    Looker: https://community.looker.com/

 

✅今後より力を入れたい(強化したい)プログラミング言語を教えて下さい。

Python

 

番外編:働く環境

✅働く上で欠かせないマストアイテムがあれば教えて下さい。

スプレッドシート

以上が、Retty株式会社 データ分析チームの回答結果となります^^
ご回答いただきありがとうございました!

▼連載まとめ記事はこちら
【連載まとめ】分析基盤アンケート調査してみたvol.1〜4

*アンケート回答:2021年10月25日取得時点の情報です