分析基盤アンケート調査してみたvol.1〈カカクコム 食べログシステム本部 データサイエンスチーム〉

f:id:pcads_media:20211008180426p:plain

こんにちは!TECH Street編集部です。

IT・テクノロジー人材のためのコミュニティ「TECH Street(テックストリート)」は、コミュニティメンバーの興味・関心事をテーマに独自調査を定期的に実施しております。

今回注目するのは「分析基盤」。本日より、各社の「分析基盤」におけるよりリアルな実態に迫るべく、データ分析チームの体制から、データ保護の観点での情報管理の工夫まで、アンケート調査した結果を連載で紹介していきます♬

第1弾は、株式会社カカクコム 食べログシステム本部 データサイエンスチームのアンケート結果を紹介します!

 

使用している技術やサービス

✅データ分析活用に使っている技術やサービスをそれぞれ教えて下さい。

①蓄積ツール
Google Cloud Storage

②加工ツール
BigQuery

③分析ツール
BigQuery

④可視化ツール
Tableau

 

組織体制

✅データ分析の専門チームの有無を教えて下さい。また、ある場合は何名体制か教えて下さい。

なし。各部署に分散している。

システム部門に2名。データ基盤構築運用・ワークフローの管理チーム。
ビジネス部門には集計チームが存在。5名体制。
メディア部門はチーム存在せず、ディレクター/プロデューサーが自身で実施する。
その他の部門は、上記部門のいずれかに相談される形で集計しているケースが多い模様。

 

データ取得

✅データの鮮度について、どのくらいの頻度でデータ取得をしているか教えて下さい。 

日次での更新。前日のデータが参照可能。

 

データ保護

✅データ保護の観点でどのように情報管理されているか、貴社ならではの工夫を教えて下さい。 

個人情報/セキュアなデータを置かない整理で情報セキュリティチームに共有。
個人情報/セキュアなデータを管理する仕組みを導入し、そのようなカラムは同期対象から外れるようにする。
基盤の利用ユーザが属する組織に合わせて、BigQueryデータセットが閲覧/更新可能な権限を設定する。

 

課題と取り組み

✅データ分析における課題と、課題対して今取り組んでいることがあれば教えて下さい。

ETL処理がオンプレ/クラウド、サービス毎に分断されてしまうこと。
オンプレ側にairflowを導入し、一元管理する方針。

 

学び

✅データ分析における最新情報のキャッチアップや学びはどこから得ているか教えて下さい。

GoogleCloudPlatform公式ドキュメント、Qiita、
ビッグデータを支える技術 刻々とデータが脈打つ自動化の世界
https://www.amazon.co.jp/gp/product/B07JGLQM2G/

 

✅今後より力を入れたい(強化したい)プログラミング言語を教えて下さい。

python

 

番外編:働く環境

✅働く上で欠かせないマストアイテムがあれば教えて下さい。

Realforceキーボード

以上が、株式会社カカクコム 食べログシステム本部 データサイエンスチームの回答結果となります^^
ご回答いただきありがとうございました!

*アンケート回答:2021年10月4日取得時点の情報です