Tsuyoshin blog

所属団体とは関係なく、個人的なblog

Redashへのリプレイスから活用方法までの話

はじめに

developers.cyberagent.co.jp

最近ウチはAuroraに切り替えをしました。🎉🎉🎉

当然良かった点はいくつもありますが、一つにリーダーエンドポイントが気軽に増やせることがあります

なので一つAurora Readerを作成してAnalytics用途として活用しています。このコトを契機に分析用の仕組みを色々と改善できるなーと感じていて

Aurora切り替えが無事に完了してRedash導入後、1ヶ月経過したので少しまとめて見ようと思います

Redashに移行する前の分析

f:id:tsuyoshi_nakamura:20170515193707j:plain

  • バッチで必要なデータを取得・加工してElasticSearchに入れる
  • Kibanaからグラフ化してダッシュボード化して見ていた

ここでの課題感

  • 分析するデータが増えた場合、バッチ修正して、既存Indexも作り直してってとても面倒だった😰
  • 定期バッチで取り込んでいたので多少なりともタイムラグが存在していた😰
  • キャンセルなどで過去のデータ=過去のIndexに修正が入った場合に修正するのがとても手間だった😰
  • Elasticsearchの運用も日に日にかさんでいった…😰
  • Google Analyticsのデータは別で分析してた。一元管理できなかった😰

そこでRedashに乗り換えたわけですが

最終的な構成イメージ

f:id:tsuyoshi_nakamura:20170513015122j:plain

  • 利用者はまず社内の認証システム(Single Sign-On)で認証してからRedashの閲覧できます

  • Redashのデータ・ソースとしては下記を設定

Redashを選んだ理由

簡単に書くと下記の点でうちにはマッチすると思った

  1. 元々データ分析のソースとしてはDBのデータGoogle Analyticsを使っていてこの2つを一元的に扱いたいなーと思ってた
  2. 元々Google Spreadsheetをフル活用してて、それらの資産を取り込めてダッシュボード化できた点
    • Shell Script経由でDBからデータを抽出してSpreadsheetに反映させたりと色々動いていた
    • Google App Scriptを活用してSpreadsheetに反映させてたりと色々動いていた
  3. Elasticsearch+kibanaの時の課題感も当然解消できると思った

他のツールとの比較した

Amazon QuickSight

Amazon QuickSight | Home

  • Google Analyticsのデータをデータソースとして活用できない… キビシイ😅
  • あくまでもAWS内のマネージメントサービス内にあるデータを効率的に分析できるツールのようです

Google Data Studio

https://datastudio.google.com

  • データソースには当然Google Analyticsを扱えた
  • Aurora Readerの設定もできそうだったけどセキュリティ的な部分で少々不安を覚えた😅
  • 表示している期間と前の期間との比較させて見せるグラフとか気に入ってたりしたんだけど…
  • 検討していた当時は無料枠では5つしか作ることが出来ず、また有料枠も明確な価格設定を出してなくて、んーとなった😅

Tableau

ビジネスインテリジェンスとデータ分析 | Tableau Software

  • 一番評判の良いツールなので当然、セキュアにDBにつながるし、Google Anayticsにも繋げられる
  • ただ、価格がうちにとっては高かった…😅
  • ツールの位置づけもバリバリのデータサイエンティストがフル活用してやっとペイするような話を他部署で聞いたし…

そしてRedashをどのように業務に活用しているか

ダッシュボードを複数に分けて使っている

色々一つのダッシュボードにまとめたくなるけど、表示重くなるし、目移りしちゃうので一つにまとめることはやめた。

それぞれの立場の人によって一番みたいデータが異なる。なので見る人が誰で何のデータを一番見たいかを基準にまとめてる

  • ビジネスサイド人向けのダッシュボード
  • 開発者向けの〇〇機能のチーム向けのダッシュボード といった感じ

あとは期間としては30日間を目安に集計したデータを表示している

  • 時と場合によるけど目先追いかけるデータとしては直近30日間が妥当だと思っている

他のツールの計測数値をiframeでRedashのダッシュボードに表示している

うちで言うとNewrelic、SpeedCurveのデータは関連するKPIと一緒に見たいときがある。大体のサービスはiframeでの表示機能を提供しているのでそのURLをコピペしてダッシュボードに一緒に表示している

最近の新たな活用方法

  • メルマガ用のアドレス抽出に活用してたり、経理の締め作業に活用してたりしている様子
    • そのうちSQLを覚える人が増える事を期待している🙂

こうできると良いなと思う点

  • 今表示しているデータと前の期間のデータを一緒のグラフでみたい
    • こんなやつ
    • f:id:tsuyoshi_nakamura:20170513030847p:plain
  • SQLやダッシュボードのバージョン管理できるようにAPIの充実を期待している

まとめ

今のところうまく運用できていると思っている😀

朝会の時に昨日のデータをRedashのダッシュボードから見てから朝会しても良いなーとか思ってたりする💪🏽