テックブログ - Arm Treasure Data

データサイエンティストのためのHiveQL分析クエリテンプレート その4

C. バスケット分析
バスケット分析はアイテム間の関連度を知るための重要な指標であり,レコメンデーション…


データサイエンティストのためのHiveQL分析クエリテンプレート その2

B. < m1 | Bin(m2), Bin(m3) > パターン
前回はディメンジョンdim1, dim2を直接セグメントとして渡していましたが,今回はメジャー…


データサイエンティストのためのHiveQL分析クエリテンプレート その6

E. リテンション分析
最後はリテンションに関するクエリテンプレートです。


Login(アクセス)ログからわかる12の指標 その4

前回(その3)の続きです。
11. Streak 5:5日連続ログインユーザーリスト
直近(2012-04-04)で5日連続ログインしてくれているユーザーリストを取得します。


Login(アクセス)ログからわかる12の指標 その3

前回(その2)の続きです。
10. 直近のログインユーザーの,(i) 登録時からのプレイ期間,および (ii) 登録日,の分布
直近1週間内にログインのあったユーザーが…


Login(アクセス)ログからわかる12の指標 その2

前回(その1)の続きです。
6. Frequency(リピート回数の分布)
特定期間におけるユーザー当たりの訪問回数の分布を見たものです。


Login(アクセス)ログからわかる12の指標 その1

本シリーズの主張は,例え単純な ”ログイン”(アクセス)の記録のみを取るだけでも,それにユーザーIDが付くことでトレジャーデータ上で遙かにリッチな示唆を得ることができる…


データサイエンティストのためのHiveQL分析クエリテンプレート その3

その2に引き続いてB. < m1|Bin(m2), Bin(m3) >に属するパターンを見ていきます。
パターン B-3:< m1 | Bin(m2) >


データサイエンティストのためのHiveQL分析クエリテンプレート その1

Treasure Dataでは,カラムナデータベースであるTreasure Cloud Storageに対してSQL ライクなHiveQLでデータの集計・分析が可能に…


Treasure Data Analytics 第9回 〜Social Gaming Analytics Vol.3: 退会ユーザーに関する分析〜

前回はチュートリアルの全ステップを通過し,登録に至るまでの状況をファンネル分析で見てきました。


Treasure Data Analytics 第8回 〜Social Gaming Analytics Vol.2: チュートリアルにおけるファンネル分析〜

図1:チュートリアルのアクションを表現したファンネルグラフ。入口である step=1 には 8 人の user が流入したのにもかかわらず途中で…


Treasure Data Analytics 第7回 〜Social Gaming Analytics Vol.1: イントロダクション〜

今回から数回に渡って Social Gaming Analytics シリーズが始まります。本シリーズの目的は,特定のゲームに依存しない,一般的な…


Treasure Data Analytics 第5回 〜ブックレビューデータセットによるデータ解析入門(実践編2)

前回の続きです。
5. 複数のノード・アクションをまたいだ分析
前回までは主に個々のノード・アクションの…


Treasure Data Analytics 第4回 〜ブックレビューデータセットによるデータ解析入門(実践編1)〜

準備編ではデータセット:Book-Crossing Dataset を用意し, Treasure Data のツールベルト一式を導入した上でインポートし…


Treasure Data Analytics 第3回 〜ブックレビューデータセットによるデータ解析入門(準備編)〜

前回まで Treasure Data Cloud Warehouse の紹介をしていましたが,今回からはパブリックデータを利用したデータ解析のユースケースを…