トレジャーデータはクラウドでデータマネージメントサービスを提供しています。

トレジャーデータにサインアップしていただいた全てのユーザーに対して、管理コンソールが用意されております。従来のコマンドラインベースでの操作に比べてこの管理コンソールは操作のわかりやすさ・簡潔さにおいて優れています。

本章ではこの管理コンソールからクエリを実行することを目的として,解説を行っていきます。管理コンソール全体のイントロは以下のチュートリアルビデオをご参照下さい。

New Query 画面

トレジャーのクエリ実行画面は上図のように4つのパーツ構成をとります。

  1. 「Query 記述画面」:実行するクエリを記述します。
  2. 「Schedule画面」:定時実行する場合のスケジューリングを行います。
  3. 「Option画面」:参照するデータベース,実行するクエリのタイプを選択します。
  4. 「Result Export画面」:集計結果を外部に出力します。

Query 記述画面

トレジャーデータのユーザー皆様は、バッチ処理(Hiveクエリ:SQL-Like Language)が実行できます。例えばあるアクセスログに対してPV,UUを計算するクエリは上記のようなものになります。

Schedule 画面

これはその場でクエリの結果を見たいというよりも,クエリを定時時間毎に実行するようなスケジューリングを行いたい場合に,この画面から簡単に設定できます。@daily や @hourly なら選択肢から選択するだけ,細かいスケジューリングはcronのような書式で簡単に登録できます。

Option 画面

実行対象のデータベースを選択します。

続いて実行するクエリのタイプを選択します。スタンダードユーザーはバッチ処理系である Hive と Pig を使用できます。さらにオプションを契約していただくとアドホック処理エンジンである Presto を使用する事が可能です。

バッチクエリとアドホッククエリの違いについては以下の記事を参照下さい。

トレジャーデータのバッチクエリとアドホッククエリを理解する1
バッチ型もアドホック型も共にSQLライクのクエリによってデータ処理が可能になっています。大きな違いは,バッチクエリはデータソースに対して大規模な並列分散処理を行...

さらにアドホッククエリであるPrestoに興味のある方は以下の記事を参照下さい。

『Prestoとは何か,Prestoで何ができるか』
Hadoop Conference Japan 2014以前に告知したHadoop Conference Japan 2014で,弊社Software Architectの古橋が発表しました。テーマは,Facebookが公開した…

Result Export 画面

実行したクエリは,コンソール上に出力→CSVダウンロード,という形で簡単に取得できますが,その他にもたくさんの外部ソースに結果のプッシュ(出力)が可能となっております。

出力先をトレジャーデータとするならばそれは非常に簡単で,出力先のDB名とTable名を設定するだけです。

また,Tableau Server に直接結果を書き出すことが可能で,これは定型レポーティングの完全自動化を実現するための非常に有効かつ強力な機能です。

トレジャーデータと Tableau で実現する自動レポーティング
Site Catalyst や Google Analytics をはじめとした分析ツールは,こちらが何も手を加えなくてもあらゆるチャート・テーブルを参照することができる非常に良く精錬され...

実行例

上図は最も基本的な設定での実行画面です。記述したクエリをコンソール上で受け取ります。

実行中はその進捗が随時出力されていきます。

集計が終わり,結果のテーブルが表示されました!

この結果をCSVで保存する場合は右上の「Browser Donwload」よりCSVを選択するだけです。

今回はトレジャーデータ管理コンソールから,クエリ実行に関する説明を行いました。機会があれば他の機能についても紹介させていただきます。

トレジャーデータに関するお問合せはこちら

お問い合わせ | Treasure Data

 まで宜しくお願い致します。