SlideShare ist ein Scribd-Unternehmen logo
1 von 47
Downloaden Sie, um offline zu lesen
1	
  

「この	
  Visualiza)on	
  ツールがすごい2014」	
  
〜データ世界を彩る美しきツール6選〜	
  
March 2nd, 2014 データ可視化勉強会
Presented	
  by	
  
	
  
	
  

Takahiro	
  Inoue	
  –	
  Chief	
  Data	
  Scien:st	
  
2	
  

Agenda	
1. 
2. 
3. 
4. 
5. 
6. 
7. 
8. 

Introduc:on	
  
Learning	
  Visualiza:on	
  
表計算部門:aabel3	
  
Takahiro	
   noue	
  –	
  Chief	
  Data	
  
Dashboard	
  部門:Metric	
  IInsights	
   Scien:st	
  
BI	
  部門:tableau	
  
統計ソフト部門:ggplot2	
  
抽象化部門:Neo4j(Graph	
  Database)	
  
プログラミング部門:d3.js(省略)	
  
Presented	
  by	
  
	
  
	
  
3	
  

1.	
  Introduc)on	
  
4	
  

Introduc)on	
•  Takahiro	
  Inoue	
  (TwiPer:	
  @doryokujin	
  )	
  
•  Majored	
  in	
  Mathema:cs	
  in	
  Keio	
  University	
  
•  Chief	
  Data	
  Scien:st	
  and	
  Solu:on	
  Architect	
  @	
  Treasure-­‐Data	
  
Presented	
  by	
  
	
  
	
  

•  Leader	
  of	
  Japanese	
  MongoDB	
  Community,	
  MData	
  Scien:st	
  
Takahiro	
  Inoue	
  –	
  Chief	
   ongo	
  Masters	
  
•  doryokujin’s	
  blog	
  hPp://doryokujin.hatenablog.jp/	
  
5	
  

Treasure	
  Data	
  Introduc)on	
Data Collection

Data Storage

Data Analysis

Company & Product Over View

Web logs

Treasure Agent

App logs

Streaming Log !
Collector (JSON)!

Sensor

Cloud DB, Web App,
& Command Line

BI Connectivity

Flexible, Scalable,
Columnar Storage!
Presented	
  by	
  

REST API, SQL, Pig,
JDBC / ODBC!

Tableau, Metric Insights,
BI Tools
Dr.Sum, Excel, etc.

New!!	
Treasure Viewer

	
  
	
  

Treasure Batch Query
Takahiro	
  Inoue	
  –	
  Chief	
  Data	
  Scien:st	
  
&
New!!	
Treasure Query Accelerator

RDBMS
Bulk Import
CRM

Parallel Upload from
CSV, MySQL, etc.!

ERP

Time to Value
Value	
  Proposi)on	
  1	

New!!	
Management Console
No Command Line,!
Every Operation is Here! !

Economy & Flexibility
Value	
  Proposi)on	
  2	

Result Push
REST API, SQL,
Pig!

Dashboards
Custom App, Local DB,
FTP Server, etc.

Simple & Supported
Value	
  Proposi)on	
  3
6	
  

M	
  x	
  N	
  通りのデータ収集・活用方法

7	
  

Fluentd:	
  M	
  +	
  N	
  通りに経路を集約して簡素化	
Access logs
Apache

Alerting
Nagios

App logs
Frontend
Backend

Analysis
MongoDB
MySQL
Hadoop

System logs
syslogd
Databases

filter / buffer / routing

Archiving
Amazon S3
8	
  

Data Analysis
REST	
  API	
  

Heavy	
  LiKing	
  SQL	
  (Hive):	
  
-­‐  Hive’s	
  Built-­‐in	
  UDFs	
  
-­‐  TD	
  Added	
  Func:ons:	
  
-­‐  Time	
  Func:ons	
  
-­‐  First,	
  Last,	
  Rank	
  
-­‐  Sessionize	
  

Scheduled	
  Jobs	
  
-­‐  SQL,	
  Pig	
  Scripts	
  
-­‐  Data	
  Pushes	
  
JDBC	
  Connec)vity:	
  
-­‐  Custom	
  Java	
  Apps	
  
-­‐  Standards-­‐based	
  
-­‐  BI	
  Tool	
  Integra:on	
  
Tableau	
  ODBC	
  connector	
  
-­‐  Leverages	
  Impala	
  

Interac)ve	
  SQL	
  
Treasure	
  Query	
  Accelerator	
  	
  
(Impala)	
  
Scripted	
  Processing	
  (Pig):	
  
-­‐  DataFu	
  (LinkedIn)	
  
-­‐  Piggybank	
  (Apache)	
  

Push	
  Query	
  Results:	
  
-­‐  MySQL,	
  PostgreSQL	
  
-­‐  Google	
  Spreadsheet	
  
-­‐  Web,	
  FTP,	
  S3	
  
-­‐  Lecronic,	
  Indicee	
  
-­‐  Treasure	
  Data	
  Table	
  
9	
  

2.	
  Learning	
  Visualiza)on	
  
10	
  

Visualiza)on	
  Types(入力データに基づく分類)	
ScaUer	
  Plot	
  
N-­‐Dimensional	
  Graph	
  
Map	
  Plot	
  

Aggregated	
  
Data	
  
Cross	
  Tables	
  

Raw	
  Data	
  

2-­‐Dimensional	
  Graph	
  
Math	
  Graph	
  

Analyzed	
  
Data	
  

Sta)s)cal	
  Graph	
  
11	
  

Raw	
  Data	
  Explana)on	
ScaUer	
  Plot(散布図)	
  

(for	
  Rawdata)	
  
	
  
データレコードの任意の数値変数2項目
をプロットし,関係を発見する。	
	

Map	
  Plot	
  

(for	
  Rawdata)	
  
	
  

位置情報(緯度,経度)を持つデータポ
イントを地図上にマッピングし,データの
密集度などを参考にする。	

Math	
  Graph	
  
(for	
  Rawdata)	
  

	
  
データの「関係」を数学的グラフによって
表現。
12	
  

Processed	
  Data	
  Explana)on	
2-­‐Dimensional	
  Graph	
  

(for	
  aggregated	
  data)	
  
	
  
主に	
  X-­‐軸,Y-­‐軸 (,Y2-­‐軸)を用いて表現さ
れる,バーグラフや円グラフなどの平面
チャート。	

N-­‐Dimensional	
  Graph	
  
(for	
  cross	
  tables)	
  
	
  

X-­‐軸,Y-­‐軸,Z-­‐軸 を用いて表現されるグ
ラフ。Z-­‐軸は半径や色,奥行き,凡例な
どによって表現される。	

Sta)s)cal	
  Graph	
  
(for	
  analyzed	
  data)	
  

	
  
統計分析によって導いた分布やモデル,
パターンなどを図示する。
13	
  

Graphの種類とツールの対応表	
表計算	
ScaUer	
  Plot	
  

2-­‐Dimensional	
  Graph	
   N-­‐Dimensional	
  Graph	
  

Sta)s)cal	
  Graph	
  

ScaUer	
  Plot	
  

2-­‐Dimensional	
  Graph	
   N-­‐Dimensional	
  Graph	
  

Sta)s)cal	
  Graph	
  

ScaUer	
  Plot	
  

2-­‐Dimensional	
  Graph	
  

統計ソフト	

Dashboard	

BI	

プログラミングラ
イブラリ	

Map	
  Plot	
  

ScaUer	
  Plot	
  

抽象化	
Math	
  Graph	
  

2-­‐Dimensional	
  Graph	
   N-­‐Dimensional	
  Graph	
  

Map	
  Plot	
  

2-­‐Dimensional	
  Graph	
   N-­‐Dimensional	
  Graph	
  
14	
  

Processed	
  Data	
  Explana)on	
部門	

ツール名	

OS	

描画手続き	

表計算	

aabel3	

Mac	

Chart	
  Library	

統計ソフト	

ggplot2	
  (R	
  Library)	
 Windows,	
  Mac,	
  Linux	

The	
  Grammar	
  of	
  Graphics	
  
+	
  Layer	
  of	
  Graphics	

Dashboard	

Metric	
  Insights	

Web	
  UI	

Widget	
  Tutorial	
  /	
  
Chart	
  Library	
  &	
  Import	
  JS	

BI	

Tableau	

Windows	

VizQL	

プログラミン
D3.js	
  	
  (JavaScript)	
 -­‐	
グライブラリ	
抽象化	

Neo4j	
  (Java:	
  Graph	
  
-­‐	
Database)	

Data	
  Driven	
  Documents	
Property	
  Graph
15	
  

3.	
  表計算部門	
  
•  aabel3	
  
16	
  

表計算部門:aabel3	
•  数々の統計手法、探究的データ解析手法を提供。	

•  複数の多変量データを容易にデータ整理可能。	
•  リアルタイムの双方向インタラクティブデータ作用
を可能にし、多変量データ解析を容易にするユ
ニークなパイプラインデザインを装備。	
•  インタラクティブな可視化機能、数多くのグラフタイ
プ、240	
  以上のデータプレゼンテーションスタイル
を用意。	

•  数値データ管理ツール、フォーミュラエディタなど
のユーティリティを装備したネイティブワークシート。	

•  さまざまなデータインポート、グラフィックファイル
エクスポート、データマニピュレータ、フレキシブル
なカスタマイズツール、Unicode	
  対応、出版品質の
グラフィックなど研究、調査に必要なツールを装備。
17	
  

描画手続き:Chart	
  Library
18	
  

描画手続き:Chart	
  Library	

•  多様性:あらゆるVisualiza:on・統計メソッドを装備。	
  
•  容易性:チュートリアルに従ってあらゆる図が描ける。	
  
•  ワークシート:エクセルと同じようにワークシートによるデータ編集,抽出が可能。
19	
  

応用事例:Map	
  Plot
20	
  

応用事例:回帰分析	
  /	
  生存時間分析
21	
  

4.	
  Dashboard	
  部門	
  
•  Metric	
  Insights	
  
22	
  

Dashboard部門:Metric	
  Insights
23	
  

Dashboard部門:Metric	
  Insights	
•  毎日更新される	
  KPI	
  を素早く参照可能。	
•  異常検出機能,およびアラート機能。
チャートへのアノテーション機能。	
•  Smart	
  Phone	
  や Tablet	
  からも綺麗に描
画できる。	
•  D3.js,	
  Google	
  Chart,	
  Higcharts	
  などのJSライブ
ラリをインポート可能→インタラクティブな図	
•  (任意の時間インターバルでの)データ自動
更新機能。	
•  素早く編集可能な互いに独立したパネル
(ウィジェット)を持っている。	
  
•  様々なデータベース・ファイル形式と接続でき
るコネクタを装備。	
  
24	
  

描画手続き:Widget	
  Tutorial	
1. 集計インターバ
ルを設定
2. メジャーの種類
を設定

3. カテゴリを設定
25	
  

描画手続き:Widget	
  Tutorial	
4. Plug-inを選択

5. 接続するデー
タソースを指定
6. クエリを記述

7. Sample Result
を確認
26	
  

応用事例:Import	
  JS	
  Library
27	
  

応用事例:レポーティング
28	
  

応用事例:Dynamic	
  Pivot	
  Table
29	
  

5.	
  BI(Business	
  Intelligence) 部門	
  
•  Tableau	
  
30	
  

BI部門:Tableau
31	
  

BI部門:tableau
32	
  

Dashboard	
  (MI)	
  と	
  BI	
  (Tableau)	
  の違い	
Dashboard ( Metric Insights )

BI	
  (	
  Tableau	
  )

• 

毎日更新されるデータ (KPI) を素早く参照する
ため	
解析者に関わらず全てのユーザーが参照する
ため	
異常値やイベントなどの効果を素早く把握する
ため	
Smart Phone や Tablet からも参照するため	

• 

異常検出機能,およびアラート機能を備えてい
ること	
チャートへのアノテーション機能を備えているこ
と	
チャートの一覧性・わかりやすさを重視してい
ること	
(任意の時間インターバルでの)データ自動更
新機能を持っていること	
素早く編集可能な互いに独立したパネル(ウィ
ジェット)を持っていること	
様々なデータベース・ファイル形式と接続でき
るコネクタを備えていること	

• 
• 

• 

目的

• 
• 

• 
• 
• 

要請

• 
• 
• 

• 
• 
• 

• 
• 
• 

様々の切り口・セグメントの組合せでデータを閲覧す
るため	
インタラクティブな操作でドリルダウンや軸の切り替
えを行うため	
様々なチャートとテーブルを組合せた情報表現を行
うため	
プレゼンに耐えうるクオリティの高いレポートを作成
するため	
インタラクティブな操作が可能なこと	
豊富なチャートライブラリ,ダッシュボードエディタの
実装していること	
最適化された中間データ構造(Data Cubeなど)を備
えていること	
マウス操作によってデータの深堀りや切り口の切り
替えが可能なこと	
JDBC / ODBC コネクタを初めとした様々なデータソー
スとの接続口を持つこと
33	
  

描画手続き:VizQL	

hPp://tableau.globalpreneurs.jp/faq/
34	
  

描画手続き:Dimension	
  &	
  Measure
35	
  

描画手続き:Dimension	
  &	
  Measure
36	
  

Video	
  Tutorial	
  
	

hPp://youtu.be/vh9v76e95GY
37	
  

応用事例
38	
  

応用事例
39	
  

6.	
  統計ソフト部門	
  
•  ggplot2	
  
40	
  

統計ソフト部門:ggplot2	

•  ggplot2はRのパッケージ。	
  
•  “The	
  Grammar	
  of	
  Graphics”:文法に基づいた柔軟
な描画が可能。	
•  ありあわせのChart	
  Libraryから選択するのではな
く,文法に基づいて現状の問題にあった描画が可
能。	
•  The	
  Grammar	
  of	
  Graphicsをさらに拡張し,「レイ
ヤー」という概念を導入。	
•  豊富な書籍,ドキュメント
41	
  

描画手続き:The	
  Grammar	
  of	
  Graphics	
要素	
  

名前	
  

説明	
  

data	
  

データ	
  

ビジュアル化したい対象。	
  

geom	

幾何学的オ
ブジェクト	

プロット上のタイプを決める。	

{	
  point,	
  bar,	
  boxplot,	
  line	
  }	
  

stat	

統計的変換	

データをようやくする様々な方法。オプ
ション。	

{	
  density,	
  boxplot,	
  smooth,	
  histogram	
  }	

scale	

スケール	

データを「位置」と「カラー」にマッピング
する。	

{	
  x=0.037,	
  y=0.531,	
  colour=#FF6C91	
  }	

coord	
 座標系	

オブジェクトの位置を指定された座標
系の上にプロット平面にマッピング。	

{	
  Cartesian,	
  Map,	
  Polar	
  }	

facet	

トリレス・プロットの一般化。データ全体
から異なる部分集合を抽出する。	

ファセット	

例	
  
42	
  

描画手続き:Layer	
  of	
  Graphics	
•  レイヤー文法は次の成分の組み合わせから成る:	
  
	
  {	
  data,	
  mapping,	
  geom,	
  stat,	
  posi:on	
  }	
  
•  プロットにレイヤーを重ねるには	
  “+”	
  を使う。	

一般のグラフィクスライブラ
リでの作図例。1つの層に
あらゆる成分を置く。	

Ggplot2ではそれぞれの層
に成分を置いていく。	
図の参照先
43	
  

描画手続き:Layer	
  of	
  Graphics	
#	
  ggplot2に入っている乗用車の燃費データ	
  
$	
  ?mpg	
  
$	
  summary(mpg)	
  
	
  
$	
  p	
  <-­‐	
  ggplot(mpg,	
  aes(displ,	
  hwy))	
	
  
#	
  geom	
  成分を与えることで始めて描画される	
  
$	
  p	
  +	
  geom_point()	
  
	
  
#	
  geom	
  成分として	
  line	
  を重ねる。散布図と折れ線の描画	
  
$	
  ggplot(mpg,	
  aes(displ,	
  hwy))+	
  
	
  	
  	
  	
  geom_point()+	
  
	
  	
  	
  	
  geom_line()	
  
	
  
#	
  cyl	
  (	
  =	
  シリンダ数)	
  をfactorにした色分けを行う	
  
$	
  ggplot(mpg,	
  aes(displ,	
  hwy))+	
  
	
  	
  	
  	
  geom_point()+	
  
	
  	
  	
  	
  geom_line(aes(color	
  =	
  factor(cyl)))	
  
	
  
	
  
44	
  

描画手続き:Layer	
  of	
  Graphics	
#ファセットの追加,2×2の sccater	
  matrix	
  
$	
  ggplot(data	
  =	
  gender.comp,	
  aes(Male,	
  Female))+	
  
	
  	
  	
  	
  geom_abline(colour	
  =	
  "grey80")+	
  
	
  	
  	
  	
  geom_point(alpha	
  =	
  0.6)+	
  
	
  	
  	
  	
  facet_wrap(~Measure,	
  scales	
  =	
  "free")	
  
	
  
45	
  

7.	
  抽象化部門	
  
•  Neo4j	
  (Graph	
  Database)	
  
46	
  

hPp://www.slideshare.net/doryokujin/graphdbgraphdb
47	
  

Discussion & Q and A

Weitere ähnliche Inhalte

Was ist angesagt?

Html5j data visualization_and_d3
Html5j data visualization_and_d3Html5j data visualization_and_d3
Html5j data visualization_and_d3Daichi Morifuji
 
アプリを成長させるためのログ取りとログ解析に必要なこと
アプリを成長させるためのログ取りとログ解析に必要なことアプリを成長させるためのログ取りとログ解析に必要なこと
アプリを成長させるためのログ取りとログ解析に必要なことTakao Sumitomo
 
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]Hideo Takagi
 
(beta)アプリを成長させるためのログ取りとログ解析に必要なこと
(beta)アプリを成長させるためのログ取りとログ解析に必要なこと(beta)アプリを成長させるためのログ取りとログ解析に必要なこと
(beta)アプリを成長させるためのログ取りとログ解析に必要なことTakao Sumitomo
 
Hadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食いHadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食いRyuji Tamagawa
 
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所de:code 2017
 
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けRecruit Technologies
 
2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートake
2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートake2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートake
2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートakeDaiyu Hatakeyama
 
インフォグラフィックス時代のD3.js入門
インフォグラフィックス時代のD3.js入門インフォグラフィックス時代のD3.js入門
インフォグラフィックス時代のD3.js入門貴寛 益子
 
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
データサイエンティストが力を発揮できるアジャイルデータ活用基盤データサイエンティストが力を発揮できるアジャイルデータ活用基盤
データサイエンティストが力を発揮できるアジャイルデータ活用基盤Recruit Lifestyle Co., Ltd.
 
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Hortonworks Japan
 
Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729s. kaijima
 
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のりThe Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のりRecruit Lifestyle Co., Ltd.
 
Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現
Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現
Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現インフラジスティックス・ジャパン株式会社
 
【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋Momota Sasaki
 
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介Recruit Technologies
 
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組みData Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組みcyberagent
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionTetsutaro Watanabe
 
Hadoopカンファレンス20140707
Hadoopカンファレンス20140707Hadoopカンファレンス20140707
Hadoopカンファレンス20140707Recruit Technologies
 
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
データ分析基盤運⽤チームの 運⽤業務を改善してみた話データ分析基盤運⽤チームの 運⽤業務を改善してみた話
データ分析基盤運⽤チームの 運⽤業務を改善してみた話Recruit Lifestyle Co., Ltd.
 

Was ist angesagt? (20)

Html5j data visualization_and_d3
Html5j data visualization_and_d3Html5j data visualization_and_d3
Html5j data visualization_and_d3
 
アプリを成長させるためのログ取りとログ解析に必要なこと
アプリを成長させるためのログ取りとログ解析に必要なことアプリを成長させるためのログ取りとログ解析に必要なこと
アプリを成長させるためのログ取りとログ解析に必要なこと
 
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
 
(beta)アプリを成長させるためのログ取りとログ解析に必要なこと
(beta)アプリを成長させるためのログ取りとログ解析に必要なこと(beta)アプリを成長させるためのログ取りとログ解析に必要なこと
(beta)アプリを成長させるためのログ取りとログ解析に必要なこと
 
Hadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食いHadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食い
 
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
 
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
 
2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートake
2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートake2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートake
2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートake
 
インフォグラフィックス時代のD3.js入門
インフォグラフィックス時代のD3.js入門インフォグラフィックス時代のD3.js入門
インフォグラフィックス時代のD3.js入門
 
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
データサイエンティストが力を発揮できるアジャイルデータ活用基盤データサイエンティストが力を発揮できるアジャイルデータ活用基盤
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
 
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
 
Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729
 
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のりThe Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
 
Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現
Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現
Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現
 
【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋
 
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
 
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組みData Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 
Hadoopカンファレンス20140707
Hadoopカンファレンス20140707Hadoopカンファレンス20140707
Hadoopカンファレンス20140707
 
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
データ分析基盤運⽤チームの 運⽤業務を改善してみた話データ分析基盤運⽤チームの 運⽤業務を改善してみた話
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
 

Ähnlich wie この Visualization がすごい2014 〜データ世界を彩るツール6選〜

トレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解するトレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解するTakahiro Inoue
 
いまできるデータ分析を Power BI ではじめよう
いまできるデータ分析を Power BI ではじめよういまできるデータ分析を Power BI ではじめよう
いまできるデータ分析を Power BI ではじめようYugo Shimizu
 
CDS が DirectQuery をサポートしたのでそれを紹介しながら新機能を紹介していきます
CDS が DirectQuery をサポートしたのでそれを紹介しながら新機能を紹介していきますCDS が DirectQuery をサポートしたのでそれを紹介しながら新機能を紹介していきます
CDS が DirectQuery をサポートしたのでそれを紹介しながら新機能を紹介していきますYugo Shimizu
 
え、毎月手作業でレポートを作ってるの?Power BI を使えば自動化できますよ!
え、毎月手作業でレポートを作ってるの?Power BI を使えば自動化できますよ!え、毎月手作業でレポートを作ってるの?Power BI を使えば自動化できますよ!
え、毎月手作業でレポートを作ってるの?Power BI を使えば自動化できますよ!Yugo Shimizu
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...Google Cloud Platform - Japan
 
Synapse lakedatabase
Synapse lakedatabaseSynapse lakedatabase
Synapse lakedatabaseRyoma Nagata
 
#経済学のための実践的データ分析 11. データのビジュアライゼーション
#経済学のための実践的データ分析 11. データのビジュアライゼーション#経済学のための実践的データ分析 11. データのビジュアライゼーション
#経済学のための実践的データ分析 11. データのビジュアライゼーションYasushi Hara
 
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...日本マイクロソフト株式会社
 
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...Insight Technology, Inc.
 
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeDevelopers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeSatoru Ishikawa
 
Tableau x Einstein 連 携 に 関 す る 勝 手 な 考 察
Tableau x Einstein 連 携 に 関 す る 勝 手 な 考 察Tableau x Einstein 連 携 に 関 す る 勝 手 な 考 察
Tableau x Einstein 連 携 に 関 す る 勝 手 な 考 察Tomohiro Iwahashi
 
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようMicrosoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようHideo Takagi
 
Data Visualization Japan Meetup 2018: 長く変化に対応する
Data Visualization Japan Meetup 2018: 長く変化に対応するData Visualization Japan Meetup 2018: 長く変化に対応する
Data Visualization Japan Meetup 2018: 長く変化に対応するKeiichiro Ono
 
Mulvery@沖縄Ruby会議02
Mulvery@沖縄Ruby会議02Mulvery@沖縄Ruby会議02
Mulvery@沖縄Ruby会議02Daichi Teruya
 
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~Yugo Shimizu
 
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~The Japan DataScientist Society
 
Azure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/SparkAzure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/SparkRyoma Nagata
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)日本マイクロソフト株式会社
 
Presto As A Service - Treasure DataでのPresto運用事例
Presto As A Service - Treasure DataでのPresto運用事例Presto As A Service - Treasure DataでのPresto運用事例
Presto As A Service - Treasure DataでのPresto運用事例Taro L. Saito
 
Preview: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
Preview: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようPreview: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
Preview: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようDaisuke Masubuchi
 

Ähnlich wie この Visualization がすごい2014 〜データ世界を彩るツール6選〜 (20)

トレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解するトレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解する
 
いまできるデータ分析を Power BI ではじめよう
いまできるデータ分析を Power BI ではじめよういまできるデータ分析を Power BI ではじめよう
いまできるデータ分析を Power BI ではじめよう
 
CDS が DirectQuery をサポートしたのでそれを紹介しながら新機能を紹介していきます
CDS が DirectQuery をサポートしたのでそれを紹介しながら新機能を紹介していきますCDS が DirectQuery をサポートしたのでそれを紹介しながら新機能を紹介していきます
CDS が DirectQuery をサポートしたのでそれを紹介しながら新機能を紹介していきます
 
え、毎月手作業でレポートを作ってるの?Power BI を使えば自動化できますよ!
え、毎月手作業でレポートを作ってるの?Power BI を使えば自動化できますよ!え、毎月手作業でレポートを作ってるの?Power BI を使えば自動化できますよ!
え、毎月手作業でレポートを作ってるの?Power BI を使えば自動化できますよ!
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
 
Synapse lakedatabase
Synapse lakedatabaseSynapse lakedatabase
Synapse lakedatabase
 
#経済学のための実践的データ分析 11. データのビジュアライゼーション
#経済学のための実践的データ分析 11. データのビジュアライゼーション#経済学のための実践的データ分析 11. データのビジュアライゼーション
#経済学のための実践的データ分析 11. データのビジュアライゼーション
 
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...
 
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
 
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeDevelopers.IO 2019 Effective Datalake
Developers.IO 2019 Effective Datalake
 
Tableau x Einstein 連 携 に 関 す る 勝 手 な 考 察
Tableau x Einstein 連 携 に 関 す る 勝 手 な 考 察Tableau x Einstein 連 携 に 関 す る 勝 手 な 考 察
Tableau x Einstein 連 携 に 関 す る 勝 手 な 考 察
 
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようMicrosoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
 
Data Visualization Japan Meetup 2018: 長く変化に対応する
Data Visualization Japan Meetup 2018: 長く変化に対応するData Visualization Japan Meetup 2018: 長く変化に対応する
Data Visualization Japan Meetup 2018: 長く変化に対応する
 
Mulvery@沖縄Ruby会議02
Mulvery@沖縄Ruby会議02Mulvery@沖縄Ruby会議02
Mulvery@沖縄Ruby会議02
 
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~
 
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
 
Azure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/SparkAzure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/Spark
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
 
Presto As A Service - Treasure DataでのPresto運用事例
Presto As A Service - Treasure DataでのPresto運用事例Presto As A Service - Treasure DataでのPresto運用事例
Presto As A Service - Treasure DataでのPresto運用事例
 
Preview: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
Preview: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようPreview: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
Preview: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
 

Mehr von Takahiro Inoue

トレジャーデータ流,データ分析の始め方
トレジャーデータ流,データ分析の始め方トレジャーデータ流,データ分析の始め方
トレジャーデータ流,データ分析の始め方Takahiro Inoue
 
Treasure Data Intro for Data Enthusiast!!
Treasure Data Intro for Data Enthusiast!!Treasure Data Intro for Data Enthusiast!!
Treasure Data Intro for Data Enthusiast!!Takahiro Inoue
 
Hadoop and the Data Scientist
Hadoop and the Data ScientistHadoop and the Data Scientist
Hadoop and the Data ScientistTakahiro Inoue
 
MongoDB: Intro & Application for Big Data
MongoDB: Intro & Application  for Big DataMongoDB: Intro & Application  for Big Data
MongoDB: Intro & Application for Big DataTakahiro Inoue
 
An Introduction to Fluent & MongoDB Plugins
An Introduction to Fluent & MongoDB PluginsAn Introduction to Fluent & MongoDB Plugins
An Introduction to Fluent & MongoDB PluginsTakahiro Inoue
 
An Introduction to Tinkerpop
An Introduction to TinkerpopAn Introduction to Tinkerpop
An Introduction to TinkerpopTakahiro Inoue
 
An Introduction to Neo4j
An Introduction to Neo4jAn Introduction to Neo4j
An Introduction to Neo4jTakahiro Inoue
 
The Definition of GraphDB
The Definition of GraphDBThe Definition of GraphDB
The Definition of GraphDBTakahiro Inoue
 
Large-Scale Graph Processing〜Introduction〜(完全版)
Large-Scale Graph Processing〜Introduction〜(完全版)Large-Scale Graph Processing〜Introduction〜(完全版)
Large-Scale Graph Processing〜Introduction〜(完全版)Takahiro Inoue
 
Large-Scale Graph Processing〜Introduction〜(LT版)
Large-Scale Graph Processing〜Introduction〜(LT版)Large-Scale Graph Processing〜Introduction〜(LT版)
Large-Scale Graph Processing〜Introduction〜(LT版)Takahiro Inoue
 
はじめてのGlusterFS
はじめてのGlusterFSはじめてのGlusterFS
はじめてのGlusterFSTakahiro Inoue
 
はじめてのMongoDB
はじめてのMongoDBはじめてのMongoDB
はじめてのMongoDBTakahiro Inoue
 
MongoDB & Hadoop: Flexible Hourly Batch Processing Model
MongoDB & Hadoop: Flexible Hourly Batch Processing ModelMongoDB & Hadoop: Flexible Hourly Batch Processing Model
MongoDB & Hadoop: Flexible Hourly Batch Processing ModelTakahiro Inoue
 
MongoDB: Replication,Sharding,MapReduce
MongoDB: Replication,Sharding,MapReduceMongoDB: Replication,Sharding,MapReduce
MongoDB: Replication,Sharding,MapReduceTakahiro Inoue
 
Map Reduce ~Continuous Map Reduce Design~
Map Reduce ~Continuous Map Reduce Design~Map Reduce ~Continuous Map Reduce Design~
Map Reduce ~Continuous Map Reduce Design~Takahiro Inoue
 
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜Takahiro Inoue
 
MongoDB全機能解説2
MongoDB全機能解説2MongoDB全機能解説2
MongoDB全機能解説2Takahiro Inoue
 
MongoDBで作るソーシャルデータ新解析基盤
MongoDBで作るソーシャルデータ新解析基盤MongoDBで作るソーシャルデータ新解析基盤
MongoDBで作るソーシャルデータ新解析基盤Takahiro Inoue
 

Mehr von Takahiro Inoue (20)

トレジャーデータ流,データ分析の始め方
トレジャーデータ流,データ分析の始め方トレジャーデータ流,データ分析の始め方
トレジャーデータ流,データ分析の始め方
 
Treasure Data Intro for Data Enthusiast!!
Treasure Data Intro for Data Enthusiast!!Treasure Data Intro for Data Enthusiast!!
Treasure Data Intro for Data Enthusiast!!
 
Hadoop and the Data Scientist
Hadoop and the Data ScientistHadoop and the Data Scientist
Hadoop and the Data Scientist
 
MongoDB: Intro & Application for Big Data
MongoDB: Intro & Application  for Big DataMongoDB: Intro & Application  for Big Data
MongoDB: Intro & Application for Big Data
 
An Introduction to Fluent & MongoDB Plugins
An Introduction to Fluent & MongoDB PluginsAn Introduction to Fluent & MongoDB Plugins
An Introduction to Fluent & MongoDB Plugins
 
An Introduction to Tinkerpop
An Introduction to TinkerpopAn Introduction to Tinkerpop
An Introduction to Tinkerpop
 
An Introduction to Neo4j
An Introduction to Neo4jAn Introduction to Neo4j
An Introduction to Neo4j
 
The Definition of GraphDB
The Definition of GraphDBThe Definition of GraphDB
The Definition of GraphDB
 
Large-Scale Graph Processing〜Introduction〜(完全版)
Large-Scale Graph Processing〜Introduction〜(完全版)Large-Scale Graph Processing〜Introduction〜(完全版)
Large-Scale Graph Processing〜Introduction〜(完全版)
 
Large-Scale Graph Processing〜Introduction〜(LT版)
Large-Scale Graph Processing〜Introduction〜(LT版)Large-Scale Graph Processing〜Introduction〜(LT版)
Large-Scale Graph Processing〜Introduction〜(LT版)
 
Advanced MongoDB #1
Advanced MongoDB #1Advanced MongoDB #1
Advanced MongoDB #1
 
はじめてのGlusterFS
はじめてのGlusterFSはじめてのGlusterFS
はじめてのGlusterFS
 
はじめてのMongoDB
はじめてのMongoDBはじめてのMongoDB
はじめてのMongoDB
 
MongoDB & Hadoop: Flexible Hourly Batch Processing Model
MongoDB & Hadoop: Flexible Hourly Batch Processing ModelMongoDB & Hadoop: Flexible Hourly Batch Processing Model
MongoDB & Hadoop: Flexible Hourly Batch Processing Model
 
MongoDB: Replication,Sharding,MapReduce
MongoDB: Replication,Sharding,MapReduceMongoDB: Replication,Sharding,MapReduce
MongoDB: Replication,Sharding,MapReduce
 
MongoDB Oplog入門
MongoDB Oplog入門MongoDB Oplog入門
MongoDB Oplog入門
 
Map Reduce ~Continuous Map Reduce Design~
Map Reduce ~Continuous Map Reduce Design~Map Reduce ~Continuous Map Reduce Design~
Map Reduce ~Continuous Map Reduce Design~
 
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜
 
MongoDB全機能解説2
MongoDB全機能解説2MongoDB全機能解説2
MongoDB全機能解説2
 
MongoDBで作るソーシャルデータ新解析基盤
MongoDBで作るソーシャルデータ新解析基盤MongoDBで作るソーシャルデータ新解析基盤
MongoDBで作るソーシャルデータ新解析基盤
 

Kürzlich hochgeladen

新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxAtomu Hidaka
 
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価sugiuralab
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directoryosamut
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000Shota Ito
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールプレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールsugiuralab
 

Kürzlich hochgeladen (7)

新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
 
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
 
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールプレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツール
 

この Visualization がすごい2014 〜データ世界を彩るツール6選〜

  • 1. 1   「この  Visualiza)on  ツールがすごい2014」   〜データ世界を彩る美しきツール6選〜   March 2nd, 2014 データ可視化勉強会 Presented  by       Takahiro  Inoue  –  Chief  Data  Scien:st  
  • 2. 2   Agenda 1.  2.  3.  4.  5.  6.  7.  8.  Introduc:on   Learning  Visualiza:on   表計算部門:aabel3   Takahiro   noue  –  Chief  Data   Dashboard  部門:Metric  IInsights   Scien:st   BI  部門:tableau   統計ソフト部門:ggplot2   抽象化部門:Neo4j(Graph  Database)   プログラミング部門:d3.js(省略)   Presented  by      
  • 4. 4   Introduc)on •  Takahiro  Inoue  (TwiPer:  @doryokujin  )   •  Majored  in  Mathema:cs  in  Keio  University   •  Chief  Data  Scien:st  and  Solu:on  Architect  @  Treasure-­‐Data   Presented  by       •  Leader  of  Japanese  MongoDB  Community,  MData  Scien:st   Takahiro  Inoue  –  Chief   ongo  Masters   •  doryokujin’s  blog  hPp://doryokujin.hatenablog.jp/  
  • 5. 5   Treasure  Data  Introduc)on Data Collection Data Storage Data Analysis Company & Product Over View Web logs Treasure Agent App logs Streaming Log ! Collector (JSON)! Sensor Cloud DB, Web App, & Command Line BI Connectivity Flexible, Scalable, Columnar Storage! Presented  by   REST API, SQL, Pig, JDBC / ODBC! Tableau, Metric Insights, BI Tools Dr.Sum, Excel, etc. New!! Treasure Viewer     Treasure Batch Query Takahiro  Inoue  –  Chief  Data  Scien:st   & New!! Treasure Query Accelerator RDBMS Bulk Import CRM Parallel Upload from CSV, MySQL, etc.! ERP Time to Value Value  Proposi)on  1 New!! Management Console No Command Line,! Every Operation is Here! ! Economy & Flexibility Value  Proposi)on  2 Result Push REST API, SQL, Pig! Dashboards Custom App, Local DB, FTP Server, etc. Simple & Supported Value  Proposi)on  3
  • 6. 6   M  x  N  通りのデータ収集・活用方法

  • 7. 7   Fluentd:  M  +  N  通りに経路を集約して簡素化 Access logs Apache Alerting Nagios App logs Frontend Backend Analysis MongoDB MySQL Hadoop System logs syslogd Databases filter / buffer / routing Archiving Amazon S3
  • 8. 8   Data Analysis REST  API   Heavy  LiKing  SQL  (Hive):   -­‐  Hive’s  Built-­‐in  UDFs   -­‐  TD  Added  Func:ons:   -­‐  Time  Func:ons   -­‐  First,  Last,  Rank   -­‐  Sessionize   Scheduled  Jobs   -­‐  SQL,  Pig  Scripts   -­‐  Data  Pushes   JDBC  Connec)vity:   -­‐  Custom  Java  Apps   -­‐  Standards-­‐based   -­‐  BI  Tool  Integra:on   Tableau  ODBC  connector   -­‐  Leverages  Impala   Interac)ve  SQL   Treasure  Query  Accelerator     (Impala)   Scripted  Processing  (Pig):   -­‐  DataFu  (LinkedIn)   -­‐  Piggybank  (Apache)   Push  Query  Results:   -­‐  MySQL,  PostgreSQL   -­‐  Google  Spreadsheet   -­‐  Web,  FTP,  S3   -­‐  Lecronic,  Indicee   -­‐  Treasure  Data  Table  
  • 9. 9   2.  Learning  Visualiza)on  
  • 10. 10   Visualiza)on  Types(入力データに基づく分類) ScaUer  Plot   N-­‐Dimensional  Graph   Map  Plot   Aggregated   Data   Cross  Tables   Raw  Data   2-­‐Dimensional  Graph   Math  Graph   Analyzed   Data   Sta)s)cal  Graph  
  • 11. 11   Raw  Data  Explana)on ScaUer  Plot(散布図)   (for  Rawdata)     データレコードの任意の数値変数2項目 をプロットし,関係を発見する。 Map  Plot   (for  Rawdata)     位置情報(緯度,経度)を持つデータポ イントを地図上にマッピングし,データの 密集度などを参考にする。 Math  Graph   (for  Rawdata)     データの「関係」を数学的グラフによって 表現。
  • 12. 12   Processed  Data  Explana)on 2-­‐Dimensional  Graph   (for  aggregated  data)     主に  X-­‐軸,Y-­‐軸 (,Y2-­‐軸)を用いて表現さ れる,バーグラフや円グラフなどの平面 チャート。 N-­‐Dimensional  Graph   (for  cross  tables)     X-­‐軸,Y-­‐軸,Z-­‐軸 を用いて表現されるグ ラフ。Z-­‐軸は半径や色,奥行き,凡例な どによって表現される。 Sta)s)cal  Graph   (for  analyzed  data)     統計分析によって導いた分布やモデル, パターンなどを図示する。
  • 13. 13   Graphの種類とツールの対応表 表計算 ScaUer  Plot   2-­‐Dimensional  Graph   N-­‐Dimensional  Graph   Sta)s)cal  Graph   ScaUer  Plot   2-­‐Dimensional  Graph   N-­‐Dimensional  Graph   Sta)s)cal  Graph   ScaUer  Plot   2-­‐Dimensional  Graph   統計ソフト Dashboard BI プログラミングラ イブラリ Map  Plot   ScaUer  Plot   抽象化 Math  Graph   2-­‐Dimensional  Graph   N-­‐Dimensional  Graph   Map  Plot   2-­‐Dimensional  Graph   N-­‐Dimensional  Graph  
  • 14. 14   Processed  Data  Explana)on 部門 ツール名 OS 描画手続き 表計算 aabel3 Mac Chart  Library 統計ソフト ggplot2  (R  Library) Windows,  Mac,  Linux The  Grammar  of  Graphics   +  Layer  of  Graphics Dashboard Metric  Insights Web  UI Widget  Tutorial  /   Chart  Library  &  Import  JS BI Tableau Windows VizQL プログラミン D3.js    (JavaScript) -­‐ グライブラリ 抽象化 Neo4j  (Java:  Graph   -­‐ Database) Data  Driven  Documents Property  Graph
  • 15. 15   3.  表計算部門   •  aabel3  
  • 16. 16   表計算部門:aabel3 •  数々の統計手法、探究的データ解析手法を提供。 •  複数の多変量データを容易にデータ整理可能。 •  リアルタイムの双方向インタラクティブデータ作用 を可能にし、多変量データ解析を容易にするユ ニークなパイプラインデザインを装備。 •  インタラクティブな可視化機能、数多くのグラフタイ プ、240  以上のデータプレゼンテーションスタイル を用意。 •  数値データ管理ツール、フォーミュラエディタなど のユーティリティを装備したネイティブワークシート。 •  さまざまなデータインポート、グラフィックファイル エクスポート、データマニピュレータ、フレキシブル なカスタマイズツール、Unicode  対応、出版品質の グラフィックなど研究、調査に必要なツールを装備。
  • 18. 18   描画手続き:Chart  Library •  多様性:あらゆるVisualiza:on・統計メソッドを装備。   •  容易性:チュートリアルに従ってあらゆる図が描ける。   •  ワークシート:エクセルと同じようにワークシートによるデータ編集,抽出が可能。
  • 21. 21   4.  Dashboard  部門   •  Metric  Insights  
  • 23. 23   Dashboard部門:Metric  Insights •  毎日更新される  KPI  を素早く参照可能。 •  異常検出機能,およびアラート機能。 チャートへのアノテーション機能。 •  Smart  Phone  や Tablet  からも綺麗に描 画できる。 •  D3.js,  Google  Chart,  Higcharts  などのJSライブ ラリをインポート可能→インタラクティブな図 •  (任意の時間インターバルでの)データ自動 更新機能。 •  素早く編集可能な互いに独立したパネル (ウィジェット)を持っている。   •  様々なデータベース・ファイル形式と接続でき るコネクタを装備。  
  • 24. 24   描画手続き:Widget  Tutorial 1. 集計インターバ ルを設定 2. メジャーの種類 を設定 3. カテゴリを設定
  • 25. 25   描画手続き:Widget  Tutorial 4. Plug-inを選択 5. 接続するデー タソースを指定 6. クエリを記述 7. Sample Result を確認
  • 29. 29   5.  BI(Business  Intelligence) 部門   •  Tableau  
  • 32. 32   Dashboard  (MI)  と  BI  (Tableau)  の違い Dashboard ( Metric Insights ) BI  (  Tableau  ) •  毎日更新されるデータ (KPI) を素早く参照する ため 解析者に関わらず全てのユーザーが参照する ため 異常値やイベントなどの効果を素早く把握する ため Smart Phone や Tablet からも参照するため •  異常検出機能,およびアラート機能を備えてい ること チャートへのアノテーション機能を備えているこ と チャートの一覧性・わかりやすさを重視してい ること (任意の時間インターバルでの)データ自動更 新機能を持っていること 素早く編集可能な互いに独立したパネル(ウィ ジェット)を持っていること 様々なデータベース・ファイル形式と接続でき るコネクタを備えていること •  •  •  目的 •  •  •  •  •  要請 •  •  •  •  •  •  •  •  •  様々の切り口・セグメントの組合せでデータを閲覧す るため インタラクティブな操作でドリルダウンや軸の切り替 えを行うため 様々なチャートとテーブルを組合せた情報表現を行 うため プレゼンに耐えうるクオリティの高いレポートを作成 するため インタラクティブな操作が可能なこと 豊富なチャートライブラリ,ダッシュボードエディタの 実装していること 最適化された中間データ構造(Data Cubeなど)を備 えていること マウス操作によってデータの深堀りや切り口の切り 替えが可能なこと JDBC / ODBC コネクタを初めとした様々なデータソー スとの接続口を持つこと
  • 36. 36   Video  Tutorial   hPp://youtu.be/vh9v76e95GY
  • 39. 39   6.  統計ソフト部門   •  ggplot2  
  • 40. 40   統計ソフト部門:ggplot2 •  ggplot2はRのパッケージ。   •  “The  Grammar  of  Graphics”:文法に基づいた柔軟 な描画が可能。 •  ありあわせのChart  Libraryから選択するのではな く,文法に基づいて現状の問題にあった描画が可 能。 •  The  Grammar  of  Graphicsをさらに拡張し,「レイ ヤー」という概念を導入。 •  豊富な書籍,ドキュメント
  • 41. 41   描画手続き:The  Grammar  of  Graphics 要素   名前   説明   data   データ   ビジュアル化したい対象。   geom 幾何学的オ ブジェクト プロット上のタイプを決める。 {  point,  bar,  boxplot,  line  }   stat 統計的変換 データをようやくする様々な方法。オプ ション。 {  density,  boxplot,  smooth,  histogram  } scale スケール データを「位置」と「カラー」にマッピング する。 {  x=0.037,  y=0.531,  colour=#FF6C91  } coord 座標系 オブジェクトの位置を指定された座標 系の上にプロット平面にマッピング。 {  Cartesian,  Map,  Polar  } facet トリレス・プロットの一般化。データ全体 から異なる部分集合を抽出する。 ファセット 例  
  • 42. 42   描画手続き:Layer  of  Graphics •  レイヤー文法は次の成分の組み合わせから成る:    {  data,  mapping,  geom,  stat,  posi:on  }   •  プロットにレイヤーを重ねるには  “+”  を使う。 一般のグラフィクスライブラ リでの作図例。1つの層に あらゆる成分を置く。 Ggplot2ではそれぞれの層 に成分を置いていく。 図の参照先
  • 43. 43   描画手続き:Layer  of  Graphics #  ggplot2に入っている乗用車の燃費データ   $  ?mpg   $  summary(mpg)     $  p  <-­‐  ggplot(mpg,  aes(displ,  hwy))   #  geom  成分を与えることで始めて描画される   $  p  +  geom_point()     #  geom  成分として  line  を重ねる。散布図と折れ線の描画   $  ggplot(mpg,  aes(displ,  hwy))+          geom_point()+          geom_line()     #  cyl  (  =  シリンダ数)  をfactorにした色分けを行う   $  ggplot(mpg,  aes(displ,  hwy))+          geom_point()+          geom_line(aes(color  =  factor(cyl)))      
  • 44. 44   描画手続き:Layer  of  Graphics #ファセットの追加,2×2の sccater  matrix   $  ggplot(data  =  gender.comp,  aes(Male,  Female))+          geom_abline(colour  =  "grey80")+          geom_point(alpha  =  0.6)+          facet_wrap(~Measure,  scales  =  "free")    
  • 45. 45   7.  抽象化部門   •  Neo4j  (Graph  Database)