SlideShare ist ein Scribd-Unternehmen logo
1 von 8
Downloaden Sie, um offline zu lesen
2
各種デバイス Event Hub Stream
Analytics
SQL DB /
SQL DWH
Data Lake
Store
Power BI
(or 他 BI ツール or カスタムアプリ)
SQL (SSAS)
In-Memory
Data Lake
Analytics
Machine
Learning
R Server
HDInsight
(他 Hadoop)
ニアリアルタイム
処理
バッチ処理
3
入力データをその後の処理 (BI / データ分析) で必要な項目、件数に集
約する。大規模な入力を より小規模な出力にする。
例) デバイスからの 1 億件のデータを 1000 件程度に集約して保存
「どの項目」を「どの程度の間隔で集約して」 後続工程 (BI / データ
分析) で参照したいかを事前に設計する必要がある
※ トップダウンアプローチ
デバイスから受けとったデータを、そのまま or メタデータを追加して
保存する。大規模な入力を大規模なまま出力する。
例) デバイスからの入力 1 億件ごとに テキストファイルとして保存
保存したデータをどのように分析するかが明確でない場合、一定期間
アーカイブしておく必要がある場合は、こちらを選択する
※ ボトムアップアプローチ
4
基本 数秒程度の即時応答 (オンライン処理) を前提とした
データ ストアサービス。
Table Storage は REST API、DocDB は REST API (JSON)
HBase は SQL Like なクエリでアクセスを行う。
一般的には SQL Database が使用される。
大規模な環境では “Elastic Database pools” の使用を検討する。
基本 バッチ処理を前提としたデータ ストアサービス。
「数秒での応答」という要求にはそぐわない。
テーブル定義を決めて設計する「トップダウンアプローチ」な
SQL DWH と、格納後に利用方法を検討する「ボトムアップア
プローチ」な Data Lake Store を一般的には利用する。
Hadoop の実装を管理したい場合は HDInsight を選択する。
Blob ストレージは、一般的には一方的な出力 (ログ出力、アー
カイブ等) で利用する。
5
No. SQL or
NoSQL
オンライン処理 (基幹系、フロント系) 分析処理 (情報系)
1. NoSQL ・ドキュメント データベース
(DocDB, MongoDB)
・KVS – Key Value Store
(Azure Table Storage, Riak)
・列指向ストア
(Apache HBase, Apache Cassandra)
・分散処理基盤
(Azure Data Lake Store,
各種 Hadoop ディストリビューション,
(HDInsight))
・分析用インタフェース、ライブラリ
(Azure Data Lake Analytics,
Apache Spark (Spark SQL, Pyspark))
2. SQL ・RDMBS
(Azure SQL Database, SQL Server on IaaS)
・MPP DWH
(Azure SQL DWH)
6
No. サービス 種類 インタ
フェース
セカンダリ
インデックス
トランザクション
サポート
ストアドプロシージャ
やトリガーの実装
1. Azure
SQL Database
RDBMS SQL あり 全てのテーブルの
各行単位
SQL (T-SQL) で実
装
2. Azure DocumentDB ドキュメン
トストア
拡張SQL あり 同一コレクション
内のドキュメント
単位
Javascript で実装
3. Azure
Table Storage
KVS
キーバ
リュースト
ア
OData クエリ なし 同一パーティショ
ン内のエンティ
ティ単位
なし
4. Apache HBase 列指向スト
ア
なし なし 同一行内の全ての
セル単位
Java で実装
7
SQL DWH は Blob ストレージのファイルをテーブルに取込を行う機能
を保持している (Polybase 機能)
Blob ストレージの特定のコンテナ(フォルダ パス) 配下のファイルを
再帰的に読み込んで SQL DWH にロードできる。そのため、SQL DWH
にデータ取込する時間間隔 (例: 1 時間) ごとにフォルダ名を定義する
ことを検討する (例: 20151112_0900)
但し、全デバイス分 格納してロードが間に合わない場合は、入力種
別ごとなど (例: TV など) でフォルダを別にする (例: TV_20151112_0900)
Data Lake Store は管理された Web HDFS サービスであり、ディレクト
リ構成を作ってファイル保存する
但し、HDFS は大きなサイズのファイルで より効果を発揮するため、
ファイル結合を考慮した方が良い
(Data Lake Analytics を使えば、多数の小サイズファイルを1 つの大きなファイルにクエ
リ 1 つで結合でき、且つ分散処理として実行できる)
8
 本書に記載した情報は、本書各項目に関する発行日現在の Microsoft の見解を表明するものです。Microsoftは絶えず変化する市場に対応しなければならないため、
ここに記載した情報に対していかなる責務を負うものではなく、提示された情報の信憑性については保証できません。
 本書は情報提供のみを目的としています。 Microsoft は、明示的または暗示的を問わず、本書にいかなる保証も与えるものではありません。
 すべての当該著作権法を遵守することはお客様の責務です。Microsoftの書面による明確な許可なく、本書の如何なる部分についても、転載や検索システムへの格納または挿入を行うことは、どのような形式または手段(電子的、
機械的、複写、レコーディング、その他)、および目的であっても禁じられています。
これらは著作権保護された権利を制限するものではありません。
 Microsoftは、本書の内容を保護する特許、特許出願書、商標、著作権、またはその他の知的財産権を保有する場合があります。Microsoftから書面によるライセンス契約が明確に供給される場合を除いて、本書の提供はこれらの
特許、商標、著作権、またはその他の知的財産へのライセンスを与えるものではありません。
© 2015 Microsoft Corporation. All rights reserved.
Microsoft, Windows, その他本文中に登場した各製品名は、Microsoft Corporation の米国およびその他の国における登録商標または商標です。
その他、記載されている会社名および製品名は、一般に各社の商標です。

Weitere ähnliche Inhalte

Andere mochten auch

List Engineering Skills
List Engineering SkillsList Engineering Skills
List Engineering SkillsSV.CO
 
What is SaaS?
What is SaaS?What is SaaS?
What is SaaS?SV.CO
 
How to deploy & operate OpenStack Production
How to deploy & operate OpenStack ProductionHow to deploy & operate OpenStack Production
How to deploy & operate OpenStack ProductionVirtualTech Japan Inc.
 
An introduction to application of zebra pattern for dissipation of heat in el...
An introduction to application of zebra pattern for dissipation of heat in el...An introduction to application of zebra pattern for dissipation of heat in el...
An introduction to application of zebra pattern for dissipation of heat in el...Sumit Dharmarao
 
Bron Kerbosch Algorithm - Presentation by Jun Zhai, Tianhang Qiang and Yizhen...
Bron Kerbosch Algorithm - Presentation by Jun Zhai, Tianhang Qiang and Yizhen...Bron Kerbosch Algorithm - Presentation by Jun Zhai, Tianhang Qiang and Yizhen...
Bron Kerbosch Algorithm - Presentation by Jun Zhai, Tianhang Qiang and Yizhen...Amrinder Arora
 
ユークリッド距離以外の距離で教師無しクラスタリング
ユークリッド距離以外の距離で教師無しクラスタリングユークリッド距離以外の距離で教師無しクラスタリング
ユークリッド距離以外の距離で教師無しクラスタリングMaruyama Tetsutaro
 
Technologies for Data Analytics Platform
Technologies for Data Analytics PlatformTechnologies for Data Analytics Platform
Technologies for Data Analytics PlatformN Masahiro
 
TokyoR_21: テキストマイニングで見る『機動戦士ガンダム』
TokyoR_21: テキストマイニングで見る『機動戦士ガンダム』TokyoR_21: テキストマイニングで見る『機動戦士ガンダム』
TokyoR_21: テキストマイニングで見る『機動戦士ガンダム』Yuichiro Kobayashi
 
RECURSION IN C
RECURSION IN C RECURSION IN C
RECURSION IN C v_jk
 
Graph Traversal Algorithms - Breadth First Search
Graph Traversal Algorithms - Breadth First SearchGraph Traversal Algorithms - Breadth First Search
Graph Traversal Algorithms - Breadth First SearchAmrinder Arora
 
CD(継続的デリバリー)手法を用いたサーバシステム構築の自動化 - OpenStack最新情報セミナー(2016年12月)
CD(継続的デリバリー)手法を用いたサーバシステム構築の自動化 - OpenStack最新情報セミナー(2016年12月)CD(継続的デリバリー)手法を用いたサーバシステム構築の自動化 - OpenStack最新情報セミナー(2016年12月)
CD(継続的デリバリー)手法を用いたサーバシステム構築の自動化 - OpenStack最新情報セミナー(2016年12月)VirtualTech Japan Inc.
 
Prospecting drip email campaign
Prospecting drip email campaignProspecting drip email campaign
Prospecting drip email campaignYesware
 
CET (Capture EveryThing)プロジェクトにおける機械学習・データマイニング最前線
CET (Capture EveryThing)プロジェクトにおける機械学習・データマイニング最前線CET (Capture EveryThing)プロジェクトにおける機械学習・データマイニング最前線
CET (Capture EveryThing)プロジェクトにおける機械学習・データマイニング最前線Recruit Lifestyle Co., Ltd.
 
Orchestration Tool Roundup - Arthur Berezin & Trammell Scruggs
Orchestration Tool Roundup - Arthur Berezin & Trammell ScruggsOrchestration Tool Roundup - Arthur Berezin & Trammell Scruggs
Orchestration Tool Roundup - Arthur Berezin & Trammell ScruggsCloud Native Day Tel Aviv
 
Construction of the Digipak
 Construction of the Digipak  Construction of the Digipak
Construction of the Digipak dorcasfaida
 

Andere mochten auch (19)

List Engineering Skills
List Engineering SkillsList Engineering Skills
List Engineering Skills
 
02 offline file
02 offline file02 offline file
02 offline file
 
What is SaaS?
What is SaaS?What is SaaS?
What is SaaS?
 
How to deploy & operate OpenStack Production
How to deploy & operate OpenStack ProductionHow to deploy & operate OpenStack Production
How to deploy & operate OpenStack Production
 
An introduction to application of zebra pattern for dissipation of heat in el...
An introduction to application of zebra pattern for dissipation of heat in el...An introduction to application of zebra pattern for dissipation of heat in el...
An introduction to application of zebra pattern for dissipation of heat in el...
 
Spark summit 2016 recap
Spark summit 2016 recapSpark summit 2016 recap
Spark summit 2016 recap
 
Bron Kerbosch Algorithm - Presentation by Jun Zhai, Tianhang Qiang and Yizhen...
Bron Kerbosch Algorithm - Presentation by Jun Zhai, Tianhang Qiang and Yizhen...Bron Kerbosch Algorithm - Presentation by Jun Zhai, Tianhang Qiang and Yizhen...
Bron Kerbosch Algorithm - Presentation by Jun Zhai, Tianhang Qiang and Yizhen...
 
ユークリッド距離以外の距離で教師無しクラスタリング
ユークリッド距離以外の距離で教師無しクラスタリングユークリッド距離以外の距離で教師無しクラスタリング
ユークリッド距離以外の距離で教師無しクラスタリング
 
DBTS2015_B35_SQLServer2016
DBTS2015_B35_SQLServer2016DBTS2015_B35_SQLServer2016
DBTS2015_B35_SQLServer2016
 
Technologies for Data Analytics Platform
Technologies for Data Analytics PlatformTechnologies for Data Analytics Platform
Technologies for Data Analytics Platform
 
TokyoR_21: テキストマイニングで見る『機動戦士ガンダム』
TokyoR_21: テキストマイニングで見る『機動戦士ガンダム』TokyoR_21: テキストマイニングで見る『機動戦士ガンダム』
TokyoR_21: テキストマイニングで見る『機動戦士ガンダム』
 
RECURSION IN C
RECURSION IN C RECURSION IN C
RECURSION IN C
 
Graph Traversal Algorithms - Breadth First Search
Graph Traversal Algorithms - Breadth First SearchGraph Traversal Algorithms - Breadth First Search
Graph Traversal Algorithms - Breadth First Search
 
CD(継続的デリバリー)手法を用いたサーバシステム構築の自動化 - OpenStack最新情報セミナー(2016年12月)
CD(継続的デリバリー)手法を用いたサーバシステム構築の自動化 - OpenStack最新情報セミナー(2016年12月)CD(継続的デリバリー)手法を用いたサーバシステム構築の自動化 - OpenStack最新情報セミナー(2016年12月)
CD(継続的デリバリー)手法を用いたサーバシステム構築の自動化 - OpenStack最新情報セミナー(2016年12月)
 
Prospecting drip email campaign
Prospecting drip email campaignProspecting drip email campaign
Prospecting drip email campaign
 
CET (Capture EveryThing)プロジェクトにおける機械学習・データマイニング最前線
CET (Capture EveryThing)プロジェクトにおける機械学習・データマイニング最前線CET (Capture EveryThing)プロジェクトにおける機械学習・データマイニング最前線
CET (Capture EveryThing)プロジェクトにおける機械学習・データマイニング最前線
 
Orchestration Tool Roundup - Arthur Berezin & Trammell Scruggs
Orchestration Tool Roundup - Arthur Berezin & Trammell ScruggsOrchestration Tool Roundup - Arthur Berezin & Trammell Scruggs
Orchestration Tool Roundup - Arthur Berezin & Trammell Scruggs
 
PMP_Project Risk Management
PMP_Project Risk ManagementPMP_Project Risk Management
PMP_Project Risk Management
 
Construction of the Digipak
 Construction of the Digipak  Construction of the Digipak
Construction of the Digipak
 

Ähnlich wie Azure データサービスデザイン検討 (2015/10)

Treasure Data Intro for Data Enthusiast!!
Treasure Data Intro for Data Enthusiast!!Treasure Data Intro for Data Enthusiast!!
Treasure Data Intro for Data Enthusiast!!Takahiro Inoue
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューションDell TechCenter Japan
 
[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lake
[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lake[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lake
[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lakede:code 2017
 
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)Kensuke SAEKI
 
トレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解するトレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解するTakahiro Inoue
 
ビジネスインテリジェンス入門~OSSでBIを始めよう~
ビジネスインテリジェンス入門~OSSでBIを始めよう~ビジネスインテリジェンス入門~OSSでBIを始めよう~
ビジネスインテリジェンス入門~OSSでBIを始めよう~Kensuke SAEKI
 
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...Insight Technology, Inc.
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data PlatformNaoki (Neo) SATO
 
72 article1%20%281%29
72 article1%20%281%2972 article1%20%281%29
72 article1%20%281%29浩一 望月
 
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~Yugo Shimizu
 
Sbc odps 200_data_works_handson_ver1.0
Sbc odps 200_data_works_handson_ver1.0Sbc odps 200_data_works_handson_ver1.0
Sbc odps 200_data_works_handson_ver1.0洋 謝
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例Tetsutaro Watanabe
 
データを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とはデータを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とはgriddb
 
20130612 ibm big_dataseminar_streams
20130612 ibm big_dataseminar_streams20130612 ibm big_dataseminar_streams
20130612 ibm big_dataseminar_streamsAtsushi Tsuchiya
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナーmtanaka0111
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoTreasure Data, Inc.
 

Ähnlich wie Azure データサービスデザイン検討 (2015/10) (20)

Treasure Data Intro for Data Enthusiast!!
Treasure Data Intro for Data Enthusiast!!Treasure Data Intro for Data Enthusiast!!
Treasure Data Intro for Data Enthusiast!!
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
 
[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lake
[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lake[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lake
[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lake
 
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
 
トレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解するトレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解する
 
ビジネスインテリジェンス入門~OSSでBIを始めよう~
ビジネスインテリジェンス入門~OSSでBIを始めよう~ビジネスインテリジェンス入門~OSSでBIを始めよう~
ビジネスインテリジェンス入門~OSSでBIを始めよう~
 
Big Data Architecture 全体概要
Big Data Architecture 全体概要Big Data Architecture 全体概要
Big Data Architecture 全体概要
 
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
 
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
 
72 article1%20%281%29
72 article1%20%281%2972 article1%20%281%29
72 article1%20%281%29
 
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~
開発者におくる Power BI を使う時に考えるべきアーキテクチャ ~ データを溜めるのは誰だ? ~
 
Sbc odps 200_data_works_handson_ver1.0
Sbc odps 200_data_works_handson_ver1.0Sbc odps 200_data_works_handson_ver1.0
Sbc odps 200_data_works_handson_ver1.0
 
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
AI・HPC・ビッグデータで利用される分散ファイルシステムを知るAI・HPC・ビッグデータで利用される分散ファイルシステムを知る
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例
 
データを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とはデータを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とは
 
20130612 ibm big_dataseminar_streams
20130612 ibm big_dataseminar_streams20130612 ibm big_dataseminar_streams
20130612 ibm big_dataseminar_streams
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナー
 
Pentaho
PentahoPentaho
Pentaho
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
 

Mehr von Koichiro Sasaki

SQL Server 2016 R Services + Microsoft R Server 技術資料
SQL Server 2016 R Services + Microsoft R Server 技術資料SQL Server 2016 R Services + Microsoft R Server 技術資料
SQL Server 2016 R Services + Microsoft R Server 技術資料Koichiro Sasaki
 
Microsoft Cognitive Services 概要
Microsoft Cognitive Services 概要Microsoft Cognitive Services 概要
Microsoft Cognitive Services 概要Koichiro Sasaki
 
Microsoft Bot framework 概要
Microsoft Bot framework 概要Microsoft Bot framework 概要
Microsoft Bot framework 概要Koichiro Sasaki
 
SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能
SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能
SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能Koichiro Sasaki
 
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京Koichiro Sasaki
 
20160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #520160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #5Koichiro Sasaki
 
センサーデバイスのデータを使った Microsoft Azure Machine Learning 実装入門
センサーデバイスのデータを使った Microsoft Azure Machine Learning 実装入門センサーデバイスのデータを使った Microsoft Azure Machine Learning 実装入門
センサーデバイスのデータを使った Microsoft Azure Machine Learning 実装入門Koichiro Sasaki
 
SQL Server パフォーマンス問題対処 Deep Dive
SQL Server パフォーマンス問題対処 Deep DiveSQL Server パフォーマンス問題対処 Deep Dive
SQL Server パフォーマンス問題対処 Deep DiveKoichiro Sasaki
 

Mehr von Koichiro Sasaki (8)

SQL Server 2016 R Services + Microsoft R Server 技術資料
SQL Server 2016 R Services + Microsoft R Server 技術資料SQL Server 2016 R Services + Microsoft R Server 技術資料
SQL Server 2016 R Services + Microsoft R Server 技術資料
 
Microsoft Cognitive Services 概要
Microsoft Cognitive Services 概要Microsoft Cognitive Services 概要
Microsoft Cognitive Services 概要
 
Microsoft Bot framework 概要
Microsoft Bot framework 概要Microsoft Bot framework 概要
Microsoft Bot framework 概要
 
SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能
SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能
SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能
 
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
 
20160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #520160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #5
 
センサーデバイスのデータを使った Microsoft Azure Machine Learning 実装入門
センサーデバイスのデータを使った Microsoft Azure Machine Learning 実装入門センサーデバイスのデータを使った Microsoft Azure Machine Learning 実装入門
センサーデバイスのデータを使った Microsoft Azure Machine Learning 実装入門
 
SQL Server パフォーマンス問題対処 Deep Dive
SQL Server パフォーマンス問題対処 Deep DiveSQL Server パフォーマンス問題対処 Deep Dive
SQL Server パフォーマンス問題対処 Deep Dive
 

Kürzlich hochgeladen

新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxAtomu Hidaka
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000Shota Ito
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directoryosamut
 
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価sugiuralab
 
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールプレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールsugiuralab
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 

Kürzlich hochgeladen (8)

新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
 
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価
 
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールプレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツール
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
 

Azure データサービスデザイン検討 (2015/10)

  • 1.
  • 2. 2 各種デバイス Event Hub Stream Analytics SQL DB / SQL DWH Data Lake Store Power BI (or 他 BI ツール or カスタムアプリ) SQL (SSAS) In-Memory Data Lake Analytics Machine Learning R Server HDInsight (他 Hadoop) ニアリアルタイム 処理 バッチ処理
  • 3. 3 入力データをその後の処理 (BI / データ分析) で必要な項目、件数に集 約する。大規模な入力を より小規模な出力にする。 例) デバイスからの 1 億件のデータを 1000 件程度に集約して保存 「どの項目」を「どの程度の間隔で集約して」 後続工程 (BI / データ 分析) で参照したいかを事前に設計する必要がある ※ トップダウンアプローチ デバイスから受けとったデータを、そのまま or メタデータを追加して 保存する。大規模な入力を大規模なまま出力する。 例) デバイスからの入力 1 億件ごとに テキストファイルとして保存 保存したデータをどのように分析するかが明確でない場合、一定期間 アーカイブしておく必要がある場合は、こちらを選択する ※ ボトムアップアプローチ
  • 4. 4 基本 数秒程度の即時応答 (オンライン処理) を前提とした データ ストアサービス。 Table Storage は REST API、DocDB は REST API (JSON) HBase は SQL Like なクエリでアクセスを行う。 一般的には SQL Database が使用される。 大規模な環境では “Elastic Database pools” の使用を検討する。 基本 バッチ処理を前提としたデータ ストアサービス。 「数秒での応答」という要求にはそぐわない。 テーブル定義を決めて設計する「トップダウンアプローチ」な SQL DWH と、格納後に利用方法を検討する「ボトムアップア プローチ」な Data Lake Store を一般的には利用する。 Hadoop の実装を管理したい場合は HDInsight を選択する。 Blob ストレージは、一般的には一方的な出力 (ログ出力、アー カイブ等) で利用する。
  • 5. 5 No. SQL or NoSQL オンライン処理 (基幹系、フロント系) 分析処理 (情報系) 1. NoSQL ・ドキュメント データベース (DocDB, MongoDB) ・KVS – Key Value Store (Azure Table Storage, Riak) ・列指向ストア (Apache HBase, Apache Cassandra) ・分散処理基盤 (Azure Data Lake Store, 各種 Hadoop ディストリビューション, (HDInsight)) ・分析用インタフェース、ライブラリ (Azure Data Lake Analytics, Apache Spark (Spark SQL, Pyspark)) 2. SQL ・RDMBS (Azure SQL Database, SQL Server on IaaS) ・MPP DWH (Azure SQL DWH)
  • 6. 6 No. サービス 種類 インタ フェース セカンダリ インデックス トランザクション サポート ストアドプロシージャ やトリガーの実装 1. Azure SQL Database RDBMS SQL あり 全てのテーブルの 各行単位 SQL (T-SQL) で実 装 2. Azure DocumentDB ドキュメン トストア 拡張SQL あり 同一コレクション 内のドキュメント 単位 Javascript で実装 3. Azure Table Storage KVS キーバ リュースト ア OData クエリ なし 同一パーティショ ン内のエンティ ティ単位 なし 4. Apache HBase 列指向スト ア なし なし 同一行内の全ての セル単位 Java で実装
  • 7. 7 SQL DWH は Blob ストレージのファイルをテーブルに取込を行う機能 を保持している (Polybase 機能) Blob ストレージの特定のコンテナ(フォルダ パス) 配下のファイルを 再帰的に読み込んで SQL DWH にロードできる。そのため、SQL DWH にデータ取込する時間間隔 (例: 1 時間) ごとにフォルダ名を定義する ことを検討する (例: 20151112_0900) 但し、全デバイス分 格納してロードが間に合わない場合は、入力種 別ごとなど (例: TV など) でフォルダを別にする (例: TV_20151112_0900) Data Lake Store は管理された Web HDFS サービスであり、ディレクト リ構成を作ってファイル保存する 但し、HDFS は大きなサイズのファイルで より効果を発揮するため、 ファイル結合を考慮した方が良い (Data Lake Analytics を使えば、多数の小サイズファイルを1 つの大きなファイルにクエ リ 1 つで結合でき、且つ分散処理として実行できる)
  • 8. 8  本書に記載した情報は、本書各項目に関する発行日現在の Microsoft の見解を表明するものです。Microsoftは絶えず変化する市場に対応しなければならないため、 ここに記載した情報に対していかなる責務を負うものではなく、提示された情報の信憑性については保証できません。  本書は情報提供のみを目的としています。 Microsoft は、明示的または暗示的を問わず、本書にいかなる保証も与えるものではありません。  すべての当該著作権法を遵守することはお客様の責務です。Microsoftの書面による明確な許可なく、本書の如何なる部分についても、転載や検索システムへの格納または挿入を行うことは、どのような形式または手段(電子的、 機械的、複写、レコーディング、その他)、および目的であっても禁じられています。 これらは著作権保護された権利を制限するものではありません。  Microsoftは、本書の内容を保護する特許、特許出願書、商標、著作権、またはその他の知的財産権を保有する場合があります。Microsoftから書面によるライセンス契約が明確に供給される場合を除いて、本書の提供はこれらの 特許、商標、著作権、またはその他の知的財産へのライセンスを与えるものではありません。 © 2015 Microsoft Corporation. All rights reserved. Microsoft, Windows, その他本文中に登場した各製品名は、Microsoft Corporation の米国およびその他の国における登録商標または商標です。 その他、記載されている会社名および製品名は、一般に各社の商標です。