【エンジニア 情報収集】Google Cloud Summit 2019 レポート
先日9月25日に開催されたGoogle Cloud Summit 2019の参加レポートです。
基調講演
みんなの銀行
システムをスクラッチで開発
GCPを選択した理由
スケーラビリティと安定性
大阪ガスの取り組み
クラウドに開発環境
時間コストの削減
製薬業界
1時間ダウンで3億の損失
ステークホルダが増えるほど、
ダウンの可能性も増える
ロックインのないフレキシブルな選択肢
Google cloudのセキュリティ
データの透明性
chromebookはセキュアな端末
BigQuery活用例
パーソルキャリア 人材サービス会社
イニシャルコストは不要
間接費用のコストはクラウドエースさんと組んでうまく抑えた。1年間のPoCで実現。
TrueData ポイントカードの仕組みの会社
クラウドへ移行
ユーザ数増大
Gオーダーのデータを数分で処理(BigQuery)
シャーディング(Google独自の技術)の工夫
これからはじめる方へ
BigqueryはSQLが書ける方ならとっつきやすい
データクレンジング、パイプライン、その辺の機能も充実している
GCP だから出来た、働き方改革を実現するソフトバンク開発のソリューションと事例,
future stride パブリッククラウド比較
https://www.softbank.jp/biz/future_stride/entry/technology/20180509/
CLIP 社員のPC利用状況の可視化
SAP 基幹システムを GCP へ 〜技術概要と事例のご紹介〜
2025年問題
サポート切れの問題
SAP クラウド化でコストが削減
SAPとは?
SAPには「販売」「生産」「在庫」「会計」などの業務領域がカバーされており、それぞれのシステムから生まれるデータを一元的に管理することができます。
GCPの世間的イメージ
機械学習等、最先端の開発向けのもの?
この理由はエンタープライズサービスの導入が遅れてきたため
最近エンタープライズ周辺のサービスの拡充に尽力開始
Google(GCP)はサーバが壊れにくい
理由 独自設計、たとえば買い付けだと無駄なものサウンドポート等が組み込まれていたりするが、当然、そういうものを組み込んだりしない
S4HANAはデータをメモリに持っているので、動作が早い
裏を返せば、初期のデータ読み込みには時間がかかるということ。クラウドならメンテ時等のこのコストを省ける
S4HANAはメモリにデータをもつので、データが増えるほどにメモリを増やす必要がある。これはコスト。だが、コールドデータならBQにあげるこという選択肢もあり。
BigQuery ML と AutoML Tables ではじめるスケーラブル データサイエンス
BQの特徴
スケーラビリティとデータの民主化
従来のDWH
データが増えるにつれ、サーバを増やす必要があった。
→BQなら不要(データはクラウド上)
BQのデータ保存コスト
1G 1か月 2円程度
+
どんなクエリを投げるか?
AutoML Tablesについて
データをクラウドへアップ
推論結果をホスティング
REST APIとしてそれらを利用可能
構造化データに価値がある
マッキンゼーの調査結果。スプレッドシート形式的なもの
構造化データの学習
学習させるもの 目的変数以外のパラメーター
推論するもの 目的変数
どれくらいのデータに対してAutoMLTablesを使うべきか
10万行以上
AutoMLTables
複雑で大量にデータのあるものならこちら
それ以下
BQML(BigQueryML)
GCP で API 基盤を構築する 〜 API 管理からアーキテクチャまで徹底解説
APIエコノミーの成長機運
なぜAPIが使われるのか?
統合
マイクロサービスとの親和性
Apigee
2016年にGoogleが買収
社外向けのAPI公開に有用
Cloud endpoints
ローカルにnginxプロキシをインストールすることでGoogle各種のAPIを利用可能になる
もちろん、Google
GraphQL
APIのためのクエリ言語
RESTではひとつのリクエストしかなげられない。
RESTful APIsでは複数回のクエリが必要になるようなデータでも、クエリによっては一度に取得することができる。
gRPC
クライアントがリモートサーバのメソッドを呼び出すしくみ
利用例:Pub/Sub
セキュリティ
認可と認証
APIは認可しか行えない
キーを持つひとに権利がある
以上