たのしい工学

プログラミングを学んで、モノをつくりたいひと、効率的に仕事をしたい人のための硬派なブログになりました

【エンジニア 情報収集】Google Cloud Next’19 San Francisco 報告会

   

GCPのユーザ会に参加したので、そのメモです。

スピーカー
Google Ian Lewis さん

Anthos(アンソス)について

GKEはkubernetes、コンテナ技術をクラスタで管理するものだが、Anthosはアプリをあまり修正せずにモデナイズできる。サービスの管理、ポリシーのオートメーション、オンプレミスでGKEを使える。

AnthosはオープンソースのIstio(イスティオ)ベースにつくっている。

サービスとサービスの間にプロキシを入れている。

GKE On-prem

kubernetesのマスターサーバも起動可能。
クラスタのワーカーノードになる。

AnthosのコンフィギュレーションはYAMLファイルで定義。

Anthosは何をめざしているのか?

Anthosはハイブリッドクラウドを作るためのプラットフォームをめざしている。
クラウドではなくオンプレミスで持ちたいデータに対して、それを簡単にクラウドにあげられるような仕組みを作っている。

クラスタ間の通信もTLSが入っているので安全に行える。

Cloud run

サーバレスプラットフォーム

コンテナイメージさえ作ってしまえば、スケーラブルなインフラ構築が可能。コンテナイメージがあれば、kubernetes上にデプロイできる。

cloud run はOSSのknativeベース
コンテナはOSSのkubernetesベース

GKEsandbox

信頼されていないコードを実行するときの実験環境

GKEsandboxの中では、gVisor(ジーバイザー)というOSSを利用

コンテナを実行するときに、gVisorがLinuxを偽装したような環境を提供する。コードにバグがあった場合、ホスト上で実行せずに済む。

GoogleクラウドはOSSを積極利用するのが大きな方針になってきている。

スピーカー
Google 佐藤 一憲 さん

cloud next19のダイジェスト
機械学習周辺のGCPの話題
今回のcloud next'19で実際に利用されたスライドを利用してご説明いただいた。

AutoML Tables

機械学習は学習コストが高い。
→それをいかにコストを下げて利用できるようにするかをGoogleは考えている。

AutoML TablesはDBなどの構造化データを扱う

スキーマを定義したら、データを読み込ませる。

学習フェーズを自動化
欠損値を何で埋めるのか、平均値か?外れ値をどう処理するのか?等々、データサイエンティストが考えなければならない部分を自動でおこなってくれる。

機械学習をするための機械学習がバックエンドで働いている。

AutoMLで学習させたデータがKaggleの上位に食い込む
費用3万円。時間12時間。
高年収のデータサイエンティストを雇うのとどっちがよいか??

バックエンドにはgVisorが使われていて、非常にスケーラブルな環境構築が可能。

AI platform

データサイエンティスト向けの機能。

AIHub
機械学習のサンプルコードを集めている。
そこからサンプルを選択。

AI platform notebooksなら永続的にサンプルコードを利用可能。
colaboratoryと違って消えない。

Kubeflow

コンテナの中でtensorflowを動かす。

kubeflowならプラットフォームをえらばずに同じコードでさまざまな環境で機械学習のプログラムを利用できる。

BQML(BigQueryML)

ビッグクエリの中で機械学習を行う。

tensorflowを使った予測と推論が可能に。

SQLでしかできなかったことが、機械学習を使っても行うことができるようになった。

cloudTPU

あとで写真を。。
ようはGoogle独自仕様のスパコンみたいなものです。

まとめ

Googleは徹底的に有用なオープンソースソフトウェアとのコネクションをつくっている印象をうけました。つかえるOSS=ユーザが多い=まるごともっていければすぐに多くのユーザを獲得できる。Web検索で広告を貼って商売をはじめたGoogleですが、稼ぎ方のノウハウはなんとなく通底している印象を受けました。

 - カンファレンス