Index
今回の目的
文字抽出エンジンとして、Azure Cognitive Services を使用したい
インターンの方に調査を行っていただくので、api keyのようなものがあればそれを発行して使用できる環境を作成できることが理想
Azure とは
- AWS, GCPに継ぐ、クラウド・コンピューティングサービスという認識しかなかったので少し調べた
- また、初めてさわるので大枠を理解したい
Azure とは (抜粋)
Microsoft Azureとは、2008年10月にマイクロソフト社のデベロッパーカンファレンスで発表され、2010年10月に「Windows Azure」としてサービスを開始したクラウド・コンピューティングサービスのこと
Microsoft Azureが提供しているはIaaSとPaaSであり、その中には、コンピューティング、データベース、レンタルサーバーなどのサービスがある
Azure とは (代表的な4つのサービス)
- Azure DevOps
- Azure DevOpsは開発(Dev)と運用「Ops」を組み合わせたサービスです。サービスの開発からリリースまで、ソフトウェア開発を支援
- Azure Functions
- サーバーの構築なしでプログラムを実行できるサービス
- Azure Storage
- Azure用のストレージサービス
- Azure Virtual Machines
- 仮想マシンを提供するサービス
Azure とは (参考)
Azure Cognitive Services について
- 機械学習の専門知識がなくても、あらゆる開発者が利用することができる
- 見る、聞く、話す、検索する、理解する、そして意思決定の各機能をアプリに埋め込むためのAPIを呼び出せる
- サービスページより
- 今回はそのサービスの中で以下のサービスを利用する(リンクは各サービスページ)
Azure Cognitive Services について (使用候補)
- Computer Vision
- 画像データ等を入力として、物体のラベル、位置やシーンの特定、テキストの抽出する
- Form Recognizer
- 画像データ等を入力として、テキスト、キーと値のペア、テーブルを抽出する
Portal 画面
サブスクリプションをお持ちでない場合はこのような画面になる
サブスクリプションとは
AD (Active Directory) : ユーザーID認証基盤
サブスクリプション : 課金請求が行われる単位
- 「課金請求」と「運用管理」の観点で利用部署ごとや商用サービスごとといった単位で分離するのがおすすめ
リソースグループ : Azureのリソースを整理して入れておくための箱やフォルダ
サブスクリプションとは (結局)
サブスクリプションとは (参考)
リソースグループ とは
- サービスを利用する前に、「リソースグループ」を作成する
- すでに使用できるリソースグループがあれば、チームメンバー相談の上利用する
リソースグループは課金の単位ではないので、チームごとに作るよりはプロジェクトごとに作成するのが良さそうに感じた
今回は利用できるリソースグループがなさそうだったので、作成した
リソースグループ 作成
- home から リソースグループの管理画面に移動
- 「追加」から作成
- 「リソース グループ」と「リージョン」を選択
- デフォルトの「(US)米国西部2」を選択 (良い選択方法あったら教えていただきたいです、、)
- 作成の反映はすぐに作成されました
Cognitive Services
- home から Cognitive Services のサービス画面に移動
- 「追加」からリソースを作成
- 「Computer Vision」 or 「Form Recognizer」を選択し、作成
- 「Computer Vision」を選択
Cognitive Services ~ Computer Vision ~
「リソース名」、「サブスクリプション」、「リージョン(場所)」、「価格レベル」、「リソースグループ」(先ほど作成したもの)を設定し、作成
- 「価格レベル」は F0, S1から選択でき、想定される使用量に応じてマシンのスペックを変えている様子 (試用なのでとりあえず F0で設定)
- 価格の詳細 (サービスページ抜粋)
リソース詳細画面へ遷移
- リソースからクイックスタートが確認できる
リソース詳細画面から「キーとエンドポイント」を選択
- ここから、API キーとエンドポイントを確認
- “このキーは、要求ヘッダー (Web API) または Computer Vision クライアント (SDK) のいずれかで指定するか、またはコマンド ライン (Docker コンテナー) を通じて指定します。”
-
- 必要な情報
- API キー
- エンドポイント
- クイック スタート:Computer Vision クライアント ライブラリを使用する (サービスページ)
- 必要な情報
Cognitive Services ~ Form Recognizer ~
- 「Computer Vision」と同様に以下の作業で使用が可能
- リソースの作成
- クイックスタートの確認
- API キーとエンドポイントの確認