投稿

2月, 2021の投稿を表示しています

Vision APIとナレッジグラフの検索で画像認識対象をより深く理解する(Google Knowledge Graph Search API)

本記事では、Vision APIのランドマーク検出、ロゴ検出、ラベル検出から得られる認識対象の情報からGoogle Knowledge Graph Search APIを利用して、より詳細な情報を得る流れを、具体的な例とともに見ていきます。 【目次】 [1]はじめに [2]Vision APIとGoogle Knowledge Graph Search APIの連携 (1)連携方法の概要 (2)本記事の実行例について [3]ランドマーク検出の例 (1)Vision APIによる検出 (2)ナレッジグラフ検索 [4]ロゴ検出の例 (1)Vision APIによる検出 (2)ナレッジグラフ検索 [5]ラベル検出の例 (1)Vision APIによる検出 (2)モデルのアップグレードによる違いや最大検出数など (3)ラベル検出とランドマーク検出、ロゴ検出 (4)ナレッジグラフ検索 [1]はじめに Google Vision APIを利用すると、与えられた画像に対するラベリング、顔やランドマークの検出、光学式文字認識(OCR)などができます。 機能リスト( https://cloud.google.com/vision/docs/features-list ) このうち、「ランドマーク検出」、「ロゴ検出」、「ラベル検出」、「テキスト検出(OCR)」の機能には、検出結果にGoogleのナレッジグラフ検索に使える情報(エンティティID)に関するフィールドを持っています。 ここでGoogleのナレッジグラフとは、Google検索を行ったときに表示される情報ボックス(ナレッジパネル:PC等では検索結果の右側に表示される情報)の元になる情報のデータベースのようなものです。 (詳細については、記事『 Googleのナレッジグラフ検索APIを使ってみる(Google Knowledge Graph Search API) 』を参照して下さい。) Vision APIの検出結果とGoogleのナレッジグラフを組み合わせれば、検出対象のより詳しい情報が得られて、より深く認識対象を理解できるかもしれません。 そこで本記事では、このVision APIの検出結果からGoogleのナレッジグラフを検索することで、より詳細な認識対象の情報を得る流れを、具体的な例とともに見ていきます。 [2