Schema.org + JSON-LD を RDFLib で読み込んでみる
本記事では、Schema.org の語彙を使って記述された JSON-LD を、RDF を扱える Python ライブラリ RDFLib に読み込む方法を見てみます。 【目次】 [1]はじめに [2]RDFLib と JSON-LD の読み込み例 [3]Web ページ内の JSON-LD を読み込んでみる [4]Schema.org のコンテキスト (1)"@context": "https://schema.org" の解釈 (2)コンテキスト情報のありかを探る (3)コンテキストの内容をダウンロードしてみる [5]RDFLib 6.1.1 における、とりあえず回避策? (1)@context を置き換える (2)@context を削除+パーサにコンテキストを渡す [1]はじめに 記事『 Web ページ内の JSON-LD を Python + PyLD で覗いてみる(Schema.org) 』で、Web ページに組み込まれた JSON-LD を見ました。 また、JSON-LD は RDF( Resource Description Framework )のシリアライズ形式の一つであり、RDF としても解釈できる旨を書きました。 RDF として扱うと、セマンティックウェブ系の技術を使っていろいろな応用が期待できそうです。 例えば、収集した情報をマージしてナレッジグラフを構成したり、SPARQL のようなクエリ言語を利用して情報を抽出したり、新たな知識の発見につなげたり、などなど。 そこで、本記事では、Schema.org の語彙を使って記述された JSON-LD を、RDF を扱える Python ライブラリ RDFLib に読み込む方法を見てみます。 今回もセマンティックウェブ技術とか RDF には深入りせず、利用方法に絞ってます。 なお、本記事のコードは Google Colaboratory で動作を確認しています。 [2]RDFLib と JSON-LD の読み込み例 RDFLib は、RDF を操作するためのオープンソース Python パッケージです。 rdflib https://rdflib.readthedocs.io/en/stable/# RDFLib (Gi...