投稿

6月, 2023の投稿を表示しています

Git2PROV を例に W3C PROV オントロジー表現の基本を知る

イメージ
本記事では、W3Cが勧告している PROV オントロジーの表現方法を Git2PROV ツールを例にみていきます。 【目次】 [1]はじめに [2]PROV とは (1)PROVの基本概念 (2)簡単な補足 (3)PROV のシリアライズ形式 (4)PROV グラフの可視化について (5)拡張仕様について [3]Git のコミット履歴を PROV で表現する (1)Git2PROV (2)ファイルのバージョン1をコミットしたとき (3)ファイルのバージョン2をコミットしたとき (4)より詳細な Git のモデルや応用など [4]Git2PROVを実際に動かしてみる (1)インストール (2)ローカルサーバで実行 (3)コマンドラインから実行 [1]はじめに ネットで様々な情報が簡単かつ大量に得られるようになりました。 それはそれで良いのですが、同時に得られた情報が信用できる情報かどうかの判断も難しくなってきました。 昨今の生成系 AI などの事情を考えると、この傾向はますます進むような気がしますが、そもそも今まで何を根拠に「信頼」とか「信用」していたのか?と考えていくと、意外に根拠が薄そうな気がして、少々不安になります(笑)。 それはともかく、信用できる情報かどうかの判断基準として、データの来歴あるいは起源をみることは多いと思います。 W3C は、このような来歴あるいは起源を記述するための仕様である PROV を2013年に勧告しています。 PROV-Overview An Overview of the PROV Family of Documents https://www.w3.org/TR/prov-overview/ 崇高な概念をここで語ることはできませんが、来歴や起源をたどれるデータの表現方法は、一般のアプリ作成においても役立つことが多いと思いますので、本記事では、この PROV による情報の来歴あるいは起源に関する表現をみてみます。 ところで PROV 仕様をざっと概観するには、(英語ですが)以下のドキュメントが最適だと思います。 PROV Model Primer https://www.w3.org/TR/prov-primer/ 一方、本記事では開発者にとって身近な Git のコミット情報を PRO