URI・IRI オントロジーの概念を一意に定めるための記述法
URI・IRI オントロジーの概念を一意に定めるための記述法
URI・IRI・URL・URNという言葉はWeb関連用語では頻繁に登場するため、何となくWebページのリンク先のアドレスに用いられているのでは無いかと認識されている方は多いと思います。半分は正解ですが、それぞれの言葉にどういう関係性があるかまでを把握している方は少ないかと思います。これらはオントロジー・セマンティックWebの世界でも用いられ、概念の特定に重要な役割を果たします。
特にURIはリンクトデータにおいて、一意の概念を表現する際に用いられるため、オントロジー・セマンティックWebのレイヤケーキの土台です。以下、詳細について解説をします。
URI・IRI
URI・IRIは上の図が示す通り、セマンティックWebのレイヤーケーキの一番下層の部分にあたり、言うならばセマンティックWebの土台として用いられている規格となります。URI・IRIはリンクトデータでは概念を一意に定めるために用いられ、これにより概念の重複を防ぎます。
以下に、URI、及びIRIの詳細、及びそれらのサブセットであるURL、URNの説明を記述します。
URL・URN・URI・IRI
URL、URN、URI、及びIRIの関係に関しては以下の図がわかりやすいかと思います。URN、URLはURIのサブセットにになり、URIはIRIのサブセットになります。以下、それぞれ個別に解説します。
URL
URL(Uniform Resource Locator)はWebページの参照先のアドレスに使用されているため、殆どの皆様にとっては非常に馴染みの深い言葉かと思います。http://やhttps://から始まるWebページのアドレスを指定する場合等によく用いられます。そのため、URLという言葉は日常生活でも良く目にすることが多いと思います。
URLはよく個人の住所に例えられます。Webページ1つ1つ個別にユニークなURLが割り振られます。これによって、Web上では、異なるページの間の同一アドレス参照等はできません。
URLはプロトコル(httpやhttps等通信の規格)と、ドメイン(例 mdiu.ml)から構成されます。ドメインの差し押さえ問題などからわかるように、ドメインは早い者勝ちで取得され、同じドメインの重複使用は許可されません。
URN
URLが住所だとすると、URN(Uniform Resource Name)は名前にあたります。どちらもURIのサブセットという位置づけになるのですが、URNは何かの識別子を定義したもので、URLはその何かを探す方法を提供するものなので、英語でいうとWhat=URNとWhere=URLの関係になります。
URI
URI(Uniform Resource Identifier)は、URLまたはURN、もしくは両方を指します。リンクトデータにおいては、概念を表現するためにURIが用いられます。URL、及びURN両方の要素を含むという事は、リンクトデータで扱う概念の名称と、場所が一意に定まるため、概念のオーバーラップが起こらない事を意味します。
上記の図は、「門前仲町の略称はモンナカである」という文章を、リンクトデータとして表現したもので、URIを用いて概念が表現されている事がわかるかと思います。このように、URIは概念を一意に表現するために用いられます。
IRI
最後に、IRI(Internationalized Resource Identifier)の解説になりますが、IRIはURIを拡張したものとなります。URIは英和字(ASCII文字)のみの対応でしたが、IRIはUnicodeを含むことができ、日本語や、韓国語等も取り扱う事ができます。
まとめ
リンクトデータで概念の記述に用いられる、URI・IRIについて、URL、URNとの関係性も含めて簡潔に解説をさせて頂きました。URI・IRIはセマンティックWebのレイヤーケーキの最下層に位置し、リンクトデータの構成要素のそれぞれの概念を一意に定めるために用いられます。これを土台にして、セマンティックWebが構成されます。
次回以降、セマンティックWebの他の構成要素を解説していきます。