
XML・セマンティックWeb上のオントロジーの記述言語
XML・セマンティックWeb上のオントロジーの記述言語
XMLは自由にタグを決められるマークアップ言語の規格として、既に世の中に幅広く浸透し、使用されています。リンクトデータにおける概念の記述は、URI・IRIで記述されますが、XMLはリンクトデータをセマンティックWeb上で表現するための共通記述言語です。
XMLについては、色々な書籍やWebページで説明があるので、ここではセマンティックWebに関係がある部分のみ掘り下げて紹介させて頂きます。
XML
XMLは上の図が示す通り、セマンティックWebのレイヤーケーキの下層にあたり、リンクトデータを実際に記述するための記述言語の土台として用いられます。オントロジーを表現する記述言語としては、RDF(S)、OWL等がありますが、これらの記述言語もXMLを土台にしています。
XMLは、その名前の類似性からもわかるように、HTMLを拡張して実装されており、HTMLが予め決まったタグを使用するマークアップ言語なのに対して、XMLはユーザ独自のタグを定義でき、使用できる柔軟性のあるマークアップ言語という事ができます。
XMLの構造
XML文章は、以下のように要素(element)と属性(attribute)から構成されるマークアップ言語です。
<要素名 属性=“値”>内容</要素名>
要素は、開始タグ(<要素名>)、及び終了タグ(</要素名>)で表現され、属性は要素に付随しています。要素名、及び属性名はユーザが自由に定義を行う事ができます。
要素は、要素の中に複数の子要素を持つことができます。つまりXMLは木構造のドキュメントとして表現されます。以下は、MDIUという会社の情報をXMLで表現した例です。
<company industry=”IT”> <name>MDIU</name> <employee> <name>eguchi</name> <name>akatsuka</name> </employee> </company>
名前空間
名前空間(Namespace)とは、様々な名前の集合がある際に、その名前同士が重複し、衝突を起こさないように管理をし、また名前の参照を容易にするために用いられます。
上記は一般的な名前空間のお話になりますが、XMLでの名前空間に限った話をすると、XMLでは名前空間は要素名の重複などを防ぐための目的で用いられます。xmlns等の属性で名前空間を宣言します。
「<xml:p>」と記述されたタグでは、「xml」が名前空間接頭辞で、「p」が要素を表します。
XML Scheme
XML Schemeはスキーマ言語の1つで、XMLの文章の論理的な構造を定義するために用いられます。XML Scheme自身もXMLによって記述されます。
XML Schemeの構文等の詳細は割愛しますが、XML Schemeにより、XML文章の構文、要素の型等を定義する事ができます。
まとめ
セマンティックWeb上で、概念のオントロジーを記述するためにRDF、OWL等の記述言語が用いられますが、それらの記述言語はXMLで記述されるため、XMLはセマンティックWeb上でリンクトデータを表現するための土台と言えます。
次回以降、RDF、OWL等、よりセマンティックWebのレイヤーケーキのコアな技術要素について解説を進めていきます。