セマンティックWebのプロジェクト
セマンティックWebのプロジェクト
セマンティックWebの各構成要素に関しては、レイヤケーキを参考にしながら各要素の概要の解説をさせて頂きましたが、それでは、その構成要素を使用して、実際にどのようなセマンティックWeb・リンクトデータ関連のプロジェクトが世の中に存在するかについて解説を進めて行きたいと思います。
セマンティックWeb関連のプロジェクト
それでは、以下に代表的なセマンティックWeb・リンクトデータの関連プロジェクトについて説明させて頂きます。個々の詳細に関しては、必要に応じて別記事で紹介させて頂く事とします。
DBpedia
SPARQLの記事でも紹介をさせて頂きましたが、Wikipediaの記事の内容をベースにリンクトデータを作成し、公開したプロジェクトがDBpediaになります。元々DBpediaのプロジェクトはドイツのベルリン自由大学、及びライプツィヒ大学のメンバーで開始され、2007年に最初のデータセットが提供されました。
DBpediaのリンクトデータはWikipediaより構成されるため、Wikipediaの中に分散している多数の情報にアクセスする事が出来ます。データの問い合わせには、SPARQLを用い、SQLのようにリンクトデータにアクセスし、必要な情報を取得する事が出来ます。
FOAF
FOAF(Friend Of A Friend)は、人や組織の活動情報や属性をはじめ、それらの関係性を記述する語彙の事で、RDFによって記述されるため、セマンティックWebのプロジェクトの1つとして認識されています。「友達の友達」という言葉の通り、人と人の輪をベースにして繋がりが広がっていく構造になっています。
FOAFは人のオントロジーを表現するために、以下のような語彙を備えています。これらの語彙により人と人の関わり、人と組織の関わり等のリンクトデータを表現する事ができます。
- 人、組織やものを表す語彙: 例)foaf:Person, foaf:Organization, foaf:Image
- 個人情報を表す語彙: 例)foaf:name, foaf:gender, foaf:title
- 人の組織や文章などを示す語彙 例)foaf:homepage, foaf:weblog, foaf:publications
- 社会ネットワークを構成する語彙 例)foaf:knows, foaf:interest, foaf:member
WordNet
WordNet(ワードネット)は元々は英語の概念辞書であり、単語の意味や、単語間の関連性(「類義語」「上位語」「下位語」等)について定義を施した広大なシソーラス、及び単語辞書です。単語の概念を表すsynsetというユニークなIDで管理され、同じsynsetに属する単語は類義語になります。WordNetは広大な単語間の巨大なオントロジーを整理したリンクトデータという事ができます。
WordNetは英語のリソースを中心に、日本語及びその他の言語に翻訳をされています。その巨大なリソースは、全て無料で提供されており、BSDライセンスにより公開され、自由にダウンロードし、使用する事ができます。特に、自然言語処理の世界では、同義語拡張のためのリソースや、単語間の意味的な距離を計算するためのリソース等として幅広く使用されています。
まとめ
今回は、リンクトデータの代表的なプロジェクトの例として、DBpedia、FOAF、Wordnetを例として紹介させて頂きました。他にも世界中で様々なリンクトデータのプロジェクトが進められており、それらがセマンティックWebとしてアクセス可能なので、是非、確認をしてみて下さい。