AIの土台のオントロジー・地味でニッチなAI分野
AIの土台のオントロジー・地味でニッチなAI分野
AIというと、ディープラーニング、機械学習等の言葉は耳障りも良く、先進的なイメージもあり市場に幅広く浸透しています。しかし、「オントロジー」という言葉に関しては聞き馴染みの無い方が多いかもしれません。
「オントロジー」はAI分野では、人間の思考を機械に理解させる土台です。機械学習等の技術と並んで、AI分野の大事な研究開発領域です。「オントロジー」は何らかの概念を、記述言語で記述をし、機械に解釈させる事を目的とします。これにより、機械が概念を正しく獲得し、平等に扱えるようになる事を目的とします。
オントロジーの適用範囲は、前述のような機械による概念の学習のような研究的なテーマから、データを整理するために必ず必要になる、データのカテゴリの作成等、決して派手では無いですが、AIやDXを駆使するための基盤として、非常に大事な技術です。
オントロジーとは?
前段でも触れましたが、オントロジーという言葉はあまり馴染みの無い言葉です。AI関連の研究者や、エンジニアでもなければ聞いたことが無いというのも不思議では無いです。オントロジーは、機械学習(ディープラーニング含む)と並んで、AI分野で最重要項目の1つです。
オントロジーは、ある事象の「概念」について機械に理解させるための記述言語です。また、概念と概念の間の関係(包含関係や上位・下位関係)についても記述を行います。この言葉だけでは理解が難しいので、以下により具体的な説明をしていきます。
AIの思考の土台、セマンティック
オントロジーを語る場合に、切り離せない言葉として「セマンティック」という言葉があります。セマンティックを日本語で説明をすると、一般的には「意味」や「意味論」に関する事を指す言葉になります。特にIT分野では、機械に文章や、情報の持つ意味を理解させ、文章の関連付けや情報収集等の処理を自動的に行わせる処理の事を指しています。セマンティックは機械に人間の思考を学習させる際の土台になります。
言うまでもなく、セマンティックにおいて、機械が情報の概念を獲得する際にオントロジーが活用されます。セマンティックとオントロジーは非常に密接に関連しており、AI分野の思考の土台になっています。
オントロジーの概念表現(Triple)
以下は、「門前仲町の略称はモンナカである」という概念をオントロジーの概念表現(Triple)で表現した例です。
オントロジーでは、このように概念は、S(主語)、P(述語)、O(目的語)のTripleの形で表現されます。特に、Pが、概念概念の間の関係を説明するプロパティ(概念の性質・特性)の役割を果たす最重要要素です。
上の例では、「S:門前仲町」と「O:モンナカ」の概念の間を取り持つのが、「P:略称」というプロパティになります。このように、オントロジーでは概念をTripleで記述する事により、機械に概念の解釈を可能にさせるという目的があります。
こうして、機械が人間の思考の概念を獲得する事で、人間の思考を学習できるようになる事が目的です。また、機械が概念を獲得する事で、その概念に基づく関係性の理解や、その裏にある概念間の推測等を実現させようという目的があります。これらにより、人間の思考の深い部分を機械に学ばせようというビジョンの達成を目指しています。
概念の包含関係
異なる概念と概念の関係性については、上述の通りプロパティによって記述ができる旨をお伝えしましたが、概念の性質によっては、ある概念が、別の概念に内包されている事もありますし、基本的には異なる概念であっても、概念の一部の性質が重なり合っていることもあります。
このような概念間の包含関係は、上位概念、下位概念、概念のオーバーラップというような言葉によって表現され、これらの関係性はオブジェクト思考のプログラミング言語等ではお馴染みのクラスの継承(親クラスと、子クラスの関係性)に類似しています。言葉だけではわかりにくいので、これを図を交えて解説をしてみます。
上の図は、「冷たい飲み物」という概念と「温かい飲み物」という概念の間の関係性を表現した例になります。先程説明をした、概念の上位関係、及び包含関係の例となります。ここで、概念の他に個体という言葉がでてきますが、改めてオブジェクト思考に合わせて、概念と個体の関係性を説明すると以下となります。
- 概念:オブジェクト思考における「クラス」に相当し、ある概念の性質を表す
- 個体:オブジェクト思考における「インスタンス(メンバ)」に相当し、概念に属する具体的な事象を表す
つまり、上の図では、「冷たい飲み物」の下位概念として「炭酸飲料」「清涼飲料」「コーヒー」が存在し、「温かい飲み物」の下位概念として「お湯」が存在しており、「コーヒー」という概念が「冷たい飲み物」と「温かい飲み物」の両概念にオーバーラップしている様子が表現されています。
このように、オントロジーにおける概念の関係性はオブジェクト思考との共通点が多いのが特徴です。
オントロジーの活用先
冒頭で、オントロジーの活用先について軽く触れました。以下、どのような分野でオントロジーが具体的に使用されているか、なぜAIやDXの土台になりうるかについても簡単に解説をします。
セマンティックWeb
このように概念の記述言語として用いられるオントロジーは、実際にどのような分野に活用されているか例を示します。例えば、知識工学を始めとしたAI分野の研究開発でのテーマとして取り上げられており、AIの意味理解の能力を更に押し上げるためのものとして日々研究がなされています。また、AI研究開発分野以外で、特に有名なオントロジーの活用先は、「セマンティックWeb」と呼ばれます。
セマンティックWebは、ユーザの意図に合致したドキュメントを返すためのプロジェクトであり、DBpedia、FOAFをはじめ、複数の有名なプロジェクトがあります。セマンティックWebの詳細に関しては、別記事で詳しくお話をさせて頂きます。
データ整理の基盤であるカテゴリ構築
AIやDX等の言葉は、今やバズワードで非常に華々しい印象があるかと思います。その一方でAIの土台はその元になるデータで、データの基盤を整えなければAIは何の効果も発揮しません。つまり、どのような形でデータを所有するか一番大事になり、この設計が崩れていると、せっかく良いビッグデータがあってもそれを料理する事ができません。
それでは、どのようにデータを整理すべきかという話ですが、データの種類や特性毎に共通のデータをまとめる必要があります。上の図は、絵画に関する一般的なカテゴリを絵で表現したものになりますが、アイコンの絵がそのカテゴリを象徴しております。このように、データも、データの種類や特徴毎にカテゴリが設定される必要があります。
オントロジーの概念にあたるものがカテゴリで、概念の包含関係(上位・下位関係)等が大カテゴリ・中カテゴリ等に対応します。オントロジーを利用してカテゴリを設定する具体的な方法に関しては別記事で紹介させて頂きますが、オントロジーはこのようにAI活用のために重要なデータ基盤整理に利用できるため、地味ですが大変パワフルです。
まとめ
「オントロジー」という言葉の概要をお伝えさせて頂きました。AI分野において、機械に人間の概念を理解させる事は、思考を実現するために重要な項目の1つで、セマンティックWeb、カテゴリ構築を始めとした多くのプロジェクトに応用されています。AI分野の花形の機械学習、ディープラーニング等と違い、知名度の低いオントロジーですが、AIの土台のデータを支える基盤を整備するためには非常に重要な役割を果たします。