そもそもAIとは何?
そもそもAIとは何?
本シリーズの最初の投稿は、そもそもAI(人工知能)とは何かについて直感的にわかりやすく解説をしていこうと思います。私自身、ビジネスを通して色々な会社の技術顧問の仕事等をさせて頂いておりますが、「AIとは何?」というこ最も基本的な質問に対して、すぐに回答を返せる方はほぼいない印象で、また、答えられる方に関してもその内容は人によってバラバラで解釈が違うと感じる事が多くありました。
確かにこれがAIだという結論がある訳で無いので、本記事の内容が絶対に世界な訳では無く、様々な解釈があってもいいかと思いますが、以降、シリーズで、直感的でわかりやすくAIに関して解説を進めていきます。また、AI技術の中で用いられている難しい数式やアルゴリズムに焦点を当てるので無く、あくまで概念として理解できるように工夫して説明をしていくので、非エンジニアの方にこそ読んで頂きたいと考えています。
本記事は最初のイントロの記事として、まずはAIという言葉の意味を解説し、AIを構成する代表的な要素技術について解説を行います。
AI(人工知能)の定義
人工知能(じんこうちのう、英: artificial intelligence、AI〈エーアイ〉)とは、「『計算(computation)』という概念と『コンピュータ(computer)』という道具を用いて『知能』を研究する計算機科学(computer science)の一分野」を指す語[1]。「言語の理解や推論、問題解決などの知的行動を人間に代わってコンピューターに行わせる技術」[2]、または、「計算機(コンピュータ)による知的な情報処理システムの設計や実現に関する研究分野」ともされる
※日本語Wikipediaより引用
わかりやすく直感的にAIの解説をするといっておきながら、冒頭から非常にわかりにくいWikipediaの説明を引用させて頂きました(笑)。こちらの解説内容をわかりやすく咀嚼していきたいと思います。上記のWikipediaの引用文をわかりやすくまとめると、以下のようになるかと思います。
- AIはコンピュータ上で動作し、人間の行動を人間に変わって行うものである
つまり、見る、聞く、話す、等の人間の一連の行動を、人間に変わって行うプログラムの事だと考えるとAIの本質が把握できるかなと思います。以降、AIについて少し深堀りして解説をしていきます。但し、AIは人間の行動を代わりに行うものなので、その前に人間の行動そのものについて考えてみると、よりAIの理解が深まるかと思います。
人間の五感・感情
それでは、見る、聞く、話す、等の人間の行動を司るものは何でしょうか?これに関してはわざわざ解説する必要も無いかと思いますが、人間の感覚の構成要素とも言える「五感」から来ています。以下にWikipediaの五感の定義を見てみましょう。
五感(ごかん)とは、動物やヒトが外界を感知するための多種類の感覚機能のうち、古来の分類による5種類、すなわち視覚、聴覚、触覚、味覚、嗅覚をさす。この伝統的な分類を前提として、人間の感覚全体を指すために「五感」という表現が用いられる場合もある(「五感を鋭くする」など)。
※日本語Wikipediaより引用
例にもれず固い表現になっていますが、AIの説明よりはわかりやすく、また人間であれば誰もが持っているものであるので、理解はしやすいので無いでしょうか?以下に改めて「五感」について整理します。
- 視覚:見る力
- 聴覚:聞く力
- 触覚:物に触って感覚を感じる力
- 味覚:味わう力
- 嗅覚:臭いを嗅ぐ力
これらは人間の感覚の構成要素で、見る、聞く、話す等の人間の行動は全て、五感が元になり、感情が構成され、感情に基づいて人間の行動が行われます。これを踏まえて、再度AIの定義を確認してみます。
- AIはコンピュータ上で動作し、人間の行動を人間に変わって行うものである
人間の行動は上記の通り五感・感情が元になっています。つまりそれを人間の代わりに行うAIも、五感・感情を元にして行動を行います。
※以下、AIの技術要素に関する言葉が出てきますが、それらは後ほど解説を行います。
人間の五感・感情をAIに当てはめてみる
AIの五感
それでは、人間に置き換えてAIの五感について考えていくと、AIの本質が何なのかが見えてきそうです。まずAIの技術要素について考えてみると、「画像認識」「音声認識」「自然言語処理」等の要素があり、それらを人間の五感に(多少無理矢理)対応させると以下のようなマッピングになります。
- 視覚:画像認識
- 聴覚:音声認識
- 触覚:センシング技術(センサー)
- 味覚:無し
- 嗅覚:無し
まず、AIでは(今の所)「味覚」と「嗅覚」にあたるものは存在しておりません(勿論、今後生まれる可能性もあります)。また、センシング技術は言葉の通りセンサーを使用するものなので、少しAIとは趣が異なるので対象外にします。五感について少し強引にAIの要素技術とマッピングを行いましたが、これだけでは行動には繋がりません、前述の通り、五感が感情に結びついてようやく行動に繋がります。つまり、上記にプラスで「感情」を表すAI技術が必要になります。
AIの感情
AIの技術要素で(多少強引に)感情に関係する技術要素は自然言語処理となります。この感情の部分が、先程の五感と合わさってようやくAIの行動が定義できます。
- 感情:自然言語処理(NLP)
以上が、五感、及び感情に基づいたAI技術要素の分類になりますが、こちらは少し直感的な分類とは言えませんね・・・
以降は、五感、及び感情から構成される「行動」に焦点を当ててAIの要素技術を眺めてみる事にします。例によってまずは人間の行動から考察してみたいと思います。
人間の行動とAI技術のマッピング
それでは、人間の五感と感情を元にどのような行動が生まれるのかについて考えていきましょう。良く代表的な人間の行動の例としてあげられるのは、「食べる」「寝る」「排泄する」ですが、流石にこれらをコンピュータ上で再現してもあまり意味のあるものにはならない気がします・・・なので、自ずと以下の人間の行動がAI技術と結びつきます
- 見る:画像認識
- 聞く:音声認識
- コミュニケーションする:自然言語処理(NLP)
細かい事を言うと、人間の思考の元になる「知識工学」等、他のAIの要素技術も存在していますが、上記が(現在の)AIのメインストリームのため、上記のマッピングを覚えておくと良いと思います。
つまり、AIといっても人間の行動の一部のみをコンピュータで再現しようとしているのに過ぎないので、(今の所)人間の全てがAIにとって変わる事は無いのでご安心下さい!また、AIという言葉を聞いた際に、それが上記のマッピングのどれに当たるか把握できると、AIリテラシーが高まるかと思いますし、ビジネスの場でも非常に役に立つと思います。
それではAIの各要素技術について、以下概略を解説をしていきます。各技術の詳細に関しては、私の専門の自然言語処理を中心に、別記事に深堀りしてまとめていく予定です!
画像認識とは?
読んで字の如く、画像を認識する技術です。人間も犬や猫等の動物を判別できるように、AIが自動的に画像から犬や猫を判別できるようにする技術です。これは特に説明不要かと思いますが、人間の「目」の役割、つまり「見る」力に相当するものとなります。
音声認識とは?
こちらも読んで字の如く、音声を認識する技術です。人間が会話をする際、他人が話している会話を耳から聞きますが、音声認識はまさにその「耳」の役割、つまり「聞く」力に相当するものとなります
自然言語処理とは?
こちらは、画像認識、音声認識ほどわかりやすいAIの要素技術では無いかもしれません。一応、上記のマッピングでは「コミュニケーション」というマッピングに分類しておきましたが、厳密にいうと正確では無く、「文章の意味を理解する技術」が正解に当たるかと思います。
では、なぜ自然言語処理を「コミュニケーション」というマッピングにに分類したかというと、人間のコミュニケーションは相手の会話を理解する事によって成り立ちます。相手の会話の流れも読まず、一方的に話しているだけの人は嫌われてしまいますね・・・
それはAIも同じで、人間にテキストで話かけられた時に、人間のテキストの入力内容を理解して、正しい回答を返す必要があります。なので、自然言語処理は、コミュニケーションに当たるAI技術という事ができます。
少し触れましたが、自然言語処理は私の専門なので、今後特に深堀りして記事で取り上げていく事になると思うのでご期待下さい!
まとめ
AIという言葉は非常に世間に浸透していますが、AIに関して正しい説明を行える方は少なく、漠然としたイメージをお持ちの方が多いかと思います。そういった方に、本記事では「AIはコンピュータ上で動作し、人間の行動を人間に変わって行うものである」という点を説明させて頂き、人間の五感・感情、及び行動に対比させる形でAIの要素技術に関して解説を行いました。
繰り返しになりますが、一旦は以下の人間の行動とAIの要素技術とのマッピングを覚えて頂き、この視点でAIの記事を読んだり、実際のビジネスに取り組んで頂けるとより良い理解ができるかと思います。
- 見る:画像認識
- 聞く:音声認識
- コミュニケーションする:自然言語処理(NLP)
次回以降はAIの各要素技術について、自然言語処理を中心により詳細の解説を進めて参ります。本シリーズが読者の皆様のAIの理解に少しでも役に立てば幸いです。