人工知能(AI)は、私たちの言葉や行動を理解することができるのでしょうか?アロナ・ファイシェ氏のTEDトークでは、AIが人間を実際に理解できるのかについて深く探求されています。本記事では、ファイシェ氏の洞察を紹介しながら、AIが私たちを理解する能力について考察していきます。
自然言語処理の進歩: AIの自然言語処理の進歩により、AIシステムは人間の言葉を理解し、意味を把握する能力が向上しています。機械学習やディープラーニングの技術を駆使して、AIは大量のデータから言語のパターンを学習し、文脈や意味を推測することができます。しかし、AIの理解力はまだ完全ではなく、文脈や感情を正確に把握することには課題が残っています。
エンパシーと主観性の欠如: AIは論理的な思考や情報の処理に優れていますが、人間の感情や主観性を完全に理解することは難しいです。私たちの感情や経験は個人によって異なり、文脈によっても変化します。AIはデータやパターンに基づいて意思決定を行いますが、個別の経験や感情を持たないため、人間との深いつながりやエンパシーは欠ける傾向があります。
文脈と文化の理解: 言語には文脈や文化的な要素が含まれています。人間はコンテキストを考慮しながら会話や文章を理解し、適切な意味を抽出します。しかし、AIは文脈や文化の背景を十分に理解することが難しいため、誤った解釈や誤解を生むことがあります。特に言葉の二重の意味や皮肉などの非言語的な要素は、AIにとっては挑戦となる場合があります。
人間とAIのコラボレーション: AIが完全に人間を理解することは難しいかもしれませんが、AIと人間のコラボレーションは有益な成果を生み出す可能性があります。AIの強みである情報処理やデータ解析の能力を活用しながら、人間の洞察力や感情の理解を組み合わせることで、より優れた意思決定や問題解決が可能になるでしょう。
まとめ: AIが私たちを完全に理解することはまだ難しいものの、自然言語処理の進歩によりAIの理解能力は向上しています。ただし、エンパシーや文脈、文化的な要素の理解には限界があります。AIと人間のコラボレーションを通じて、AIの強みを活かしながら人間の洞察力を組み合わせることが重要です。アロナ・ファイシェ氏の見解からも明らかなように、AIと人間の相互補完的な関係が、未来の技術や社会の発展において重要な役割を果たすのです。
AIは本当に私たちを理解しているのでしょうか?
人々は面白いです。 私たちは常に周囲の世界 を理解し、解釈しようと努めています。 私は二匹の黒猫がいる家に住んでいますが、言っておきますが、 黒いセーターが目の端に映るたびに、 それは猫だと思います。
それは私たちが目にしているものだけではありません。 時々、私たちは実際に存在するよりも多くの知性があると考えます。 TikTokで犬を見たことがあるかもしれません。 彼らには「歩く」とか「治療する」などと言う小さなボタンがあります。 彼らは彼らに飼い主と何かを伝えるよう促すことができ、 飼い主は彼らが かなり印象的なことを伝えるために彼らを使っていると考えています。 しかし、犬たちは自分が何を言っているか分かっているのでしょうか?
あるいは、馬のクレバー・ハンスの話を聞いたことがあるかもしれません。 彼は数学ができました。 単純な数学の問題だけではなく、非常に複雑な問題もあります。 たとえば、月の 8 日が火曜日の場合、 次の金曜日の日付は何ですか? それは馬にとってはかなり印象的なことのようです。 残念ながら、ハンスは数学をやっていませんでした が、彼がやっていた事は同様に印象的でした。 ハンスは、部屋にいる人々を観察して、 いつ蹄を叩くべきかを判断することを学んでいました。 そこで彼は蹄を軽くたたいて答えを伝えました。 「月の 8 日が火曜日の場合、 次の金曜日は何日か」という 答えがわかっている場合、次のようになります。 馬が正しく 18 回タップすると、 無意識のうちに姿勢が変わります。 つまり、ハンスは数学はできませんでした が、部屋にいる数学のできる人々を観察することを学びました。 つまり、これは馬としてはまだかなり印象的です。 しかし、これは古い写真であり、 今日私たちが賢いハンスに騙されることはないだろう。 それともそうしますか?
そうですね、私は AI の分野で働いていますが、 言っておきますが、状況はワイルドです。 AI が自分のことを理解していると人々が完全に確信している例は複数あります 。 2022 年、 Google のエンジニアは、Google の AI には知覚力があると考えていました。 そして、ChatGPT のようなものを使って、本当に人間らしい会話をしたことがあるかもしれません 。 しかし、私たちが現在トレーニングしているモデルは、5 年前のモデルよりもはるか に優れています。 それは本当に驚くべきことです。
それでは、この非常にクレイジーな瞬間に、 非常にクレイジーな質問をしてみましょう: AI は私たちを理解しているのでしょうか、 それとも私たちは独自の賢いハンス モーメントを経験しているのでしょうか?
一部の哲学者は、コンピューターは決して言語を理解できないと考えています。 これを説明するために、彼らは チャイニーズルーム議論と呼ばれるものを展開しました。 中国語の部屋には、中国語を理解できない 人物 (仮想人物) がいますが、彼は 中国語の文章に中国語で応答する方法を記載した 一連の指示を携えています。 中華室の仕組みはこんな感じです。 ドアの隙間から入ってきた紙には 中国語で何か書かれていました。 人は指示に従って、どのように対応すべきかを考えます。 彼らは答えを紙に書き 、それをドアから送り返します。 中国語を話す人に、 この部屋の外に立っていると、 部屋の中の人が中国語を話しているように見えるかもしれません。 しかし、指示に従うのに中国語の知識は必要ないため 、そうではないことはわかっています。 この課題の成績は、あなたが中国語を知っていることを示すものではありません。
それでは、AI について何が分かるのでしょうか? さて、あなたと私が部屋の外に立っているとき、 ChatGPT のような AI の 1 つに話しかけているとき、 私たちは部屋の外に立っている人です。 私たちは英語の文章を入力し、 英語の文章を返します。 モデルたちは私たちのことを本当に理解しているようです。 本当に英語がわかるようです。 しかし、内部では、 これらのモデルは複雑ではありますが、一連の指示に従っているだけです。 AI が私たちを理解しているかどうかをどうやって知ることができるのでしょうか?
その疑問に答えるために、もう一度中国語の部屋に戻ってみましょう。 中国人の部屋が 2 つあるとします。 一方の中国語の部屋には実際に中国語を話す人がいて、 もう一方の部屋には私たちの詐欺師がいます。 実際に中国語を話す人が 中国語で何か書かれた紙を渡されたとしても、問題なく読むことができます。 しかし、詐欺師が再びこの問題に遭遇した場合、 彼は一連の指示を使用して対応方法を見つけなければなりません。 外から見ると、これら 2 つの部屋を区別することは不可能かもしれません が、内部では本当に異なることが起こっていることがわかります。 それを説明するために、 2 人の人の心の中に、 2 つの部屋の中に 小さなメモ帳があるとします。 そして、このタスクを行うために覚えておくべきことはすべて、 その小さなメモ帳に書かれなければなりません。 そのスクラッチパッドに何が書かれているかを見ることができれば、 そのタスクに対する彼らのアプローチがどれほど異なっているかがわかるでしょう。 したがって、これら 2 つの部屋の入力と出力は まったく同じかもしれませんが、 入力から出力に至るプロセスはまったく異なります。
繰り返しになりますが、このことから AI について何がわかるでしょうか? 繰り返しになりますが、たとえ AI が、たとえ完全にもっともらしい対話を生成したとしても、 私たちが期待するとおりに質問に答えるとしても、 それは依然としてある種の詐欺師である可能性があります。 AI が私たちと同じように言語を理解できるかどうかを知りたければ、AI が 何をしているのかを知る必要があります。 それが何をしているのかを見るには中に入ってみる必要があります。 それは詐欺師ですか? 私たちはそのスクラッチ パッドを確認する必要があり、 実際に言語を理解している人のスクラッチ パッドと 比較できる必要があります。 でも、脳のスクラッチパッドと同じように、 それは実際に目に見えるものではありませんよね?
そうですね、脳の中にスクラッチパッドのようなものが見えることが分かりました。 fMRI や EEG などを使用すると、 読み取り中の脳の小さなスナップショットのようなものを撮ることができます。 そこで、人々に言葉や物語を読んでもらい、脳の写真を撮ってもらいます。 そして、それらの脳の画像は、 脳のスクラッチパッドのぼやけた焦点の合っていない写真のようなものです。 これらは、読書中に 脳がどのように情報を処理し表現しているかについて少し教えてくれます。
ここに、「アパート」、「家」、「セロリ」という単語を読んだときに撮影された 3 つの脳画像があります 。 「アパート」と「家」の脳画像は、 「セロリ」の脳画像よりも 似ていることが、 肉眼で見てもわかります。 そしてもちろん、アパートや住宅は セロリよりも言葉だけで似ていることはご存知でしょう。 つまり、別の言い方をすれば、 「アパート」や「家」という単語を読むとき、脳は 「セロリ」という単語を読むときよりも、より類似した方法でスクラッチパッドを使用します。 スクラッチパッドは、脳が言語をどのように表現するかについて 少し教えてくれます。 でも十分です。
OK、脳用のスクラッチパッドができました。 今、AI 用のスクラッチ パッドが必要です。 つまり、多くの AI の内部にはニューラル ネットワークが組み込まれています。 そして、ニューラル ネットワークの内部には、これらの小さなニューロンの束が存在します。 ここで、ニューロンはこれらの小さな灰色の円のようなものです。 そして、ニューラル ネットワークのスクラッチ パッドとは何なのか 知りたいと思います。 そうですね、ニューラル ネットワークに単語を入力すると、 小さなニューロンのそれぞれが数値を計算します。 ここではこれらの小さな数字を色で表しています。 したがって、すべてのニューロンはこの小さな数値を計算し、これらの数値は ニューラル ネットワークが言語をどのように処理しているかについて 何かを教えてくれます。 それらの小さな円がすべて集まって、 私たちに絵を描きます ニューラル ネットワークが言語をどのように表現しているかを知ることができ、 ニューラル ネットワークのスクラッチ パッドを提供します。
わかりました、素晴らしいです。 これで、脳からのスクラッチ パッドと AI からのスクラッチ パッドの 2 つができました。 そして私たちが知りたいのは、AI は脳が行っていることと同じことをしているのでしょうか? どうやってそれをテストできるでしょうか?
研究者が発見したものは次のとおりです。 新しいモデルをトレーニングするつもりです。 その新しいモデルは、特定の単語について ニューラル ネットワークのスクラッチ パッドを調べ 、同じ単語についての脳のスクラッチ パッドを予測しようとします。 ちなみに2時くらいにはできますよ。 それでは、新しいモデルをトレーニングしましょう。 ニューラル ネットワークのスクラッチ パッドで特定の単語を調べ 、脳のスクラッチ パッドを予測しようとします。 脳と AI の動作がまったく同じでなく、 共通点もなければ、 この予測タスクを実行することはできません。 どちらかを予測することは不可能です。
さて、私たちは道の分岐点に到達しました 。おそらく、私がこれからお伝えすることは 2 つのうち 1 つであることがお分かりいただけると思います。 AI はすごいと言うつもりです、 あるいは AI は詐欺師だと言うつもりです。 私のような研究者は、 AI は脳のようなものではないということを皆さんに思い出してもらうのが大好きです。 それは本当です。 しかし、AIと脳には何か共通点があるのでしょうか?
そこで、このスクラッチ パッドの予測タスクを実行したところ、 75 パーセントの確率で、 特定の単語について予測されたニューラル ネットワークのスクラッチパッドは、 ニューラル ネットワークのスクラッチよりも、 その単語の実際のニューラル ネットワークのスクラッチパッドに似ていることがわかりました。 ランダムに選ばれた他の単語を 埋め込む-- 75% は偶然よりもはるかに優れています。 単語だけでなく、文章や物語など、 より複雑な場合はどうでしょうか? この場合も、このスクラッチ パッド予測タスクは機能します。 私たちは脳からニューラル ネットワークのスクラッチ パッドを予測することができ、またその逆も可能です。 すばらしい。 ということは 、ニューラルネットワークやAIも私たちと同じように言語を理解するということなのでしょうか? そうですね、正直に言うと、違います。 これらのスクラッチパッド予測タスクは偶然以上の精度を示していますが、 基礎的な相関関係は依然としてかなり弱いです。 また、ニューラル ネットワークは脳からインスピレーションを得ていますが、 私たちが脳で見ている ような構造や複雑さは持っていません。 ニューラルネットワークもこの世に存在しません。 ニューラルネットワークはドアを開けたこと も、夕日を見たことも、赤ちゃんの泣き声を聞いたこともありません。 実際には世界に存在せず、実際 に世界を経験したことのないニューラル ネットワークは、 世界に関する言語を本当に理解できるのでしょうか?
それでも、これらのスクラッチパッド予測実験は、複数の脳画像実験や複数のニューラルネットワークなど 、成功を収めています 。 また、ニューラル ネットワークがより正確になるにつれて、 より脳に似た 方法でスクラッチ パッドを使用し始めることもわかりました。 そしてそれは言語だけではありません。 ナビゲーションとビジョンでも同様の結果が見られました。
つまり、AI は脳とまったく同じことをしているわけではありません が、完全にランダムでもありません。 したがって、私が座っている場所から、 AIが本当に私たちと同じように言語を理解できるかどうかを知りたければ、 中国語の部屋に入らなければなりません。 私たちは AI が何をしているのかを知る必要があり、 それを人間が言語を理解するときに何をしているのかを比較できる必要があります 。
AI の進歩は非常に速いです。 今日私が尋ねたいのは、 10 年後には愚かな質問に思えるかもしれない言語を AI は理解できるかということです。 あるいは10か月。
しかし、真実であり続けることが1つあります。 私たちは意味を作る人間であり、 これからも意味を探し 、周囲の世界を解釈し続けるつもりです。 そして、 AI の入力と出力だけを見ていると、 非常に簡単にだまされるということを覚えておく必要があります。 何が起こっているのかを確認するには、 AI の比喩的な部屋に入らなければなりません。 それはカウントの中にあるものです。