1994年、フロリダのジュエリーデザイナー、ダイアナ・デュイザーは、グリルドチーズサンドイッチに聖母マリアの顔を見たと主張した。この事件は大きな話題となったが、同時にパレイドリアと呼ばれる古くから知られている心理現象にも注目が集まった。しかし、いったい何がこの傾向を引き起こすのだろうか。また、機能が進歩した機械は、人間と同じようにパレイドリアを経験することができるのだろうか?
MITのコンピュータ科学・人工知能研究所(CSAIL)の画期的な新しい研究は、このような疑問に答えることを目的としており、5,000枚の人間がラベル付けした幻の顔画像の広範なデータセットを導入している。このデータセットのおかげで、研究者たちは人間と人工知能(AI)システムがどのようにこれらの幻の顔を処理するかのニュアンスに潜り込むことができ、その過程で予想外の洞察を発見することができた。
顔のパレイドリアの起源
MITの博士課程に在籍するマーク・ハミルトンが率いるこの研究は、パレイドリアの深い起源を探るものだ。「顔のパレイドリアは長い間心理学者を魅了してきましたが、コンピューター・ビジョンの世界ではほとんど未解明でした」とハミルトンは説明する。チームの目的は、そのギャップを埋め、人間やAIが、雲やコンセント、あるいはグリルドチーズサンドイッチなど、技術的には存在しない場所でどのように顔を検出するかを調査することでした」。
パレイドリックな顔を認識するAIの苦闘
重要な発見のひとつは、AIモデルは当初、人間と同じようにパレイドリックな顔を認識できなかったことだ。人間は車のヘッドライトや床の模様のような日常的な物体の中にある顔を瞬時に「見る」ことができるが、機械はより複雑なトレーニングを必要とする。研究によると、動物の顔を検出するようにアルゴリズムを微調整して初めて、パレイドリックな顔を識別する能力が大幅に向上した。
動物の顔を認識することと、錯視の顔を認識することとの間のこの驚くべき関連性は、パレイドリアの進化的起源である可能性を示している。この結果は、パレイドリアが人間の社会的行動からではなく、もっと深いところから生じている可能性を示唆しています。例えば、潜んでいる虎を素早く見つけたり、鹿がどちらを向いているかを識別することで、原始的な祖先は狩りをすることができたのです」とハミルトンは言う。
パレイドリアのゴルディロックス・ゾーン
MITの研究によるもう一つの重要な発見は、"パレイドリアのゴルディロックス・ゾーン "の特定である。この用語は、人間も機械も顔でない物体の中に顔を認識する可能性が最も高い、視覚的複雑さの特定の範囲を指す。MIT教授でこのプロジェクトの主任研究者であるウィリアム・T・フリーマンによれば、画像が単純すぎると顔を形成するのに十分なディテールがないが、複雑すぎると視覚的ノイズになるという。
この現象をモデル化するために、研究者たちはパレイドリアが最も起こりやすい場所を予測する式を開発した。その結果、特定の複雑さの範囲内で顔を検出する可能性がピークに達することがわかり、人間とAIシステムの両方を使ったテストによって検証した。この "パレイドリック・ピーク "は、私たちの脳、そして今や機械が錯視の顔を認識するのに必要な単純さと複雑さの微妙なバランスを浮き彫りにしている。
最大のパレイドリック・データセットの構築
この研究の重要な要素は、これまでのパレイドリック刺激のコレクションを凌駕するデータセットを作成したことである。CSAILチームは、LAION-5Bデータセットから約20,000点の候補画像を収集し、人間の顔認識に基づいて細心の注意を払ってラベル付けと判定を行った。各画像は、その顔が喚起する感情、年齢、偶然に見えるか意図的に見えるかなど、さまざまな要素で評価された。何時間にも及ぶ人間によるアノテーションを伴うこのプロセスは、AIと人間の認知の両方の研究を前進させるリソースを構築するために不可欠だった。
ハミルトンは、この途方もない作業に費やされた個人的な努力をユーモラスに認めている。「データセットの多くは、私の母のおかげです」と彼は語り、引退した銀行員である彼の母が画像のラベル付けを手伝ってくれたことに言及している。
パレイドリアを超えるアプリケーション:顔検出から製品デザインまで
この研究は、パレイドリアという特異な現象に焦点を当てたものだが、その意味はそれだけにとどまらない。この研究から得られた洞察は、AIベースの顔検出システムを大幅に改善し、誤検出を減らす可能性がある。このことは、顔検出の誤作動が危険なミスにつながりかねない自動運転車のような分野や、パレイドリアを認識したり回避したりすることで機械とのインタラクションをよりスムーズにすることができるロボット工学や人間とコンピュータのインタラクションのような分野での実用的な応用につながる。
さらに、この発見は製品デザインに応用できる可能性がある。パレイドリアを理解し、コントロールすることで、デザイナーはより親しみやすく、より威圧感のない製品を作ることができるかもしれない。「自動車や子供のおもちゃのデザインを自動的に微調整して、より友好的に見せたり、医療機器が不注意に威嚇的に見えないようにしたりできることを想像してみてください」とハミルトンは言う。
人間と機械の認識のギャップ
この研究はまた、人間と機械の知覚の違いについても興味深い問題を提起している。人間は本能的に無生物を人間のように解釈するが、AIアルゴリズムはそうではない。例えば、人はコンセントを「歌っている」と認識し、「唇が動いている」と想像するかもしれないが、AIはこのような漫画のような顔を「見る」ことはない。
「人間の知覚とアルゴリズムによる解釈のこの違いを説明するものは何か?パレイドリアは有益なのか、有害なのか?これらの疑問は、他の多くの疑問とともに、この古典的な心理現象に関する研究チームの進行中の調査の基礎となっている。
先を見据えて人間のようなAIシステムへ
CSAILチームは、より広範な科学コミュニティとデータセットを共有する準備をしながら、すでに将来を見据えている。次のステップとしては、パレイドリックな顔を検出するだけでなく、より人間に近い方法で顔を理解し、説明できるようにAIシステムを訓練することが考えられる。例えば、視覚言語モデルは、より人間の経験に近い方法で視覚刺激に関与するように設計される可能性がある。
「これは楽しい論文だ!読んでいて楽しいし、考えさせられます」と、この研究には参加していないカリフォルニア工科大学のピエトロ・ペローナ教授はコメントしている。ハミルトンらは、興味深い疑問を提示している:ハミルトンらは、"なぜ人は物の中に顔を見るのだろうか?
最終的には、この研究はパレイドリアについての理解を深めるだけでなく、人間と機械の知覚の幅広いメカニズムに光を当てることになるかもしれない。アメリカ国立科学財団、アメリカ空軍研究所、アメリカ空軍人工知能アクセラレーターの支援を受けているこの研究は、人間のような経験や相互作用をよりよく把握するAIシステムを作る道を開くものである。
私たちの世界がAIによって形作られ続ける中、人間の直感とアルゴリズムの論理のギャップを理解することは極めて重要である。MITの研究者たちは、パレイドリアのような気まぐれな現象を研究することで、機械がどのようにして世界をよりよく「見る」ことができるのか、そしていつか、グリルドチーズサンドイッチの中に顔があるという驚きを共有することができるのか、より深い理解への扉を開いた。