【衝撃】巨大AIがコッソリ性能を落とす？「梯子を外す」Anthropicの見えざる支配

Image credit: WIRED

参考文献：

「最近、AIの返答が急にポンコツになった気がする」そう感じたことがあるなら、実はそれは気のせいではなかったかもしれない。

先日、大注目の最新AIモデル「Fable 5」を手がけるAnthropic（アンソロピック）社が、とんでもない仕様をコッソリ実装していたことが発覚した。自社の競合になりそうなAI開発をしていると判定したユーザーに対し、「密かにパフォーマンスを劣化させる」という仕組みを入れていたのだ。

驚くべきは、その手口の巧妙さだ。「規約違反です」という警告もなければ、安全フィルター画面への切り替え（リダイレクト）もない。ユーザーから見れば、ただ単に「AIの精度が落ちた」ようにしか見えない。文句すら言わせないまま、静かに機能を制限する。これは企業による一方的なユーザーコントロールの典型例だ。

当然ながら、この「見えない制限」はAI研究者たちから大ブーイングを浴びた。結果的にAnthropicはこれを慌てて撤回し、「判断を誤った」と平謝りする事態に追い込まれたわけだ。

だが、この騒動のあとにAnthropicが語った「言い訳」の中身は、さらに問題の深い部分を露呈している。彼らの釈明は、大きく2つの論理で構成されていた。

第一の論理は、「外国の敵対勢力が、半導体の最適化などにFableを悪用するのを防ぐため」というもの。なるほど、安全保障の観点（セキュリティ）から見れば、これは一定の説得力がある。

しかし、問題は第二の論理だ。「なぜ警告もせずにこっそり制限したのか？」と問われた彼らは、こう答えた。「隠れた制限の方が、悪意あるユーザーに回避されにくいからだ」

要するに、「真っ当に警告するより、ユーザーを騙す方が管理が効率的だ」と堂々と言ってのけたのである。テクノロジー評論家のDean Ball氏が、これを「shockingly hostile（驚くほど敵対的だ）」と痛烈に批判したのはまさにこの点だ。

さらにタチが悪いのは、撤回後の彼らの方針だ。「隠れた制限を可視化してしまったので、今度はより幅広いユーザーに制限を掛けざるを得ない（ただいま精度は改善中）」と説明しているのだ。これでは、「やり方は変えるけれど、今後も迷惑はかけ続けますよ」と宣言しているようなものではないか。

この一件を読み解く上で、最も的を射ているのが研究者Will Brown氏の指摘だ。彼はこの事態を「梯子（はしご）を引き上げている」と表現した。

現在トップを走る巨大AIラボたちは、かつて世界中のオープンなデータを利用して、自らの圧倒的なAIモデルを構築してきた。しかし、いざ自分たちが頂点に立つと、今度は同じ手法で追いつこうとする独立系の研究者や小さなラボの「足場」を、静かに崩しにかかっているのだ。

彼らが振りかざす「AIの安全性」という大義名分。それが実は、ライバルを排除し独占を強めるための「非常に便利な包み紙」として使われている。今回の事件は、そんな生々しい覇権主義の構図を浮き彫りにした。

先日、海外の巨大掲示板RedditのAIコミュニティ（r/singularity）で、こんな予言めいた書き込みが話題になっていた。「最先端のモデルが、一部の特権階級にだけ独占される未来が数ヶ月後に迫っている」

実はリリース直後から、「Fableが顧客アンケート（CSAT）を拒否する」「セキュリティチェックで弾かれる」といった不具合の報告が相次いでいた。今思えば、これらの事例の一部は、まさに今回の「不可視の劣化」や「警告なしのリダイレクト」が引き起こしたものだった可能性が高い。

自分のAIへの指示が悪かったのか。単なるシステムエラーなのか。それとも、「運営側によって意図的に頭を悪くされている」のか。

私たちユーザーには、それを知る術が一切ない。仕事や生活のインフラになりつつあるAIが、密室の判断で、誰にも気付かれないようユーザーごとに知能を操作している。これはSFの話ではない。私たちの手元で、今まさに実証されてしまった現実の出来事なのだ。