ZEROSHOT

「AIの副作用」を記録するメディア

物理AIでも「データ量がすべて」なのか。中国が60万人を動員する次世代AI競争の裏側

物理AIでも「データ量がすべて」なのか。中国が60万人を動員する次世代AI競争の裏側
Image credit: Rest of World

表面は「家事代行」、本質は「次世代AIの非対称戦」

北京のアパートにロボットが訪問し、3時間かけて服を3枚畳んだ。その間、依頼人の男性は約2,200円を支払い「物理AIに貢献できた気がする」と語った。 一見すると、まだ実用化には遠いポンコツロボットの微笑ましいテスト風景に見える。しかし、このニュースの背後にあるのは、次世代の「物理AI」の覇権をめぐる、静かで恐ろしい米中の非対称戦だ。

LLM(大規模言語モデル)の進化が私たちに叩き込んだ残酷な教訓がある。それは「最後はデータ量がすべてを決める」という事実だ。 そして今、その法則がそのまま物理AI(ロボット工学)の領域に持ち込まれようとしている。

「構造的優位」を持つのは誰か

現在、世界中のロボット企業が深刻な学習データ不足に喘いでいる。現実世界の多様な環境に適応するAIを育てるには、膨大な「人間の動き」のデータが必要だからだ。

ここで決定的な差が生まれつつある。 米国企業は人件費が高すぎるため、データ収集を途上国の労働者にアウトソースせざるを得ない。しかしそれでは「米国の一般家庭」や「最先端の工場」のデータは集まらず、環境の多様性に限界がくる。

対する中国は、国内で安価かつ大量に、自国のリアルな生活環境のデータを収集できる。 EC大手JD.comは地元政府と提携し、最終的に60万人を動員して1,000万時間分のデータ収集を目指すという。主婦が時給300円で家事を録画し、工場労働者が頭にカメラをつけて組み立て作業を記録している。

じわじわと開く、埋めがたい「差」

この「服を畳む」という小さなデータの積み重ねは、今はまだ微笑ましい実験レベルに見えるかもしれない。しかし、LLMの歴史が証明しているように、データ収集のサイクルが一度スケールし始めると、その差は後からアルゴリズムの工夫だけでひっくり返すことは不可能になる。

中国は、国家レベルの労働力動員という「構造的優位」を使い、次世代の物理AIの基盤となる膨大なデータセットを静かに、そして確実に構築している。

自分の動きを売って小遣いを稼ぐ主婦たちは、やがて来るロボット社会のインフラを自らの手で築いている。この地味で泥臭いデータ収集の積み重ねこそが、数年後の世界の景色を決定づけるのだ。