脳は、繰り返しよりも稀な出来事から多く学ぶ

Science/Research　詳細

脳は、繰り返しよりも稀な出来事から多く学ぶ

March, 9, 2026, San Francisco--UCSFの研究は、パブロフ犬と連想学習に関する100年前の前提を覆した。

100年以上前、パブロフは犬に鐘の音を食べ物と結びつけるよう訓練した。それ以来、科学者たちは犬が繰り返し学ぶと考えてきた。ベルを何度も聞いて餌をもらうほど、その音がすぐに食べ物を意味していることをよく理解できるのである。

今、UCSFの科学者たちはこの100年前の仮説を覆している。チームの新しい理論は、連想学習は何回起こるかよりも、食事を与えるような報酬の間にどれだけ時間が経過するかにより依存すると主張している。

経験があまりにも近づきすぎると、脳はそれぞれの出来事から学ぶことが少なくなる。例えば、試験のために詰め込み勉強をする学生は、学期を通して勉強した学生ほど成績が良くない理由を説明できるかもしれない。

「これらの手がかりと報酬のペアの間に時間がかかることで、脳がその経験からどれだけ学ぶべきかを判断することが判明した」と、神経学准教授、この研究の主任著者、Vijay Mohan K. Namboobidiri、Ph.Dは、Nature Neuroscienceに掲載された研究で語っている。

てがかりを学ぶ
科学者たちは伝統的に連合学習を試行錯誤のプロセスと考えてきた。脳が報酬につながる手がかりを検出すると、それを予測し始める。

最初は、脳は美味しい食べ物のような報酬が届いたときにだけドーパミンを放出するという理論である。しかし、報酬が十分に頻繁に訪れると、脳は合図を受け取るとすぐにドーパミンを放出し、それを予期し始める。ドーパミンの刺激は脳の予測を洗練させ、報酬が届かなければ手がかりとのつながりを強化し、報酬が現れなければ弱める。

Namboodiriとポスドク研究者Dennis Burke, Ph.Dはこれを検証したいと考えた。マウスに砂糖入りの甘い水を飲む音を結びつける訓練を行ったが、試行間隔を変えた。試験の間隔は30〜60秒、別の試験は5〜10分以上の間隔で行われた。つまり、試験間隔が近かったマウスは、同じ期間で報酬を受け取ったにもかかわらず、間隔が遠いマウスよりもはるかに多くの報酬を受け取ることになった。

もし連合学習が繰り返しのみに依存しているなら、試行数が多いマウスの方がより早く学習できたはずである。代わりに、報酬をほとんど得られなかったマウスは、20倍の試行回数を得たマウスと同じ量の学習をした。

「これが示しているのは、連想的学習は『練習が完璧を作る』というよりも『タイミングがすべて』だということだ」と、研究の第一著者であるBurkeは語っている。

NamboodiriとBurkeはマウスの脳内でドーパミンがどうなっているかを調べた。報酬の間隔が広がると、マウスは脳がドーパミンで音に反応し始めるまでに回数が少なくて済んだ。

次に、研究者たちは別のバリエーションを試した。チームは60秒間隔で音を繰り返し再生したが、マウスに砂糖水を与えたのは10%だけだった。これらのマウスは、合図後に報酬が続くかどうかに関係なく，合図の後にドーパミンを放出し始めるまでに、はるかに少ない報酬しかを必要としなかった。

より迅速な学習
この発見は、学習と依存症に対するわれわれの見方を変える可能性がある。例えば喫煙は断続的であり、タバコを見ることや匂いのようなサインが煙草の欲求を高めることがある。ニコチンパッチは常にニコチンを供給するため、脳内のニコチンとドーパミン報酬との関連を乱し、喫煙欲求を鈍らせ、禁煙を容易にすることがある。

次に、Namboodiriは新しい理論が人工知能を加速させる方法を調査する予定である。現在のAIシステムは学習が遅い。なぜなら、従来の連想学習モデルに基づいており、数十億のデータポイント間のやり取りごとに小さな調整を加えているからである。

「われわれが発見したことを借用したモデルは、より少ない経験からより速く学習できる可能性がある。しかし現時点では、われわれの脳は機械よりもはるかに速く学習できており、この研究はその理由を説明する助けとなっている」とNamboodiriはコメントしている。

Science/Research 詳細

脳は、繰り返しよりも稀な出来事から多く学ぶ

Science/Research　詳細