大規模言語モデルは本当に「創発」しているのか —— 最新研究によって否定される
7月17日、Sheng Luらが「大規模言語モデルにおける創発能力は、単なる文脈内学習なのか?(Are Emergent Abilities in Large Language Models just In-Context Learning?)」と題した論文を公開した。この記事では、大規模言語モデルにおける「創発」現象が単なるインコンテキスト学習の結果であるかどうかについて詳しく紹介されている。以下に、その内容を紹介する。