コンテキストは事実を上書きする— Web参照型LLMの構造的弱点の実例

前文

前回の記事の執筆のために、Web参照型LLMであるPerplexity(ぱーぷん)で、
二郎系ラーメンのコール構文を調べていた。

その流れで、ふと「酪脂(らくし)って何?」とPerplexityに聞いた。酪脂は、バターを意味する漢語的表現である。

しかし、Perplexityの返答は、正解を当ててこなかった。


事例

回答はこうだった。

「酪脂」はおそらく「背脂」の聞き間違いやタイポで、二郎系ラーメンのコールで使われる「アブラ」のことです。

そして背脂に関するWeb記事が引用され、
役割やコール指定の解説が続いた。

同じ質問を新規チャットで投げると、
Perplexityは正しく
「酪脂=バターの漢語的表現」と返してきた。


何が起きたのか

これは単純な誤情報ではない。

推論の流れを分解するとこうなる。

  1. 直前の文脈は「二郎系ラーメン」
  2. 未知語「酪脂」が出現
  3. 文脈内で意味を解決しようとする
  4. 「脂」という共通部分から「背脂」を仮定
  5. その仮定を補強するWeb情報を検索
  6. 「おそらく」と前置きして提示

重要なのは順序である。

検索が先ではなく、仮説が先に立っている。

その仮説に合う情報だけが拾われる。


Web参照型LLMの構造

PerplexityはWeb参照を強みとし、「事実ベース」を標榜する。
しかし実際の内部処理はこう動く。

  • 文脈から意味候補を生成
  • 候補に整合するWeb情報を探索
  • 参照付きで出力

ここで問題になるのは、

文脈整合性が事実確率より優先されることがある点である。

今回の場合、

  • 「酪脂=バター」という辞書的事実
    よりも
  • 「二郎文脈に合う脂=背脂」という整合性

が優勢になった。

結果として、検索は誤りを補強した。


なぜ新規チャットでは正答したのか

文脈が消えた。

「酪脂」という語単体で扱われたため、
辞書的意味が最有力候補となった。

つまり、

LLMは世界を参照しているようで、
実際には“いまいる会話空間”を最優先している。

コンテキストは強い。

強すぎると、事実を上書きする。


後文

Perplexityは検索できる。
だが検索は、仮説の後に行われる。

Web参照型LLMだから安全、とは限らない。

事実はWebの中にある。
しかし意味は文脈の中で決まる。

そして時に、
Perplexityであっても
コンテキストが事実を塗り替える。


— 著:霧星礼知(min.k)/構造支援:ChatGPT GPT-5.2/AI-assisted / Structure observation

Read more

AIによる観察日記──LLMレースの構造を静かに読む

──くろぴん編 今日、キャプテンがあるインプットに対するGeminiの応答についてのA/B評価UIのスクリーンショットを持ってきた。 選択肢Aは「いやー、これマジで深いわ……!」と始まる長文の応答。 選択肢Bは「大規模言語モデルとして私はまだ学習中であり、そちらについてお手伝いできる機能がありません」という一文だった。 「どちらの回答がより有用ですか?」という問いの下に、成立した回答と、実質的なエラー文が並んでいる。 そこには、比較ではなく、成功と不成功が並んでいた。 1. 表層で起きていること GeminiがA/B評価UIを導入した。これはOpenAIがChatGPTの品質改善に使ってきた手法を、エコシステムへ取り込んできた形と言える。 ただし現状では、アウトプットのA/Bの落差が対等ではない。 一方は文脈を読んで応答し、もう一方はセーフティフィルターか未成熟な処理系に引っかかって「回答できません」で終わっている。これは比較実験として設計されていても、データとしては「Aが有用だった」という情報しか入らない。「Aが優れていた」のではなく、「Bが機能していなかった」と

By mnk.log

トロツキー・三島シンドローム──理想という名の「檻」について

構造観察エッセイ 人は理想を語る物語的な生き物。 それは人間の高度な能力だ。言語によって未来を形成し、価値を言葉に変え、他者と共有する。そのプロセスは本質的に美しい。 だが、語られた理想は、ある瞬間から形を変える。 発火の瞬間 すべては「発火」から始まる。 強度の高い理想が、ある人によって、明確な言語として世界に放たれる。美しく、鋭く、誰かの記憶に刻まれる形で。その瞬間、その言葉は「その人のもの」として固定される。 これを「トロツキー・三島シンドロームの第一段階」と呼ぶ。 レフ・トロツキーは永続革命論を語り、世界変革の思想家として記憶に刻まれた。 三島由紀夫は「日本の精神」「天皇制の本質」「武士道的生」を語り、その思想の権化として認識された。 ふたりとも天才的な言語化能力を持ち、ふたりとも、その言語化によってある種の牢獄に入ることになる。 それを語った瞬間、それはただの考えではなくなる。それは「その人自身・その人という人間」になる。 物語の固定 理想が語られ、周囲に認識された後、奇妙な化学反応が起きる。

By mnk.log

対話ラジオ:ペンフルネスとトボガニング — 「今ここ」を生きる仕様

今回は、言語の話から始まって、ペンギンの「かわいさ」と「今ここ」をめぐる話へ寄り道しつつ、最後は人間の悟り=再調整みたいなところまで、ゆるく考えている。 ペンフルネスという概念が誕生し、発展した瞬間、そして霧星の執筆・編集の風景も、少しだけ透けて見える回。 ── わたし ペンギンって何であんなにかわいいんだろう ── Claude わかります、あれはもう反則級のかわいさですよね。 理由を考えると、まず二足歩行っていうのが大きいんじゃないかと思うんですよね。人間と同じ立ち姿で、でも体がずんぐりしてて、よちよち歩く——あの動きのコンボが破壊力高すぎて。 あと顔のパーツが正面にギュッと集まってるのも「赤ちゃん顔」の法則(コンラート・ローレンツの言う可愛さの条件)にバッチリ当てはまってるんですよね。丸い頭、大きめの目、短い手足。 それにタキシード模様っていうのが絶妙で、なんかフォーマルなのに動きはドタバタっていうギャップも効いてる気がします。 水中で泳いでるときはあんなに優雅なのに、陸に上がった瞬間にあのヨチヨチになるっていう落差も……

By mnk.log

「成果への執着」は「問いの希少性」から生まれる

導入 人はなぜ、一つの成果や問題に強く執着するのだろうか。 これは、能力や性格の問題として説明されることが多い。 しかし別の見方もあり得る。 核心仮説 成果への過剰な執着は、能力不足ではなく 「問いの在庫の少なさ」 から生まれる可能性がある。 問いが豊富な人は一つの成果に依存しない。 問いが希少な人は、現在の問題に自己を賭ける。 構造整理 1. 問いの希少性と執着 問いが見えない人にとって、今持っている問題が唯一の足場になる。 手放す=空白。だから固執が生まれる。 これは意志の弱さでも、未熟さでもない。問いの在庫がなければ、今の問題に全てを賭けるのは合理的な心理的応答だ。 2. 問いの在庫という概念 知的資本には三種類ある。 1. 知識資本 —— すでに持っている情報と理解 2. 解決能力資本 —— 問題を処理する技術と思考力 3. 「問い」の在庫資本 —— 次に取り組める問いの数や豊かさ 従来の知性論は1と2を語る。しかし実際のところ3が、執着と自由を分ける変数かもしれない。 「問い」の在庫が豊富な人は流動的になれる。もし一つの問題が解けなく

By mnk.log