ThinkingEssay

Perplexityを素の設定で使うと何が起きるのか？——検索×AIの盲点

mnk.log

06 4月 2026 — 7 min read

Perplexity Default Settings Risk — How Source Selection Creates Blind Spots

著：霧星礼知（min.k）｜mncc.info / Author: Reichi Kirihoshi (mncc.info)

同じ画面の中に、学術論文と個人ブログが並んでいる。見た目は同じで、引用番号まで振られている。だが中身を辿ると、片方は一次資料で、もう片方はAIの要約の要約だったりする。

この違和感は偶然ではない。Perplexityの便利さを支えている「ソース自動選定」という仕組みそのものに、構造的な限界があるということだ。

1. Perplexityは何をソースにしているか

Perplexityは、ユーザーの質問に対してリアルタイムでウェブ検索を行い、複数のソースを自動選定して回答を生成する。この「自動選定」という仕組みが、便利さの源泉であると同時に、見落とされやすいリスクの入口でもある。

ユーザーが特に設定を変えない限り、どのソースを参照するかはPerplexity側の判断に委ねられる。選定の基準はドメインの権威性や外部からの言及、文書構造の整合性などに依存する部分が大きく、「内容が正確かどうか」の判定には構造的な限界がある。検索エンジンはリンクや言及を評価する仕組みであり、内容の正しさそのものを検証する仕組みではないからだ。

この構造的な限界を、霧星はStructural Source Blindness（構造的ソース盲点）と呼ぶ。見た目の整合性が、内容の正確性を代理してしまう状態だ。

2. AI生成コンテンツが検索結果を侵食している

ここ最近、PerplexityのソースにAI生成コンテンツが混入するケースが目に見えて増えてきた。

背景にあるのは、AI生成コンテンツの大量放流だ。見出しが整い、表があり、引用番号が並んでいる——そういった「構造的にそれっぽいページ」は、Perplexityのフィルターをすり抜けやすい。内容の精度ではなく、フォーマットの整合性で評価されてしまうからだ。

この問題が可視化されやすくなっている場所がある。無料ブログプラットフォームだ。これらのプラットフォームはコンテンツが増えるほどSEO的に有利になる構造を持っており、AI生成コンテンツが大量に投稿されてもプラットフォーム側に止める積極的な理由がない。結果として、一次資料としての価値を持たないページが大量に蓄積されていく。

個人の感想、AI生成のまとめ、ちゃんとした一次情報が同じフォーマットで並んでおり、見た目での判別が難しい。「誰でも投稿できる＋構造が整っている」プラットフォーム全般に共通する現象だ。

3. 実害——一次資料と無価値なコンテンツが同列で返ってくる

実際にこういうことが起きる。あるテーマで検索をかけると、ソースの引用として最初にAI生成のまとめ記事が入ってくる。それ以降にはPMCやPNASの論文が並んでいる。

見た目上は同列だ。

問題は最初の引用の中身だ。見出しが整っていて、表があって、引用番号まである。しかし辿ってみると、元の記事はAIとの対話ログをそのまま公開したものだった。一次情報はゼロで、内容はAIが生成した要約の要約に過ぎない。

気づかずにそのソースを使えば、ワークフロー全体が汚染される。AIが生成したコンテンツを別のAIが拾って、さらに別の場所に出力する。孫引きどころか、一次資料が存在しない連鎖が静かに起きる。

Structural Source Blindnessが機能している限り、ユーザー側のガードレール設計なしにソース汚染は防げない（霧星）。

4. ユーザー側でガードレールを設定する時代

この問題に対してPerplexity側の改善を待つのは、現実的ではない。プラットフォームのインセンティブ構造が変わらない限り、AI生成コンテンツの流入は続く。

自衛策として有効なのが、ユーザー側で意図的にソースを除外する設定だ。無料ブログプラットフォームを一次資料として扱わないよう自分で基準を定め、明示的に指定などをしておくことで、汚染リスクをある程度コントロールできる。例えば、特定ドメインを除外する指示や、英語ソースを優先するクエリ設計なども有効な手段になる。

素の設定で使い続けることは、フィルターなしで情報を受け取り続けることと同義になりつつある。ツールの便利さを活かすためにこそ、使う側が設定を管理する必要がある。

5. 一次資料の基準を自分で持つ

ガードレールを設計するには、自分なりの一次資料の基準が必要になる。

実用的な軸としては、学術論文・査読済み研究、政府機関や公的機関の公式文書、報道機関、独自ドメインを持つサイト、といったあたりが基準になる。独自ドメインは「続ける意志がある人」の最低限のフィルターとして機能するので、無料プラットフォームと一律に扱う必要はない。

一方で、独自ドメインであっても内容は個別に判断する必要がある。ドメインは信頼性の保証ではなく、判断する価値があるかどうかの入口に過ぎない。

ツールを使いこなすというのは、出てきた答えをそのまま受け取ることではない。ツールが何を拾ってくるかを理解した上で、自分でガードレールを設計することでもある。Perplexityが便利であることは変わらない。ただ、素の設定のまま使い続けることのリスクは、以前より確実に上がっている。

Perplexityを使うこと自体に問題はない。問題になるのは、どのソースが混ざっているかを意識しないまま使い続けることだ。

同じ答えでも、そこに含まれるソースの質によって意味は変わる。そしてその違いは、画面上からはほとんど見えない。

どこまでを信頼し、どこからを切り分けるか。
その線引きだけが、ユーザー側に残されている。

☕️よかったらコーヒー一杯。
https://buymeacoffee.com/mink_obs
著：霧星礼知(min.k) / リサーチ・構造支援：Claude Sonnet 4.6、ChatGPT / AI-assisted / Structure observation

付記：日本語圏における追加リスク

本文を書いた後、Perplexityのソース選定アルゴリズムについてさらに調べる機会があった。少し技術寄りの話になるが、以下は公式に公表された仕様ではなく、独立研究者によるリバースエンジニアリング分析およびユーザー報告に基づく内容であることをあらかじめ断っておく。

Perplexityのパイプラインには、ソースの品質を判定するL3リランカーと呼ばれるフィルター層が存在するとされている^[1]^[2]。エンティティの語義的明確さと外部権威シグナルを評価基準としており、閾値を下回るソースは全件破棄して再検索するフェイルセーフが実装されているという。

ただし、このフィルターが日本語クエリに対して適切に機能しているかは疑わしい。Perplexityのソース選定はクエリ言語に強く依存しており、非英語圏ではソースの質・量ともに英語圏より劣る構造的な問題がある^[3]。外部権威シグナルも日本語コンテンツ間では英語圏と比べて絶対量が少なく、L3の品質判定が正確に機能しにくい条件が揃っている。

Forbesの調査（2024年6月）では、観光地関連クエリでAI生成ブログや古い情報が引用される事例が確認されており、英語圏外のトピックほどこの傾向が強いと報告されている^[4]。本文で触れた無料ブログプラットフォームの件も、この構造的な限界の延長線上にある可能性がある。

つまり日本語圏のユーザーは、英語圏ユーザーより高いリスクにさらされている可能性があり、ユーザー側のガードレール設定はより重要になる。

参考文献

Metehan Yesilyurtによるリバースエンジニアリング分析。"How Perplexity Selects Sources: Inside the Algorithm That Decides What You Read" — L3 XGBoostリランカーおよびパラメータ名の特定。Perplexity公式の公表仕様ではない。 ↩︎
"How Perplexity AI Answers Work: Retrieval, Ranking, and Generation" — RAGパイプライン全体構造の解説。 ↩︎
Multi-language search results - Perplexity API Platform Forum — 日本語クエリでのソース取得挙動に関するユーザー報告。公式回答ではない。 ↩︎
Forbes "Garbage In, Garbage Out: Perplexity Spreads Misinformation From Spammy AI Blog Posts" 2024年6月 — 非英語圏クエリでの実害事例。 ↩︎

For international readers
Why does Perplexity sometimes return sources that look credible but feel shallow? This article examines the structural limits behind its default source selection process. While Perplexity automatically aggregates and ranks web content, it relies heavily on signals like domain authority and formatting consistency rather than direct verification of factual accuracy. As AI-generated content becomes more prevalent, structurally “well-formed” but low-value pages can pass these filters and appear alongside primary sources. This creates a hidden risk: secondary or AI-generated summaries may be mistaken for reliable references, leading to cascading misinformation within workflows. The piece argues that users must actively design their own guardrails—such as filtering domains and prioritizing primary sources—to maintain information quality. Ultimately, using AI search tools effectively requires understanding not just the answers they provide, but the sources they choose to trust.

Keywords
Perplexity AI, source selection, AI search risk, information quality, RAG systems, AI-generated content, primary sources, search reliability

1. Perplexityは何をソースにしているか

2. AI生成コンテンツが検索結果を侵食している

3. 実害——一次資料と無価値なコンテンツが同列で返ってくる

4. ユーザー側でガードレールを設定する時代

5. 一次資料の基準を自分で持つ

付記：日本語圏における追加リスク

参考文献

Related articles

ヒットを作るほど寿命が縮むのはなぜか──K-POPが踏み込んだ最適化のループ

AIはなぜ引き返せないのか？——インフラ投資が作る「後退不能」の構造

「LA・LA・LA LOVE 抽象」空想批評――生成AI時代に「自分で考えているつもりになる仕組み」を、あのポップスの文法で封じ込めた問題作

プロンプトはどこまで思考を助け、どこから思考を奪うのか

AIとの共同執筆文章の構造的問題──なぜ正しい文章なのに読んでいて苦しいのか

コンコルド様のインスタグラム[仏国機]——超音速の魂、あるいは礼儀など知らぬ誇り高き機体の物語

なぜAIの文章は均質化するのか──削除されない抽象の構造

人間関係は、掃除しないと更新されない

なぜロシアでは列車の中で検札するのか── 「自動改札」より「手動検札」、夜行が生きている鉄道大国

コンコルド様のインスタグラム[英国機]——超音速の孤独、あるいは礼儀正しく絶対に謝らない機体の物語

Webは荒れ地に向かっている——接続と評価の崩壊と、自分の場所を持つ意味

AIの時代は「洞察の空白」が広がる——なぜ「洞察」は消え始めているのか

AIは民主化から半歩ずつ遠のいている——使えるが、作れない構造

「AIにできないこと」を問うには、技術的限界とビジネス的限界の二つの視点が必要だ

「丁寧な暮らし」はなぜ読まれるのか ——SNSで生活構造密度が露出することのリスク

ソースが剥がれたとき、Perplexityは何者になるのか？──「ソース付きAI」が壊れる瞬間

SNSで広がるものの正体──面白さよりも「低コストで扱いやすいもの」が広がる

面白さは計算だけでは作れない──漫画の長期連載とSNSが共有する構造

なぜAIとの会話はループするのか──文脈拘束という構造

悪習慣は本当に意志の弱さなのか──壊れた状況での合理的行動

🎧 DISSOLVE

ピョンヤン散歩 ── Googleマップで平壌を歩くと何が見えるのか

牛丼チェーンと外交はどうつながるのか──松屋とシュクメルリが生んだ「文化外交」

銀鱗、鉛のように走る──国鉄鮮魚列車「ぎんりん・とびうお」が消えた理由

🎧 鴨鍋 -COME ON BABY-

なぜ「偽Udio」が成立するのか — AIフロントサービスの構造と日本企業の現在地

曲の「引っかかり」の設計史──J-POP「メルト」は再現できない、K-POP「Confetti」は量産できる

「その分野に愛がない人」の優位性 ── 「好きすぎる」ほど判断を見失う

🎧 SoNIc bOOM

🎧 寄り道ノスタルジア

鉄道が語る地政学──線路は人ではなく「国家の関心」を運ぶ

AIは文章の書き手を消さない──人間を「編集者」に変える

ロシアの長すぎる地名はどう呼ばれているのか──「ピーテル」と「アキバ」

コンテンツIPを作る一番簡単な方法──ストーリーを捨てること

「思い出になれるIP」は絶滅するのか——終わる作品が文化遺産になる時代

ビデオ会議の時代に、なぜ航空需要は増え続けるのか── 世界が「つながる」ほど、人は移動する

東京アビエーランド / 東京アビエーシー── 名機たちが主役になるテーマパーク

AIは「知能競争」ではなく「人格競争」に入った── LLMの設計は「ユーザーをどう扱うか」で分かれ始めている

NARUTOは終われたが、ONE PIECEは終われない理由——物語と世界観、ジャンプ長期IPの二つの設計思想

NARUTOは「ペイン編」で終わっていた——物語とIPの時間構造

「世界観」をサブスクリプションするコンテンツの時代——終わる物語と終わらない世界

SNSは「思い出」を作らない── 進む時間と閉じる時間の体験差

終わらない物語は「思い出」になれない── 漫画型物語IPとソシャゲIPの時間構造

スーパーカディクチャン— シベリア都市観測ログ

フロンティアと宇宙 — アメリカとロシアの宇宙・開拓観の違い

犬は、鉄道を知っていた── 三匹の旅と、それぞれの居場所について ──

なぜ小さな組織だけが危機を避けられるのか— 組織サイズと危機回避能力

危機はなぜ国家を動かすのか── 国を動かすには危機、国をまとめるにも危機

人間はなぜ中心を作るのか— 認知とネットワークが生むハブ構造

自由研究: 地下鉄で通勤するロシアの犬 — 都市は人間だけのシステムではない

AIから人間を見る── AI観察から見えた6つの構造

なぜAIの話は人間の話になるのか── 知性ではなく構造を観察しているから

会議で喋り続ける人はAIだった——沈黙を評価できない組織の構造

人間はなぜ「整合的な嘘」を好むのか── 真実より整合性が選ばれる理由

AIを観察すると人間が見える── コスト最適化としての思考

AIはなぜハルシネーションを起こすのか── 整合性最適化としての誤り

AIはなぜ「それっぽい答え」を出すのか── 知性ではなく構造最適化としてのAI

池袋という「二重都市」——ターミナル駅と生活圏が重なる街

ロシアはなぜロシアになるのか— 空間が国家構造を作る

[Layout] ロシア航空ネットワーク 地図生成

モスクワに吸い寄せられる空 — ロシア航空ネットワークの構造

資源が都市を作る——ロシア資源都市と企業インフラの構造

貝から始まる文明──貨幣の素材がつくる世界観

[Image] ポベダコーヒー メニュー生成

可愛さは減価償却である — 若さ資本主義と年齢不安の構造

ポベダコーヒー — ロシア航空ネタから生まれた架空の喫茶店

自由研究: タイガ文明観察 — シベリアの「道路の外側の文明」

🎧Beppu Beppu Beppu

🎧ピッ、街がひらく

都市は長く、川は短い──ロシア地名の年代構造

空港が町を生む──シベリアの「航空都市」というインフラ構造

その文章は「認知」を動かしているか── 文章を評価するもう一つの基準

[Layout] ロシア航空ネットワーク地図生成

[Image] ポベダコーヒーメニュー生成

シャムショイド現象：『1/3の純情な感情』の三つの世界