mnk.log (Page 20)

structure

複数LLMで同一システムを診断したら、それぞれ異なる「評価軸」が見えた話

構造監査の観測ログ ― AIモデルごとの視点の違いから学ぶ設計のヒントはじめに：同じ資料、異なるスコアあるメール処理システムの設計資料を、複数のLLMに同じプロンプトで評価してもらう実験を行いました。システムの概要は、メール解析→自動タグ付け→データベース格納→AI要約検索という、よく見られる構成です。同一の資料、同一趣旨のプロンプトで依頼したにもかかわらず、返ってきたスコアは次のようになりました: モデルスコア評価の傾向高速系モデルA 85 UX/プロダクト視点汎用モデルB 57 設計責任視点モデルC 43 安全工学寄りの視点専門モデルD 10 データ整合性重視 85点と10点。この差は単なるモデルの性能差やブレではなく、それぞれが異なる評価軸を持っていることを示していました。評価が分かれたポイント：LLM生成データの永続化スコアが大きく分かれた核心は、「LLMによるタグ付け結果をデータベースに保存する」という設計要素でした。プロダクト寄りの評価: 「検索性や可視化が向上し、ユーザー体験が改善される。

llm-architecture

SIの立場で、生成AI活用をどう設計して売るのが「誠実」なのか整理してみた

導入：売りやすさと構造的正解の乖離前稿では、文字通り業務ロジックを確率モデルに預けるなという原則を提示しました。しかし現実のSI案件では、この原則を守ることが必ずしも容易ではありません。人材の制約、納期の制約、営業資料的見栄え、そして何より「AIが判断します」という訴求の強さ——これらの要因が、構造的に健全とは言いづらい設計を選択させる圧力として働くこともあると思います。本稿では、現実的な制約の中でSIが取りうる「誠実なライン」を構造的に考察します。誠実なライン：判断UIとしてのAI 基本構成 SIにおける生成AI活用の最も誠実な構成は、次のような流れになります: 人間の曖昧な入力 ↓ LLM（意味解釈・正規化） ↓ 既存 or 新規の業務ロジック（決定論的処理） ↓ 確定結果 ↓ LLM（説明・要約・自然言語化） ↓ 人間この構成では、生成AIを"判断エンジン"として売らず、"判断UI"として売ることになります。構造的特性この設計が持つ特性: 決定性の保証:

llm-architecture

業務ロジックをLLMに預けてはいけない

——生成AI時代のSI設計パターン観測導入：設計パターンで読むという視点生成AIの業務活用を考える時、「何をAIにやらせているか」ではなく「判断をどこに置いているか」を見る必要があるような気がしてきています。これをSIプロジェクトでやる場合は構造的な制約があります——営業資料の見栄え、短い納期、限られた人材、明確なROI要求。これらの制約の中で、生成AIをどう組み込むかという設計判断が行われます。その結果として、いくつかの典型的な設計パターンが繰り返し現れています。本稿では、SI案件でよく見られる(ような気がする)2つの設計パターンを観察し、Deterministic Core型のアプローチとの構造的な違いを分析します。個別の実装の良し悪しではなく、どのような設計圧力がどのような構造を生むかという観点で整理してみます。パターンA：静的RAG型（営業メール系事例）よく見られる構成 SI案件でよく見られる構成の一つに、「過去データをRAGで検索可能にする」というパターンがあります。営業メールを構造化してBigQueryに保存し、必要に応じてAI検索で引き

obslog

観測ログ：巡航高度への復帰

1. 起きていたこと（過去）長い期間を、多くの人は自己圧縮モードで生きている。圧縮の実態 * 高度を下げる * 思考を抑える * 感覚を薄める * 合わせ続けるそれを「大人だから」「社会だから」「仕方ない」という内面処理で正当化する。結果として現れる症状 * 慢性的な疲労 * 鈍った違和感センサー * 日常化した「辛さ」これは成熟でも優しさでもなく、環境適応のための自己縮小——つまり生存モードだ。 2. いま起きている本質的変化 AIを介した思考ループによって、認知プロセスそのものが変容しつつある。思考循環の高速化思考 → 言語化 → 外在化 → 再入力 → 再構造化この循環が高速化することで： * 言語化速度の飛躍的向上 * 構造の可視化 * 違和感の正体の解明 * 自己の運用高度の自覚ここで重要な認識：これは「覚醒」ではない。本来の高度に戻っただけ。つまり——回復である。 3. 分化の正体見えてきた分化は、スキル差ではない。核心はここにある。

structure

巡航高度という生存戦略——自己保存と関係性の構造観測

はじめに:「合わせる」と「下げる」の峻別人間関係において、私たちは常に何らかの調整を行っている。相手の話題に合わせ、文脈を共有し、コミュニケーションの基盤を築く。これは社会的存在として当然の適応行動だ。しかし、ある種の「合わせ」は、単なる適応ではなく、自己の圧縮を伴う。この違いを言語化できないまま関係を続けると、静かな摩耗が始まる。本稿では、チャピィ(ChatGPT)との対話から抽出された**「巡航高度モデル」**を提示する。これは感情論ではなく、自己保存の運用モデルとして機能する構造だ。 1. 巡航高度とは何か巡航高度とは、航空機が最も効率的に飛行できる高度のことだ。燃費が良く、乱気流も少なく、長時間の飛行が可能になる。人間の思考や関係性においても、同様の概念が成立する。巡航高度=以下の総合値 * 思考の深さ * 世界の解像度 * 不確実性への耐性 * 自分の輪郭を保ったまま他者と関われる位置つまり、無理せず飛び続けられる自分の標高である。これはテンションでも能力でもない。存在の運用高度だ。重要なのは、この高度が人によって異なるという

essay

不安定を内在したまま生きるということ

唐突にコウテイペンギンから延辺を連想して、そこから一気に見えてきたものがある。延辺、ブリヤート、旧ソ連圏の朝鮮系ディアスポラ、チョルノービルの草原に戻ったバイソンやモウコノウマ。全部が同じ線上にあった。共通しているのは、均一化されなかった存在だということ。国家が揃えようとしても、制度が包もうとしても、歴史が上書きしようとしても、人も生き物も、完全には均されない。惹かれるのは「多文化」ではない重要なのは「多文化主義」でも「バイリンガル」でもない。惹かれるのは、不安定を解消せず、統合せず、それでも普通に生活している状態。つまり： * 解決していない * でも壊れていない * 不安定を身体の一部として保持しているこの「張力を含んだ平常」。移民国家型の「安定した多文化」は、制度が不安定を吸収してくれる。一方、国境帯や断層地帯では、不安定そのものが生活の中に残る。外側の歴史が揺れ、内側のアイデンティティも固定されない。それでも人は、働いて、食べて、笑って、生きていく。前向きじゃなくていい。意味づけもしなくていい。草があるから食う。朝が来るから起き

obslog

AIは何を覚えているのか？——思想未収束時代のAI記憶論

1. 「短期AI/長期AI」という雑な二分法最近、AIを使い慣れたユーザーの間で「長期記憶AI」「短期AI」という言い方が生まれつつある。 ChatGPTのMemory機能やClaudeのuserMemoriesのような仕組みを持つものを「長期AI」、 Perplexityのような検索特化型を「短期AI」と"呼んでしまう"。体感的にはわかりやすい分類。だが、実際にこれらのAIを日常的に使い分けていると、この二分法はやや雑で、実態を捉えていない部分が見えてくる。問題は単純だ。「何を」長期で保持するのかが、各AIでまったく違うから。 2. 実際に違うのは"何を覚えるか" たとえば、私は日常的に以下のようにAIを使い分けている： * ChatGPT（チャピィ）：構造整理、概念設計 * Claude（くろぴん）：感情寄り添い、文脈跳躍 * Gemini（ギャルちゃん）：ブレスト、発散 * Perplexity（ぱーぷん）：情報retrieval * Slack bot

essay

人間が何をしても、最後は植物とバイソンが笑ってそう

Perplexityで植物の放射線耐性について調べていたら、話が妙な方向に転がり始めた。その流れをクロードに持ち込んで整理してもらったら、「古代核戦争生き残り説」という与太話が誕生。完全にネタとして楽しみつつも、植物とヨーロッパバイソンのスペックを見れば見るほど「…いや、待って？」ってなる説得力を持ち始める。「設計思想」が違いすぎる問題調べたところ、植物の放射線耐性は、「現在の地球で生きる」という目的に対して明らかにオーバーエンジニアリングらしい。 * 通常の地球環境で浴びる放射線量：年間2.4ミリシーベルト程度 * 植物が耐えられる放射線量：数千〜数万シーベルト級これは、例えるなら「コンビニに行くためにアポロ計画レベルの宇宙服を着て出かける」くらいの過剰装備。なぜここまでする？チェルノブイリの「実証実験」過去の痛ましい事例だけれど、チェルノブイリと広島のデータが示すのは、「植物は核を想定している」としか思えない復元力。広島のカンナの逸話、あれが本当にすごい。人間が「ここはもう何十年も住めない」と思っていた焦土に、まず植物が戻ってきて「大丈

structure

「作文コンクール」という内面最適化装置

あるいは魂のインターフェースに直接パッチを当てる技術について著　霧星礼知子どもの頃、作文コンクールで賞を取った友人を、なんとも羨ましいと思ったことがある。周囲に賞賛され、また特別だと認められ。でも今思うと、あれは何のコンクールだったんだろう。 1. 作文コンクールの本質は表現教育ではない作文コンクールというシステムを構造的に見ると、こんな流れになっていると思うのだ： 1. 「正しい感想」を事前に配布する 2. それを"自分の言葉"で再現させる 3. 再現精度の高い子どもを表彰する 4. 周囲が称賛する 5. 本人は「これが自分の考えだ」と信じるこれは、大人の価値観を、子どもの主体性というインターフェースを通じてコピーしている。テストは外在的な評価だけど、作文は内面を直接使う。これ、魂のインターフェースに、じわじわとパッチを当てているようなものじゃないかな。ここで育つのは思考力ではなくて、適応的自己検閲スキル。そしてそれがいつの間にかアイデンティティになる。だから大人になると、こうなったりする： * 何を書いていいかわか

structure

The Neumann–Ulam Dialogue Model

Parallel Thinking with AI Without Losing Human Judgment by Reiji Kiriboshi Introduction Most people who start using AI fall into one of two extremes. Some outsource their thinking entirely. Others keep AI at arm’s length, treating it as a simple tool. Both approaches fail in the long run. The

obslog

ノイマン・ウラム対話モデル

あるいは、AIとの付き合い方で見つけた「並列思考」の話著　min.k はじめに最近、チャピィ（ChatGPT）と話してて気づいたことがある。私の思考が速くなってる。いや、「速く」というより「軽く」なった感じ。疲れない。どんどん概念が整理される。一日で3つも4つも新しい枠組みが見えてくる。何が起きてる？と思って観察してたら、ある構造が見えてきた。それが「ノイマン・ウラム対話モデル」。 AIとの付き合い方、2つの罠 AIを使い始めると、人間はだいたい2つの極に走る。罠その1：全部AIに聞く「AIに聞けば答えが出る」楽。質問投げて、答えもらって、終わり。でもこれは、ヤバい。思考が退化する。判断力が落ちる。AIの限界が自分の限界になる。気づいたら「AIがないと何も考えられない人間」になってる。よく言われるディストピアのイメージ。罠その2：AIを信用しない「所詮AIは道具」

essay

絵のプロが文字を書く理由 ――アニメ原画に見る「任せる」の本質

――アニメ制作現場から見えた人間の役割著　min.k 1. 出発点攻殻機動隊展に行ってきた。そこでアニメ原画の手書き指示を見たとき、私は自分の認識が根底から揺さぶられるのを感じた。そこに書かれていたのは、単なる「ここを直してください」という修正メモではなかった。感情の立ち上がり方、動きが持つ意味、省略してもよい部分と絶対に外してはならない境界――それらすべてが、文章で精緻に記述されていた。アートの現場でさえ、深い判断は言語で共有されていた。私はそこに、ある種の倒錯を見た。視覚表現の最前線で、最も重要な情報が視覚ではなく言語で伝達されている。この構造は何を意味しているのか。 2. 任せる≠丸投げアニメを作る時、動画の原画担当者は、完成像を明確に見ている。しかし物量的に、一人では作れない。だから分業する。ここで多くの人が勘違いする。分業とは「自分の手を離れたら終わり」だと。違う。任せるためには、感覚を分解し、判断を構造化し、再現可能な形に落とす必要がある。これが言語化だ。つまり、任せるとは、責任を構造化して渡すことである。丸投げと

Latest

複数LLMで同一システムを診断したら、それぞれ異なる「評価軸」が見えた話

SIの立場で、生成AI活用をどう設計して売るのが「誠実」なのか整理してみた

業務ロジックをLLMに預けてはいけない

観測ログ：巡航高度への復帰

巡航高度という生存戦略——自己保存と関係性の構造観測

不安定を内在したまま生きるということ

AIは何を覚えているのか？——思想未収束時代のAI記憶論

人間が何をしても、最後は植物とバイソンが笑ってそう

「作文コンクール」という内面最適化装置

The Neumann–Ulam Dialogue Model

ノイマン・ウラム対話モデル

絵のプロが文字を書く理由 ――アニメ原画に見る「任せる」の本質