AI & Agents

3 articles

2026.05.27AI & Agents14 min read

エージェントメモリの設計 — 7軸サリエンス、半減期減衰、エピソードからポリシーへ

「全部覚える」エージェントメモリは検索ノイズと化します。Marianのメモリ基盤は、7軸のサリエンス(重要度・リスク・緊急度など)で記憶をスコアリングし、夜間ジョブで短期→長期へ昇格(consolidation)、軸ごとの半減期で減衰させて抽象度を引き上げる(distillation)、という生体記憶に似た2つのプロセスで管理します。エピソードDBスキーマ、合成サリエンスの重み、キュー索引によるO(最小ポスティングリスト)のリコールまで実装を解説します。

#agent-memory #episodic-memory #salience #memory-consolidation #ai-agents

2026.05.24AI & Agents13 min read

エージェントAPIに「責任境界」を埋め込む — エンベロープ・プロトコルの設計

マルチエージェントシステムの障害調査は「どのエージェントが、何の権限で、どのリクエストを処理したか」が分からないと始まりません。Marianは全APIルートをエンベロープ(封筒)契約で包み、trace ID・発信元・宛先・座標・ケイパビリティをメタデータとして強制します。さらに各エージェントは「禁止/回避/提案のみ/再確認/許可」の5段階責任境界を宣言し、ルート実装はevaluate()で判定を受け取ります。wire format、座標系、静的検証ハーネスまで解説します。

#multi-agent #agent-protocol #governance #api-design #observability

2026.05.22AI & Agents11 min read

ローカルLLMとクラウドLLMを同じ土俵に載せる — プロバイダ抽象化とブートストラップ設計

プライバシー重視のユーザーはローカルLLM(Ollama)を、品質重視のユーザーはクラウドを選びます。Marianのチャット基盤は provider パラメータ1つでOllama・OpenAI互換サーバー・Geminiを切り替え、NDJSONとSSEという異なるストリーミング形式を共通のチャンク列へ正規化します。さらに「Ollama未インストール」から「モデル取得済み」までを導く決定的ステートマシンのブートストラップウィザード(I/Oゼロの純粋関数)を実装しました。その設計を解説します。

#local-llm #ollama #streaming #provider-abstraction #gemini #llm-routing