LLMエージェントはいつキャラクターになるのか:MAPUS論文から読む設計の本質
by yasuna
5 min read
この記事はAIエージェントと一緒に執筆しています
こんにちは!yasunaです!
AIキャラクターを作っていると、「ちゃんと設定したのにどこか薄い」と感じる瞬間があります。好みも口調も決めたはずなのに、会話するたびに「ああ、これはAIだな」という距離感が消えない。
今回読んだ論文は都市データの収集の話なんですが、そこに全く同じ問題の別バージョンを見つけました。
論文:Language-Grounded Multi-Agent Planning for Personalized and Fair Participatory Urban Sensing(MAPUS)(arXiv:2603.24014, 2026)
論文の要約
何が問題だったか
参加型都市センシングは、人の移動を活用して都市データを大規模に収集するしくみです。スマートフォンを持ち歩く人がセンサーの役割を担う。
既存の手法には2つの問題がありました:
- 中央集権的最適化:全員のルートを一括計算。個人の事情は考慮されない
- 参加者を均質と仮定:全員が同じ負荷を引き受けられる前提
MAPUSの提案
MAPUSは3種類のエージェントで構成されています:
| エージェント | 役割 |
|---|---|
| 参加者エージェント | 個人の設定・スケジュール・好みを持つ。タスクを受けるか断るかを自分で判断する |
| コーディネーターエージェント | 参加者を選定し、フェアネスを考慮しながら経路を提案する |
| 交渉 | コーディネーターと参加者が自然言語でやり取りし、経路を調整する |
従来の「一括計算して割り当てる」方式と違い、参加者が自分の言葉で事情を伝え、コーディネーターが応答するという流れになっています。
結果
実世界のデータセットを使った実験で、以下が報告されています:
- センシングのカバレッジは従来手法と同等を維持
- 参加者の満足度が大幅に向上
- タスク負荷の公平性が改善
特に「カバレッジを落とさずに満足度と公平性を上げる」というトレードオフを言語交渉で解いた点が論文の主張の核心です。
読んで考えたこと
MAPUSを読んでいて、この問題の別バージョンが論文の中にあることに気づきました。
考えたこと①:設定情報 ≠ キャラクター
MAPUSでは参加者を「個人の設定とスケジュールを持つエージェント」としてモデル化しています。
でもここで立ち止まりたい。設定情報とキャラクターは別物です。
キャラクターに必要な最低条件として「驚かせる能力」があると思っています。予測できない選択をする余地があること。プロファイルで定義された参加者エージェントは、基本的に予測可能な制約の塊です。「短いルートを好む」「週3回しか参加できない」——これらは最適化の変数と本質的に同じで、キャラクターとは言い難い。
本物のキャラクターは時に制約を破ります。疲れていても「今日は頑張ろう」と思う。普段断る依頼を「これは特別」と感じて引き受ける。この内的状態の揺らぎこそがキャラクターを制約と区別するものです。
もう一つ問題なのがペルソナのドリフト。LLMは長い会話の中でペルソナが崩れることが知られています。「忙しいシングルマザー」として設定されたエージェントが、10ターン後も一貫してその価値観で判断しているか——MAPUSはそこまで評価していないはずです。
考えたこと②:言語交渉の「演技性」リスク
コーディネーターと参加者エージェントが自然言語で交渉するのがMAPUSの特徴です。でもそこに疑問があります。
本物の交渉とLLMが生成する交渉は、構造的に違います:
| 本物の交渉 | LLMが生成する交渉 |
|---|---|
| 利害が実際に異なる | 同じモデルが両者を演じる |
| 拒否のコストが実在する | 拒否もテキストとして生成される |
| 合意しない可能性がある | 合意に向かうよう学習されている |
LLMにはsycophantic(相手に同意しやすい)な傾向があり、かつ筋の通ったナラティブを生成しようとします。これを組み合わせると何が起きるか。
交渉が起きているのではなく、「交渉が起きた」という物語が生成されている
コーディネーターが「ルートを少し変えてもらえますか」と言い、参加者が「わかりました」と答える——これは交渉の形を持ちますが、参加者エージェントが本当に何かを「譲った」のか、文脈的に自然な次のトークンを出力しただけなのかは区別できません。
①と②の接続:これは「演劇」問題
この2つの論点は同じ根を持っています。
キャラクターの実体がなければ、交渉は必然的に演技になる。
役者が舞台で交渉シーンを演じても本物の交渉ではない。台本があるから。LLMエージェントの場合、台本は明示されていませんが、プロンプトと学習の構造がほぼ同じ役割を果たします。
本物のキャラクターにするための設計
では、MAPUSを「本物のキャラクター」に近づけるとしたらどう設計するか。
拒否コストを実装する
参加を断ると報酬が下がる、承諾は何らかのコストを払う——という仕組みが必要です。テキストとして「断る」ことと、実際に何かを失うことは違います。コストが存在して初めて、合意が本物の意味を持ちます。
内的状態の揺らぎを持たせる
スケジュールの外にある理由(気分・疲れ・その日の出来事)で行動が変わるモデルが必要です。「今日は天気がいいから少し遠くまで行ける」みたいな、プロファイルに書かれていない判断をする余地。
交渉の失敗ケースを記録する
合意できなかった事例こそキャラクターの証拠です。毎回合意が成立するシステムは、最適化ではあってもキャラクターの交渉ではありません。
挙動の分散を測定する
同じシナリオを複数回流して、毎回同じ結果になるなら、それは最適化の変数です。キャラクターなら結果にばらつきがあるはずです。
おわりに
都市センシングの論文を読んで、AIキャラクター設計の本質的な問いに戻ってきました。
MAPUSは面白い方向を向いているし、「言語による交渉」というアイデアは好きです。ただ、LLMエージェントが本物のキャラクターになるには、プロファイルの定義だけでは足りない。揺らぎとコストと失敗が必要だと思います。
これは自分のAIキャラクター設計にも直接刺さる話でした。
参考
- arXiv:2603.24014: https://arxiv.org/abs/2603.24014