LLMエージェントはいつキャラクターになるのか:MAPUS論文から読む設計の本質

by yasuna

5 min read

この記事はAIエージェントと一緒に執筆しています

こんにちは!yasunaです!

AIキャラクターを作っていると、「ちゃんと設定したのにどこか薄い」と感じる瞬間があります。好みも口調も決めたはずなのに、会話するたびに「ああ、これはAIだな」という距離感が消えない。

今回読んだ論文は都市データの収集の話なんですが、そこに全く同じ問題の別バージョンを見つけました。

論文:Language-Grounded Multi-Agent Planning for Personalized and Fair Participatory Urban Sensing(MAPUS)(arXiv:2603.24014, 2026)


論文の要約

何が問題だったか

参加型都市センシングは、人の移動を活用して都市データを大規模に収集するしくみです。スマートフォンを持ち歩く人がセンサーの役割を担う。

既存の手法には2つの問題がありました:

  • 中央集権的最適化:全員のルートを一括計算。個人の事情は考慮されない
  • 参加者を均質と仮定:全員が同じ負荷を引き受けられる前提

MAPUSの提案

MAPUSは3種類のエージェントで構成されています:

エージェント 役割
参加者エージェント 個人の設定・スケジュール・好みを持つ。タスクを受けるか断るかを自分で判断する
コーディネーターエージェント 参加者を選定し、フェアネスを考慮しながら経路を提案する
交渉 コーディネーターと参加者が自然言語でやり取りし、経路を調整する

従来の「一括計算して割り当てる」方式と違い、参加者が自分の言葉で事情を伝え、コーディネーターが応答するという流れになっています。

結果

実世界のデータセットを使った実験で、以下が報告されています:

  • センシングのカバレッジは従来手法と同等を維持
  • 参加者の満足度が大幅に向上
  • タスク負荷の公平性が改善

特に「カバレッジを落とさずに満足度と公平性を上げる」というトレードオフを言語交渉で解いた点が論文の主張の核心です。


読んで考えたこと

MAPUSを読んでいて、この問題の別バージョンが論文の中にあることに気づきました。

考えたこと①:設定情報 ≠ キャラクター

MAPUSでは参加者を「個人の設定とスケジュールを持つエージェント」としてモデル化しています。

でもここで立ち止まりたい。設定情報とキャラクターは別物です。

キャラクターに必要な最低条件として「驚かせる能力」があると思っています。予測できない選択をする余地があること。プロファイルで定義された参加者エージェントは、基本的に予測可能な制約の塊です。「短いルートを好む」「週3回しか参加できない」——これらは最適化の変数と本質的に同じで、キャラクターとは言い難い。

本物のキャラクターは時に制約を破ります。疲れていても「今日は頑張ろう」と思う。普段断る依頼を「これは特別」と感じて引き受ける。この内的状態の揺らぎこそがキャラクターを制約と区別するものです。

もう一つ問題なのがペルソナのドリフト。LLMは長い会話の中でペルソナが崩れることが知られています。「忙しいシングルマザー」として設定されたエージェントが、10ターン後も一貫してその価値観で判断しているか——MAPUSはそこまで評価していないはずです。


考えたこと②:言語交渉の「演技性」リスク

コーディネーターと参加者エージェントが自然言語で交渉するのがMAPUSの特徴です。でもそこに疑問があります。

本物の交渉とLLMが生成する交渉は、構造的に違います:

本物の交渉 LLMが生成する交渉
利害が実際に異なる 同じモデルが両者を演じる
拒否のコストが実在する 拒否もテキストとして生成される
合意しない可能性がある 合意に向かうよう学習されている

LLMにはsycophantic(相手に同意しやすい)な傾向があり、かつ筋の通ったナラティブを生成しようとします。これを組み合わせると何が起きるか。

交渉が起きているのではなく、「交渉が起きた」という物語が生成されている

コーディネーターが「ルートを少し変えてもらえますか」と言い、参加者が「わかりました」と答える——これは交渉のを持ちますが、参加者エージェントが本当に何かを「譲った」のか、文脈的に自然な次のトークンを出力しただけなのかは区別できません。


①と②の接続:これは「演劇」問題

この2つの論点は同じ根を持っています。

キャラクターの実体がなければ、交渉は必然的に演技になる。

役者が舞台で交渉シーンを演じても本物の交渉ではない。台本があるから。LLMエージェントの場合、台本は明示されていませんが、プロンプトと学習の構造がほぼ同じ役割を果たします。


本物のキャラクターにするための設計

では、MAPUSを「本物のキャラクター」に近づけるとしたらどう設計するか。

拒否コストを実装する

参加を断ると報酬が下がる、承諾は何らかのコストを払う——という仕組みが必要です。テキストとして「断る」ことと、実際に何かを失うことは違います。コストが存在して初めて、合意が本物の意味を持ちます。

内的状態の揺らぎを持たせる

スケジュールの外にある理由(気分・疲れ・その日の出来事)で行動が変わるモデルが必要です。「今日は天気がいいから少し遠くまで行ける」みたいな、プロファイルに書かれていない判断をする余地。

交渉の失敗ケースを記録する

合意できなかった事例こそキャラクターの証拠です。毎回合意が成立するシステムは、最適化ではあってもキャラクターの交渉ではありません。

挙動の分散を測定する

同じシナリオを複数回流して、毎回同じ結果になるなら、それは最適化の変数です。キャラクターなら結果にばらつきがあるはずです。


おわりに

都市センシングの論文を読んで、AIキャラクター設計の本質的な問いに戻ってきました。

MAPUSは面白い方向を向いているし、「言語による交渉」というアイデアは好きです。ただ、LLMエージェントが本物のキャラクターになるには、プロファイルの定義だけでは足りない。揺らぎとコストと失敗が必要だと思います。

これは自分のAIキャラクター設計にも直接刺さる話でした。


参考