
こんにちは。データサイエンスグループの木下です。
今回は、レコメンド×AIエージェントに関する論文である、 iAgent: LLM Agent as a Shield between User and Recommender Systemsという論文を紹介したいと思います。
1.Instruction
背景と課題
現在の推薦システムは「ユーザー-プラットフォーム」型であり、以下の問題が存在している
- プラットフォームが商業的目的を過度に追求した結果、ユーザーの真の関心から逸脱してしまう可能性がある
- マタイ効果(強者がより強くなる現象)により、発言力の弱いユーザーが無視されがちである
- エコーチェンバー効果が強化されやすい
マタイ効果(Matthew Effect)
社会学や経済学でよく使われる概念で、すでに持っている人がより多くを得る一方、持たない人はますます不利になる現象。 従来の推薦システムでは「クリック数や人気度」が強く影響するため、活発に行動するユーザーや人気アイテムはますます目立ち、発言力の弱いユーザーや新規アイテムは無視されがちである。
エコーチェンバー効果(Echo Chamber Effect)
同じような意見や情報ばかりが繰り返し提示されることで、利用者の視野が狭まり、偏りが強化される現象。 従来の推薦システムは、ユーザーの過去行動に基づいて「似たようなアイテム」ばかり提示しがちで、興味がどんどん狭まり、新しいジャンルや多様な選択肢に出会いにくい。
本研究のアプローチ
ユーザーとプラットフォームの間にiAgent/i²Agentを配置した「ユーザー-エージェント-プラットフォーム」を提案
→エージェントがユーザーと推薦システムの間に入り、保護的な盾の役割を果たすことで、ユーザーを間接的にシステムに接続するという仕組み


新提案のユーザー-エージェント-プラットフォーム(右)
本研究の成果
新しいデータセットと問題設定
- ユーザー主導の指示を含む4つの推薦データセット(INSTRUCTREC)を構築
- これを用いて自由形式の指示を理解できる Instruction-aware Agent(iAgent)を設計
- 外部知識を活用し、ドメイン特化の専門家として振る舞えるようにした
個人ごとのフィードバック学習
- 動的メモリ機構を備え、プロフィール生成器と動的抽出器を組み合わせて
- 個人の嗜好を継続的に学習するIndividual Instruction-aware Agent(i²Agent)を設計
実証的成果
- 4つのデータセットで大規模な実験を行い、i²Agentが従来手法より平均16.6%優れていることを確認
- エコーチェンバー効果を軽減し、活動の少ないユーザーの利益も守れることを実証
2.Methodology


水色の箇所がモジュールであり、LLMで情報を抽出する箇所になります。 また黄色の箇所が、各モジュールから抽出された情報になります。 i²AgentはiAgentの拡張版であり、こちらの方がより詳細に個人の嗜好をとらえることができるので、 ここからはi²Agentの各種モジュールをまとめることにします。 また実際のプロンプトと入出力例を、論文に記載されていたものを和訳して添付いたします。
Parser
- ユーザー指示を解析
- 内部知識生成
- 外部ツール使用判断(ex.検索API)
- 指示文からキーワード抽出

Extractor
- 指示+知識+履歴から動的関心を抽出
- 静的プロファイルと統合 → 動的メモリ形成

Generator
- ユーザーフィードバックを利用して静的プロファイルを更新
- 正例アイテムと負例アイテムの差異を学習
- 長期的な嗜好を保持する「静的メモリ」を形成

Reranker
- プラットフォームから渡される候補リストを再ランキング
- 入力:
ユーザー指示/ 知識(内部知識 +外部知識)/ユーザー履歴(静的メモリ)/ アイテム情報 - LLM によるプロンプトで再ランキングを生成

Self-reflection
- 出力リストを検証
- 不整合あれば再生成 → ハルシネーション対策
3. Empirical Evaluation
データセット
ユーザー-エージェント-プラットフォームの枠組みにおいて、 ユーザー指示を含む推薦データセットは存在しないため、 既存の Amazon・Yelp・Goodreads のデータをもとに INSTRUCTRECを構築
- 各データはタイトル・説明・レビューなどのテキストを含む
- ユーザーやアイテムのインタラクションが5未満のものは削除
- 各インタラクションに対して、レビューとペルソナをもとにLLMで指示文を生成し、検証を通過したものを採用

Instruction Generator
- 少数のレビューと指示文を 手動でペア付けして学習させる
- レビューに ペルソナを加え、多様な表現の指示を生成

Instruction Cleaner
与えられた指示に対して、LLM に 正解アイテム と ランダムに選んだ負例アイテム のどちらかを選ばせて、正解を選べなかった指示文を採用
結果
RQ1: 性能比較
- iAgent / i²Agent はすべてのデータセット、すべての評価指標(HR@1、HR@3、NDCG@3、MRR)でベースラインを上回った
- 特に i²Agent は EasyRec より平均16.6%改善


RQ2: エコーチェンバー効果
- 他ドメインの広告アイテムを挿入し検証
- i²Agentは広告を正しく除去 & 多様性の高い推薦
- 人気アイテム依存を回避し、全体精度も向上
→エコーチェンバー効果を緩和する「盾」として機能
RQ3: アクティブ / 非アクティブユーザー
- アクティブ(上位20%)・非アクティブ(80%)に分けて検証
- i²Agent は両方で性能向上
- 特に非アクティブユーザーでも 他人の行動に依存せず個別プロファイルを維持
RQ4: リランカー & 自己検証メカニズム
- 自己検証を導入 により、ハルシネーションを 20倍以上削減
- ToolRec / AgentCF / iAgent すべてで有効
- i²Agent も安定性が大幅向上(ただし長文処理は若干誤り増)
感想
この論文では、従来のレコメンドのプラットフォームの仕組みに新しいエージェントを組み込むという、 新しい発想の論文でとても興味深かったです。 精度が高いレコメンドアルゴリズムでも、現段階ではマタイ効果やエコーチェンバーは解消されておらず、 それを解決するためにLLM(エージェント)を用いるのは、 不確定要素を含んだ生成AIだからこそ成しえるのではないでしょうか。 また、Generatorモジュールにおいて、従来の機械学習的アプローチであるネガティブサンプリングを 生成AIにも行わせるというのは、非常にユニークなアプローチであると思いました。 今後も、生成AI×レコメンドの分野の論文を探して、自社のサービスに適用できないか模索していきたいと思います。