CCCMKホールディングス TECH LABの Tech Blog

TECH LABのエンジニアが技術情報を発信しています

ブログタイトル

論文紹介 "iAgent: LLM Agent as a Shield between User and Recommender Systems"

こんにちは。データサイエンスグループの木下です。

今回は、レコメンド×AIエージェントに関する論文である、 iAgent: LLM Agent as a Shield between User and Recommender Systemsという論文を紹介したいと思います。

1.Instruction

背景と課題

現在の推薦システムは「ユーザー-プラットフォーム」型であり、以下の問題が存在している

  • プラットフォームが商業的目的を過度に追求した結果、ユーザーの真の関心から逸脱してしまう可能性がある
  • マタイ効果(強者がより強くなる現象)により、発言力の弱いユーザーが無視されがちである
  • エコーチェンバー効果が強化されやすい
マタイ効果(Matthew Effect)

社会学や経済学でよく使われる概念で、すでに持っている人がより多くを得る一方、持たない人はますます不利になる現象。 従来の推薦システムでは「クリック数や人気度」が強く影響するため、活発に行動するユーザーや人気アイテムはますます目立ち、発言力の弱いユーザーや新規アイテムは無視されがちである。

エコーチェンバー効果(Echo Chamber Effect)

同じような意見や情報ばかりが繰り返し提示されることで、利用者の視野が狭まり、偏りが強化される現象。 従来の推薦システムは、ユーザーの過去行動に基づいて「似たようなアイテム」ばかり提示しがちで、興味がどんどん狭まり、新しいジャンルや多様な選択肢に出会いにくい。

本研究のアプローチ

ユーザーとプラットフォームの間にiAgent/i²Agentを配置した「ユーザー-エージェント-プラットフォーム」を提案
→エージェントがユーザーと推薦システムの間に入り、保護的な盾の役割を果たすことで、ユーザーを間接的にシステムに接続するという仕組み

従来のユーザー-プラットフォーム(左)と
新提案のユーザー-エージェント-プラットフォーム(右)

本研究の成果

新しいデータセットと問題設定
  • ユーザー主導の指示を含む4つの推薦データセット(INSTRUCTREC)を構築
  • これを用いて自由形式の指示を理解できる Instruction-aware Agent(iAgent)を設計
  • 外部知識を活用し、ドメイン特化の専門家として振る舞えるようにした
個人ごとのフィードバック学習
  • 動的メモリ機構を備え、プロフィール生成器と動的抽出器を組み合わせて
  • 個人の嗜好を継続的に学習するIndividual Instruction-aware Agent(i²Agent)を設計
実証的成果
  • 4つのデータセットで大規模な実験を行い、i²Agentが従来手法より平均16.6%優れていることを確認
  • エコーチェンバー効果を軽減し、活動の少ないユーザーの利益も守れることを実証

2.Methodology

iAgentのフロー
i²Agentのフロー

水色の箇所がモジュールであり、LLMで情報を抽出する箇所になります。 また黄色の箇所が、各モジュールから抽出された情報になります。 i²AgentはiAgentの拡張版であり、こちらの方がより詳細に個人の嗜好をとらえることができるので、 ここからはi²Agentの各種モジュールをまとめることにします。 また実際のプロンプトと入出力例を、論文に記載されていたものを和訳して添付いたします。

Parser
  • ユーザー指示を解析
  • 内部知識生成
  • 外部ツール使用判断(ex.検索API)
  • 指示文からキーワード抽出
Extractor
  • 指示+知識+履歴から動的関心を抽出
  • 静的プロファイルと統合 → 動的メモリ形成
Generator​
  • ユーザーフィードバックを利用して静的プロファイルを更新​
  • 正例アイテムと負例アイテムの差異を学習​
  • 長期的な嗜好を保持する「静的メモリ」を形成​
Reranker
  • プラットフォームから渡される候補リストを再ランキング
  • 入力:
    ユーザー指示/ 知識(内部知識 +外部知識)/ユーザー履歴(静的メモリ)/ アイテム情報
  • LLM によるプロンプトで再ランキングを生成
Self-reflection
  • 出力リストを検証
  • 不整合あれば再生成 → ハルシネーション対策

3. Empirical Evaluation

データセット

ユーザー-エージェント-プラットフォームの枠組みにおいて、 ユーザー指示を含む推薦データセットは存在しないため、 既存の Amazon・Yelp・Goodreads のデータをもとに INSTRUCTRECを構築

  • 各データはタイトル・説明・レビューなどのテキストを含む
  • ユーザーやアイテムのインタラクションが5未満のものは削除
  • 各インタラクションに対して、レビューとペルソナをもとにLLMで指示文を生成し、検証を通過したものを採用

データセット構築フロー
こちらも2つモジュールがあるので、詳細を記します。

Instruction Generator
  • 少数のレビューと指示文を 手動でペア付けして学習させる
  • レビューに ペルソナを加え、多様な表現の指示を生成
Instruction Cleaner

与えられた指示に対して、LLM に 正解アイテム と ランダムに選んだ負例アイテム のどちらかを選ばせて、正解を選べなかった指示文を採用

結果

RQ1: 性能比較
  • iAgent / i²Agent はすべてのデータセット、すべての評価指標(HR@1、HR@3、NDCG@3、MRR)でベースラインを上回った
  • 特に i²Agent は EasyRec より平均16.6%改善

4種のデータセットにおける性能評価

RQ2: エコーチェンバー効果
  • 他ドメインの広告アイテムを挿入し検証
  • i²Agentは広告を正しく除去 & 多様性の高い推薦
  • 人気アイテム依存を回避し、全体精度も向上
    →エコーチェンバー効果を緩和する「盾」として機能
RQ3: アクティブ / 非アクティブユーザー
  • アクティブ(上位20%)・非アクティブ(80%)に分けて検証
  • i²Agent は両方で性能向上
  • 特に非アクティブユーザーでも 他人の行動に依存せず個別プロファイルを維持
RQ4: リランカー & 自己検証メカニズム
  • 自己検証を導入 により、ハルシネーションを 20倍以上削減
  • ToolRec / AgentCF / iAgent すべてで有効
  • i²Agent も安定性が大幅向上(ただし長文処理は若干誤り増)

感想

この論文では、従来のレコメンドのプラットフォームの仕組みに新しいエージェントを組み込むという、 新しい発想の論文でとても興味深かったです。 精度が高いレコメンドアルゴリズムでも、現段階ではマタイ効果やエコーチェンバーは解消されておらず、 それを解決するためにLLM(エージェント)を用いるのは、 不確定要素を含んだ生成AIだからこそ成しえるのではないでしょうか。 また、Generatorモジュールにおいて、従来の機械学習的アプローチであるネガティブサンプリングを 生成AIにも行わせるというのは、非常にユニークなアプローチであると思いました。 今後も、生成AI×レコメンドの分野の論文を探して、自社のサービスに適用できないか模索していきたいと思います。