CCCMKホールディングス TECH LABの Tech Blog

TECH LABのエンジニアが技術情報を発信しています

ブログタイトル

RecSys 2024に現地参加しました

こんにちは。 データサイエンスグループの木下です。

10/14~10/18にイタリアのバーリで開催されたRecSys2024に現参加してきたので、その報告をしようと思います。 このシリーズは4回にわたる予定で、第一回目はカンファレンス自体の内容、 それ以降は論文を一本ずつ紹介していこうと思います。

RecSysとは

ACM(Association for Computing Machinery)が主催する レコメンドシステムに関する主要な国際会議の1つです。 Recommender Systemsの頭文字の略称になります。

今年で18回目の開催になりました。 アカデミアより、企業から参加している人の方が多いという特徴があります。

発表の様子

そもそも、レコメンドシステムとは、「複数の候補から価値のあるものを選び出し、意思決定を支援するシステムのこと」(参考:推薦システム実践入門)です。レコメンドシステムはAmazon,Netflix,Spotify,YouTubeなどに搭載されており、私たちの日常生活には切っても切り離せない技術になります。"あなたへのおすすめ"、は全てレコメンドですね。

RecSys2024の開催日程と開催場所

開催場所はイタリアのバーリという都市でした。 上のマップの赤いピンが立っているところで、イタリアの国の形を足としたら、かかとの位置になります。

日程は下記とおりで、5日間のうち、最初と最後がワークショップとチュートリアル、 中3日がメインカンファレンスでした。

10/14(月) Tutorial&WorkShop Day1​ 10/15(火) Main Conference Day1​ 10/16(水) Main Conference Day2​ 10/17(木) Main Conference Day3 10/18(金) Tutorial&WorkShop Day2

チュートリアルはバーリ工科大学という大学の教室で行われました。

バーリ工科大学の中庭

メインカンファレンスはペトルッツェリ劇場という建物の中で行われました。

petruzzelli theater外観

petruzzelli theater内観

参加人数と参加企業

オフライン参加で919人で、昨年より大幅に人数が増えました。全体としては欧米の方が8割、中国が1割、あとはその他という具合で、日本人は10~20人程度でした。 発表者は圧倒的に中国の方が多く、半数近くを占めていたことが印象的でした。

参加状況

論文の投稿数と採択数

論文の投稿数はアメリカ、中国がダントツで、ついで開催国であるイタリアが3位でした。日本は5位でした。 その内、アクセプトされた論文は4割弱でした。

発表者の所属

スポンサー企業は下記の写真の通りでした。

スポンサー企業一覧

【発表企業】

・Google(Google Research/ Google DeepMind/ YouTube) ・Amazon ・Netflix ・Spotify ・Huawei ・KUAISHOU(快手) ・Alipay ・Yahoo ・サイバーエージェント など

【発表大学】 ・清華大学 ・Columbia University

 キーノート

キーノートはメインカンファレンス3日間で毎日1回行われました。 スピーカーと発表内容を下記にまとめました。

キーノート一覧

キーノート1

マークさんは、人間中心のAIとは何かということを説明していました。 "人間中心のAIとは何かというと、人間を中心におくことである。 第一に人間、人間のニーズ、人間のほしいものを考えよう。 そして、それを解決するようにアルゴリズムを設計しよう”と資料には書いてありました。説明することで、ユーザーが適切な行動をとれるようにすること、また AI設計において、人間の認知や行動特性を考慮し、ユーザー体験を向上させることが重要だといっておりました。

キーノート3

ムニアさんは、Spotifyで実際に実装しているレコメンドアルゴリズムについて解説してくれました。

  1. ユーザーの志向性の獲得方法
  2. ドメイン横断のコールドスタートの解決方法
  3. ユーザーに新たなコンテンツを発見させる方法

ユーザーの志向の獲得方法の一つとして、ユーザーの好みを学習させるために、 長い間聴いている曲と、一時的に聴いている曲を分けて志向性をとらえているそうです。

ドメイン横断のコールドスタートの解決方法に関しては、 AudiobookとPodcastに関しての共通の視聴情報を利用して、Podcastの志向性をAudiobookの履歴から予測する、という方法をとっているそうです。

Sessionの種類に関して

セッションは全部で11種類にわかれており(Woman in RecSysを除く)、各セッションの内容と発表時間についてまとめました。

session内容

見てわかるように、LLMが最も長く、またベストペーパーにも選ばれておりました。 LLMがレコメンドに世界に浸透してきており、まさにパラダイムシフトなのではないでしょうか。 LLMをレコメンドに活用する方法は様々でしたが、例えばテキストの意味情報を抽出する際に使ったり、また対話形式のレコメンドシステム(CRS)に使われていたしました。

総評としては下記のとおりです。

  • LLMは他のSessionの中でも取り上げられるほど、レコメンドシステムに浸透していた。
  • LLMはLoRA/Instruction Tuning/ CRS/ XAI など、多くの文脈で使われていた。
  • Cold StartはCross-domain, Multi-modal文脈で出てくることがあった。
  • Optimization and Evaluationでは因果推論やA/Bテストの話が多かった。
  • Multi-Task Learningなどで、CVR Predictionの話などがでていた。
  • レコメンドは、関わってくる技術がとても多く、総合格闘技感がある(MF / LLM / Multi-Task / Multi-Modal / 因果推論 / 強化学習 …)

 現地参加した感想

  • 最先端の研究のレベルははるかに高い
  • 現地参加するからこそ、国の技術力が分かる(特に中国)
  • 毎年いろんな都市で開催されて、その土地を楽しむのも一興(来年はプラハ)
  • みんな楽しそう
  • 私も質問できるレベルになりたい
  • 私もいつか発表したい

現地参加した経験を活かして、社内のレコメンド技術を引っ張っていきたいと思います。

次回からの3本の記事は、実際に発表された論文紹介になりますので、そちらも楽しみにしていただければと思います。よろしくお願いいたします。