CCCMKホールディングス TECH LABの Tech Blog

TECH LABのエンジニアが技術情報を発信しています

ブログタイトル

2024-12-01から1ヶ月間の記事一覧

2024年も終わりなので、来年の目標達成のための計画を作ってくれるMulti-Agentの仕組みを作ってみました。

こんにちは、CCCMKホールディングスTECH LABの三浦です。 今年ももう終わりですね。この時期は「今年こんなことあったなぁ」と振り返りつつ、「来年こんなことが出来るようになりたいなぁ」と考える時期だと思います。今年、AI領域ではLLMの活用として"Agent…

RecSys2024 論文紹介③

こんにちは。データサイエンスグループの木下です。 今回はRecSys2024論文紹介シリーズの最後の記事になります。 最終回にふさわしく、今回紹介する論文はRecSys2024でベストペーパーに選ばれた Towards Empathetic Conversational Recommender Systems とい…

RecSys2024 論文紹介②

こんにちは。データサイエンスグループの木下です。 RecSys2024の論文解説シリーズの続きで、2本目の今回は FLIP: Fine-grained Alignment between ID-based Models and Pretrained Language Models for CTR Predictionという論文を紹介いたします。 概要 C…

LLMの評価の観点について、調べてみました。

こんにちは、CCCMKホールディングスTECH LABの三浦です。 今日はクリスマスイブですね。クリスマスが過ぎるとあっという間にお正月で、毎年この時期には独特な雰囲気があるなぁと感じています。 参考資料 LLMの評価 汎用的言語性能 ドメイン特化性能 安全性…

NeurIPS 2024に参加しました!

こんにちは、CCCMKホールディングスTECH LABの三浦です。今回はカナダのバンクーバーから、機械学習・AIに関する国際カンファレンスである"NeurIPS 2024"に現地参加したレポートをお送りしたいと思います! NeurIPSとは 最初に会場で受け付け カンファレンス…

RecSys2024 論文紹介①

こんにちは。データサイエンスグループの木下です。 前回の記事の続きとして、今回からRecSys2024で発表された論文を紹介していきます。 前回の記事はこちら↓ techblog.cccmkhd.co.jp 今回の記事では学生部門のベストペーパーに選ばれたUnlocking the Hidden…

事前学習におけるトークンの選択の重要性についての論文"RHO-1:Not All Tokens Are What You Need"を読みました。

こんにちは、CCCMKホールディングスTECH LABの三浦です。 今年もあと1か月ですね。振り返ってみると色々とあった1年ですが、個人的には夏の厳しい暑さが印象に残っています。残りわずかですが、2024年の最後まで頑張ろうと思います。 学習中のトークンごとの…

RecSys 2024に現地参加しました

こんにちは。 データサイエンスグループの木下です。 10/14~10/18にイタリアのバーリで開催されたRecSys2024に現参加してきたので、その報告をしようと思います。 このシリーズは4回にわたる予定で、第一回目はカンファレンス自体の内容、 それ以降は論文…

Azure AI Searchでベクトル検索と日本語キーワードのフィルターを組み合わせる

こんにちは。テックラボの高橋です。 今回はAzure AI Searchでベクトル検索とキーワードのフィルターの組み合わせを、日本語データに対して適用する方法を検証します。 テキスト クエリのフィルター - Azure AI Search | Microsoft Learn ドキュメントによる…

様々な形式のドキュメントからテキスト情報を取得する"Docling"を使ってみる。

こんにちは、CCCMKホールディングス TECH LABの三浦です。 先日チームのメンバーに教えてもらい、試してみたいな・・・と思っていたライブラリを今回試すことが出来ました。"Docling"というライブラリで、PDFなどのファイルから、内容をマークダウンかjsonの…