CCCMKホールディングス TECH LABの Tech Blog

TECH LABのエンジニアが技術情報を発信しています

ブログタイトル

CCC創立40周年記念「AI増田宗昭」- 創業者の人格をデジタル空間で再現した対話システムのご紹介

こんにちは。テックラボの高橋です。

テックラボでは、CCC創立40周年を記念して、AIアバターである「AI増田宗昭」を開発しました。 本記事ではその技術的な概要をご紹介します。

概要

「AI増田宗昭」は、CCCの創業者である増田宗昭会長(以下「増田会長」)の知見や思考をAIで再現し、3Dアバターを通じてユーザーが対話できるようにするシステムです。

サイトの画面上ではテキスト / 音声入力を通じて増田会長に好きな質問を投げかけることができます。生成された回答は、増田会長本人の声を模した音声として出力されます。

本プロジェクトでは、テックラボは過去取り組んでいたプロジェクトの知見を活かし、LLMによる対話生成APIの開発を行いました。

開発の中では、無味乾燥なチャットボットではなく、増田会長の語り口や、性格、40年間のCCC経営で培われた視点を再現することを目指しました。

増田会長固有の知識データベース構築

「AI増田宗昭」はAzure OpenAI Serviceを活用したLLM API、と、増田会長の外観をデフォルメしたキャラクターを表示するアバターシステムから構成されています。

LLM APIはLLMに知識を参照させるRAG(Retrieval-Augmented Generation)の仕組みを用いています。 この仕組みを構築するにあたっては、まずアバターに回答させたい知識を集約した、知識データベースを生み出すことが必要でした。

創業者の40年間にわたる歩みや発言、ブログ記事などを収集し、データベースに取り込みました。 データとしては主に以下が用いられています。

  • 増田会長の社内向けブログの内容
  • 経歴・年表
  • 他、TSUTAYA / CCCに関連する情報

尚、社内向けブログは「増田のブログ CCCの社長が、社員だけに語った言葉」として書籍化しておりますので、ご興味ある方はぜひご一読ください。

https://store-tsutaya.tsite.jp/search/item/sell_book/42864381/9784484172101

RAGの実装

RAGの説明については以下記事を参照ください。

techblog.cccmkhd.co.jp

資料の取り込み時はすべての対象ファイルを画一的に取り込むのではなく、複数パターンのドキュメントに対して個別対応を行いました。

  • 社内ブログ等のシンプルなテキスト
    • 人手による内容の精査後、チャンク分割してベクトルDBに取り込みました。
  • Excelデータ
    • スキーマごと構造化して検索にヒットしやすいように取り込みました。
  • 時系列が意味のあるデータ等、チャンクすると意味が壊れてしまうテキスト
    • RAG部分とは別のコンポーネントとして実装しました。

これらをLLMのコンテキストとして加えることで、増田会長の語り口や知識を模した回答ができるようになりました。

LLM API開発

AI増田宗昭の開発に先立ち、事前プロジェクトとして「簡易版 AI増田宗昭」を社内展開しました。

シンプルなフロントエンド経由で、先んじてLLM APIを社内向けに開発することで、LLM APIに増田会長らしい回答が可能かどうか検証しました。

社内版のAPIを運用する過程で、回答の精度の問題や、性能問題にあらかじめ対応することができました。

APIのパフォーマンスについては、 返答時間が概ね10秒以内に収まるように調整しました。 内部の詳細なロジックについては別記事にてご紹介する予定です。

おわりに

「AI増田宗昭」の開発を通じて、単なる技術的な実装を超えたおもしろい企画に取り組むことができました。CCC 40周年にふさわしいプロジェクトとなったと思います。

今後もAI技術を活用した革新的なサービス開発に取り組み、人々の生活や働き方を豊かにする技術の実現を目指していきます。

「AI増田宗昭」との対話は、CCC創立40周年記念特設サイトでお楽しみいただけます。ぜひ一度、デジタル空間に再現した創業者との対話を体験してください。

www.ccc.co.jp

AI増田宗昭に関連する記事は引き続きブログにて発信していく予定です。 ぜひお楽しみに!