オセロAI大会開催
こんにちは、技術開発ユニットの萩原です。先日研究所でオセロAI大会を開催しましたので、その紹介記事を書きました。
なぜ開催したのか
オセロ大会の目的はメンバーの強化学習・深層学習のスキルを高めるためです。研究所ではMarketing Automationやデバイス制御の自動化などの課題に取り組んでおり、機械学習、特に強化学習の分野の知識や技術の習得のためにオセロAIの作成をしました。
大会の様子
"密"を避けるため、Zoomでオンライン開催しました。
オンラインで対戦するためのステージをBlenderで作成(技術開発ユニット岸部作)、マウスでぐりぐり動かせて面白い・・・。
各々でゲームAIを作ってきたのですが、アルゴリズムは三者三様でした。AlphaZeroの人もいれば、モンテカルロ木探索を実装した人、シンプルな画像分析の技術ベースの評価関数を実装した人とメンバの個性が出ていました。私はAlphaZeroに挑戦しました。
2週間の準備期間の集大成を競うトーナメントがこちらです。
私は一回戦があるので3回勝ったら優勝かーと意気込んだのですが、あっさり初戦で敗退してしまいました。
なぜうちの子は角を譲ってしまうのでしょうか( ^ω^)・・・
優勝は伊藤
優勝は春に新卒入社しました伊藤でした。おめでとうございます!!
伊藤AIはモンテカルロ木探索なのですが、他のAIは自分の番が来たら計算を始めていたのに対して、伊藤AIは相手の番も計算を続けていました。自分の番が来たらその結果を取り出すだけというお話らしいです。発想も技術もすばらしいです。スレッドの管理やデータの整合性など詰まりポイントが多そうですが、しっかり実装をしたみたいですね。
エキシビションマッチ
社長の北村&所長の毛谷村タッグと優勝した伊藤AIとのエキシビションマッチを行いました。
結果は、、、人間タッグの勝利!!
ある程度オセロに慣れた人にはまだ勝てないようでした。
感想
最近はコロナの影響もあり、リモートでの勤務がほとんどになりましたが、みんなでわいわいと交流もできて楽しかったです。個人的にはPyTorchとAlphaZeroの実装に挑戦できたのが良かったです。今回はあっさりと初戦で敗退してしまったので、次回のコンペでは良い結果が出るように頑張りたいです。