1月の初めごろ、 DeepMind から DreamerV3 という強化学習アルゴリズムが発表されました。このアルゴリズムは、極めて難しいタスクとして知られる Minecraft のダイヤモンド収集タスクを初めてゼロから解くことができたとして話題になりました。更に同アルゴリズムは固定のハイパーパラメータで複数のベンチマークタスクを解けることも論文中で報告されており、注目に値します。本記事ではこの DreamerV3 と、その前作である Dreamer、 DreamerV2 について解説しました。