今年の8月をもって、本ブログ 「ステート・オブ・AI ガイド」 を始めてちょうど1年となりました。

soaig-graph

人工知能 (AI)・機械学習 (ML) 分野の最新動向や論文を紹介・解説する本ブログ。

1年間、「とにかく良質の記事だけを読者に届ける」ことだけに専念し、毎週、一度も欠かさずに記事を書き続けた結果、上のグラフに示した通り、現在、有料・無料合わせて会員数 1,200 人を超える規模にまで成長しました。東京都立大学 自然言語処理研究室(小町研)をはじめ、某大企業の研究所等でも団体で購読いただいています。

有料会員は月あたり $14 で、収益のトータルなどの具体的な数字は非公開とさせていただきますが、「物価にもよるが、基本的にブログだけでフルタイムで十分に生活できる」だけの収入に達しています。

まず、この場を借りて、本ブログをこれまで支えてくださった会員の皆様に深く感謝したいと思います。特に、まだ記事数の少ない段階から購読してくださった皆様には感謝しかありません。誠にありがとうございます。

また、この記事では、このブログを1年間書き続けてきた振り返りと、僭越ながらここまで成長できた理由について少し書いてみたいと思っています。また、今後さらに良質の記事を会員の皆様に届けていくために、チームの拡大を考えていますので、興味のある方は読み進めていただければと思います。

最も大事なことにフォーカスする

publications

多くの方がご存知の通り、人工知能 (AI)・機械学習 (ML) は非常に進歩が激しい分野です。新しい研究が日進月歩で進み、まさに日単位で新しい論文、モデル、システムなどが発表されます。分野の先端を走る専門家であっても、最新の動向にキャッチアップするのがやっと、という状況です。私も曲がりなりにもその立場に居ますので、この大変さは十分分かっています。

上のグラフは、メジャーな自然言語処理の学会に投稿される論文の数の推移を示したものです (出典: The Geographic Diversity of NLP Conferences)。この傾向は下火になるばかりか、今後数年間は少なくとも加速すると予測しています。

この「AI ブーム」の波に乗って、ネットには多くの「AI メディア」が溢れています。しかし、特に日本語で得られる情報は量も少なく、質も玉石混交で、Facebook や Google 、OpenAI などの企業から発表されるニュースを表層的に翻訳しているだけのものが散見されます。これらの企業が革新的な研究を進めているのは事実なのですが、表層的なニュースを追うだけでは分からない背景や、基礎技術、トレンドなどを広く届けたい、と思ったのが、ブログを始めたきっかけです。

また、日本の AI コミュニティは、現在「二重苦」にさらされています。AI の分野の進歩が速すぎる上に、そのほとんどが英語で発表されるので、英語が得意でない場合大きなハンデを背負うことになります。ブログで良質な記事をタイムリーに発信し、「情報格差」を埋めることによって、日本全体の AI 業界の発展に貢献したい、というのも、自分の大きな夢の一つです。

「ステート・オブ・AI ガイド」では「研究や実務に役立つ、重要な研究について、とにかく良質の記事を書き続ける」ことだけに1年間、ひらたすら専念してきました。毎週、軽いサーベイ論文が書けるくらいの数の論文を読み、1年間で本ブログのためだけに 400本ぐらいは論文を読んだと思います(それとは別に、業務でも必要な論文を数多く読んでいます)。本ブログのための時間はほとんどリサーチや記事のサーベイ、コードの実装などに費やしました。見てのとおり、デザインやマーケティング、SEO などにはほとんど力を入れていません。未だにインターフェースが英語のままの部分があるのはそのせいです。

ブログに限らずどのようなビジネスにも言えるのですが、「最も大事なことにフォーカスする」のが重要だと思います。読者の方が何を読みたいか、最初は少し試行錯誤の部分が多かったのですが、メールでご意見・ご感想をいただいたり、知人・友人から感想を直接もらったりするうちに、少しずつ、「有用な記事とは何か」「皆に興味を持ってもらえる AI 技術は何か」という感覚が研ぎ澄まされてきたように思います。ブログの良いところは、記事を書くたびにそれがアクセス数や会員登録数という形でダイレクトに分かるという点で、この点もブログという直接的な媒体のメリットなのでしょう。

何かを続けたかったら、お金を取る

lilianweng

本ブログは、有料ブログです。「高すぎる」というご意見をいただいたこともありますが、私は有料制にして本当に良かったと思っています。AI分野の論文を紹介するブログや Qiita の記事などはネットにたくさんあるのですが、そのほとんどは続いていません。本ブログも、無料ではこちらのモチベーション的にも、ビジネス的にも続かなかったでしょう。

AI の分野では、英語で高品質な記事を発表している個人の方が多く居ます。ざっと思い出せるだけでも、

の各氏が、高品質なブログ記事や YouTube ビデオを定期的に発表しています。特に、Chris Olah 氏の LSTM の記事や、Jay Almmar 氏の Transformer の記事 には、私を含めお世話になった方も多いのではないでしょうか。

これらの高品質かつ分かりやすい記事が業界に与えるインパクトや「富」というものは、その辺の平凡な論文よりもよっぽど大きいと思っています。これらの各氏が経済的にどの程度リターンを得たかは定かではありませんが、その経済的なインパクトを補足できれば、「AI 出版で食べていく」というのは十分可能なはずです。

また、上記の Lilian Weng 氏 も最近の招待講演の中で述べていましたが、ブログを書くことによって、執筆者自身が分野に詳しくなり、最新動向に詳しくなる、というメリットは計り知れません。私は AI 分野のフリーランスとして働いている のですが、ブログを書き始めてから、クライアントさんに対する仕事の質が明らかに向上しました。もちろん、これは定量化が難しいのですが、例えば何かの問題に当たった時に、「このテクニックを使えば良さそうだ」「あのモデルが使えそうだ」という引き出しの量と質があきらかに増えたと思います。

会員の皆様にとっても、もしあなたが AI の分野に関わっているのであれば、本ブログを読むことによって 5% 程度、生産性が向上するのは想像に難しくないでしょうから、月あたり $14 の出費はかなりお得なように思えます。

自分だけがつかんでいる大切な真実

PayPal の共同創業者で投資家・起業家として有名な Peter Thiel 氏は、「賛成する人がほとんどいないが、自分だけがつかんでいる大切な真実」がビジネスにおける成功には大切だ、という旨のことを書いています。AI 出版の分野でもこの原則が基本的に当てはまる、というのが私の考えです。

AI の分野では、今後、言語・ビジョン・音声などの垣根がどんどん無くなっていきます。私個人としても、ここ1〜2年の間に、ニューヨーク・ベースのスタートアップである RunwayML とビデオ生成に関する研究に取り組んだり、動物の言語を機械翻訳する非営利団体 Earth Species Project と一緒に音声モデルの研究をしたりと、多様な研究プロジェクトに取り組んできました(ちなみに、両団体とも、AI エンジニア・研究者を募集中ですので、興味のある方はご連絡ください)。ニューラルネットワークの普及によって、言語・ビジョン・音声などを統一的に扱うことが非常に簡単になりました。

あと数年のうちに、超巨大な化け物のようなモデルが現れ、人間の知覚に関するほとんどの問題は、この超巨大なモデルを微調整するだけでほとんど解けてしまう、というような時代が来ると思います。既に、GPT-3DALL·E などでこの兆候が現れていますが、今後もこの傾向は加速するでしょう。そのような時代が来たときに、AI に関わるものとしてどう立ち振る舞うか、また、ブログの執筆者として、今後、どのような記事を届けていくか、というのを考え続けることが重要だと思います。

もちろん、ここに書いたことは、「賛成する人がほとんどいない」ほど極端なものではなく、むしろ賛同する方も多く居るとは思いますが、これらの理由もあり、本ブログでは、言語・ビジョン・音声など、特定のドメインに偏らず、今後数年間を見据えた時に、役に立ちそうな記事を書いていくことに常に留意しています。

「未来を予想する最善の方法は、それを発明することである」

これは、発明家 Alan Key 氏の有名な言葉ですが、AI の分野でも当てはまると思います。AI 分野で最新の研究にキャッチアップする一番良い方法は、自分で最新の研究を進めてしまうことです。

本ブログでは、これまで主に私が一人で執筆してきましたが、今後、質と量ともに、さらに良いサービスを会員の方に届けていきたいと考えています。そこで、AI 分野での研究と執筆をお手伝いいただけるリサーチ・サイエンティストの方を募集することにします

主な職務内容は、以下の通りです。

  • AI 分野の研究。研究テーマは自由ですが、教育応用や格差是正など、社会的に意義のある取り組みだとなお良いです。
  • 研究成果の発表。研究成果は、論文やオープンソース等として発表することを推奨します。
  • 本ブログの執筆補助。執筆のために必要なサーベイや、実装、(部分的な)執筆などをお手伝いいただきます。

要件

  • コンピュータービジョンや強化学習、音声処理、自然言語処理などの分野で、最新の論文や研究にキャッチアップできること(私の専門が自然言語処理なので、それ以外に強いのが望ましいです)。
  • Python を使って機械学習モデル・システムの実装ができること。
  • 週あたり数時間〜10時間程度稼働できること(注:フルタイムのポジションではありません)。
  • 給与は要相談ですが、GAFAM のインターン程度の時間給は出します。

ちなみに、勤務地はリモートで、日本から副業・パートタイムとして参加可能です (学生・社会人、共にウェルカムです)。こちらは米国法人として、シアトルにベースがありますので、コロナ禍が落ち着いた暁には、出張なども検討したいと思っています。

興味のある方は、履歴書等を添えて、メールで masato@octanove.com までご連絡ください。

また同時に、マーケティング、プロダクト・マネジメント、SEO 等に詳しいディレクター職についても募集しておりますので、こちらについても興味のある方はメールにてご連絡ください。