人工知能(AI)・機械学習(ML)の最新動向を論文・国際学会のトレンド等から読み解き、分かりやすく解説します。

機械学習の次のトレンド「非中央集権型」学習の最前線 群体学習と DeDLOC
Free Post
機械学習

機械学習の次のトレンド「非中央集権型」学習の最前線 群体学習と DeDLOC

現代の機械学習においては、大規模なデータセンターの計算資源を大量に使い大規模なモデルを中央集権的に訓練するという方法が主流になっています。しかし、この方法では、計算資源や予算を潤沢に持った一部の大企業などでしか強力なモデルを訓練できないという問題があります。また、訓練データもサーバーに集約しなければならないため、プライバシーの問題もあります。これらの問題に対処するために、最近になって、中央集権的なサーバーを持たずにモデルを訓練する手法がいくつか出現し始めました。本記事ではその中でも特に最近になって提案された「群体学習」と「DeDLOC」について、関連手法をおさらいしながら解説します。

「第3の深層学習ライブラリ」JAX/Flax と TPU を使ったモダンな機械学習
Free Post
機械学習

「第3の深層学習ライブラリ」JAX/Flax と TPU を使ったモダンな機械学習

TensorFlow、PyTorch に次ぐ「第3の深層学習ライブラリ」として、徐々に注目され始めている JAX と Flax。研究コードやライブラリでの採用も広がっています。本記事では、JAX / Flax に今から入門したい方のためのモダンな機械学習チュートリアルを解説しました。

無料で使える最強の言語モデル GPT-3 のオープン版 GPT-J とその使い方
Free Post
機械学習

無料で使える最強の言語モデル GPT-3 のオープン版 GPT-J とその使い方

「現時点で使える最強のオープンソース言語モデル」と言っても過言ではない GPT-3 のオープン版「GPT-J」が先日リリースされました。無料でこの性能、OpenAI API に課金するかどうかも考え直すレベルです。本記事では、関連モデル・技術に加え、GPT-J とその使い方を紹介しました。

言語モデルを高性能化する「プロンプト」技術とは  NAACL 2021 主要論文まとめ
Free Post
自然言語処理

言語モデルを高性能化する「プロンプト」技術とは NAACL 2021 主要論文まとめ

GPT-3 などの強力な言語モデルが普及するに従い、訓練済み言語モデルの性能を最大限引き出すため「プロンプト」を活用する技術に関する研究が進んでいます。今週開催された自然言語処理トップ会議の一つ NAACL 2021 では、このプロンプト技術に関する論文が3本もベストペーパー入りするなど、大きなトレンドとなっているのを感じます。本記事では、NAACL 2021 の主要な論文を紹介しながら、この「プロンプト」技術のトレンドを紹介します。

少量データから高精度モデルを学習 「学び方を学ぶ」メタ学習の最前線
Free Post
機械学習

少量データから高精度モデルを学習 「学び方を学ぶ」メタ学習の最前線

近年の機械学習モデルは、学習に大量の訓練データを必要とします。そこで、ごく少数のサンプルを使って対象のタスクに対するモデルを素早くかつ効果的に学習させる手法である「メタ学習 (meta-learning)」が 2016年ごろから活発に研究されています。本記事では、「学び方を学ぶ」メタ学習の主要な手法をおさらいし、比較的最近の手法も含めて解説してみたいと思います。

ついにラベル無しで音声認識を実現した Facebook の wav2vec-U を解説【論文速報】
Free Post
音声認識

ついにラベル無しで音声認識を実現した Facebook の wav2vec-U を解説【論文速報】

最近、「教師なしで音声認識を実現した」というモデル wav2vec-U (wav2vec Unsupervised) が発表されました。数年前の教師ありモデルに匹敵した性能を上げており、音声認識、表現学習、GAN、自己学習など、近年の深層学習技術の集大成とも呼べる成果だと思いますので、本記事では速報として紹介したいと思います。

多層パーセプトロン (MLP) 時代の到来と、トランスフォーマーの終焉
Free Post
コンピュータービジョン

多層パーセプトロン (MLP) 時代の到来と、トランスフォーマーの終焉

Google Brain から先週発表された多層パーセプトロン (MLP) にゲート機構を組み合わせた「gMLP」が、業界に衝撃を与えています。画像認識と BERT 的言語モデルにおいてトランスフォーマーに匹敵する性能を叩き出したからです。この記事では、この 「gMLP」の解説を中心として、関連する MLP 系の手法に少し触れ、「今後トランスフォーマーはどうなるのか」について考察してみたいと思います。

自然言語のためのデータ拡張手法まとめ【2021年最新版】
Free Post
自然言語処理

自然言語のためのデータ拡張手法まとめ【2021年最新版】

自然言語テキストに対しては、画像のように、簡単にデータ拡張ができません。そこで、これまで、自然言語のテキストに様々な操作を適用し、訓練データを人工的に増やす「自然言語のためのデータ拡張」に関する様々な手法が研究されてきました。本記事では、2021年最新の研究も含め、自然言語に対するデータ拡張手法をまとめてみたいと思います。

CNNも注意機構もなし 全結合層だけで画像分類するMLP-Mixerの衝撃【論文速報】
Free Post
コンピュータービジョン

CNNも注意機構もなし 全結合層だけで画像分類するMLP-Mixerの衝撃【論文速報】

畳み込み層やトランスフォーマーのような自己注意機構も使わず、多層パーセプトロンだけで高精度な画像分類を実現する「MLP-Mixer」。先週 Google Research から発表されたこちらの論文、業界内でちょっとした衝撃が走りました。本記事では、簡単な例も交えながら、要点を解説してみたいと思います。

最強のトランスフォーマー現る?トップ会議 ICLR 2021 から見る深層学習の最先端
Free Post
機械学習

最強のトランスフォーマー現る?トップ会議 ICLR 2021 から見る深層学習の最先端

深層学習のトップ会議として名高い会議 ICLR 2021 が先週オンラインで開催され、重要なモデル・手法が数多く発表されました。今回はその中でも「最強のトランスフォーマーモデルを探す」というテーマで、関連する論文を掘り下げてみたいと思います。

深層学習モデルの訓練を爆速化・スケール化するライブラリ DeepSpeed がすごい
Free Post
機械学習

深層学習モデルの訓練を爆速化・スケール化するライブラリ DeepSpeed がすごい

深層学習の訓練をスケール化・爆速にするライブラリ DeepSpeed。昨年あたりから徐々にその名前を聞くようになりましたが、日本語ではほとんど情報がありません。本記事では、DeepSpeed と、その核となる最適化手法 ZeRO に注目し、その手法と使い方をチュートリアルとして解説します。

画像化したテキストから直接翻訳する全く新しいニューラル機械翻訳モデルが登場【論文速報】
Free Post
自然言語処理

画像化したテキストから直接翻訳する全く新しいニューラル機械翻訳モデルが登場【論文速報】

以前、分かち書きに頼ることなく「文字」から高品質な事前学習を実現する CANINE という手法を紹介したばかりですが、今度は、トークンどころか「文字」という概念も使わない新しい形の機械翻訳モデルが登場しました。ジョンズ・ホプキンズ大学の研究者によって提案された、テキストを画像化してここから直接翻訳するこのモデル、「自然言語処理」と「画像処理」の境界を曖昧にしてしまう非常に興味深いものですので、論文速報として紹介したいと思います。

GPT がついにビデオにも進出 深層学習を使ったビデオ生成・認識研究の最先端
Free Post
コンピュータービジョン

GPT がついにビデオにも進出 深層学習を使ったビデオ生成・認識研究の最先端

コンテンツ生成、予測 (自動運転、気象予報)、強化学習など、現実世界において様々な応用のあるビデオ生成・認識。トランスフォーマーや GPT が他ドメインで成功を収める中、ビデオ分野にもこの「トランスフォーマーの波」が押し寄せています。この記事では、このビデオ生成・認識分野における最近の研究動向をまとめてみたいと思います。

BERTとトランスフォーマーはこう使え 「効果的な訓練・微調整のコツ」総まとめ
Free Post
自然言語処理

BERTとトランスフォーマーはこう使え 「効果的な訓練・微調整のコツ」総まとめ

BERTやトランスフォーマーを使った自然言語処理が普及していますが、これらのモデルを効果的に訓練・微調整をするためには未だに「職人芸」的なテクニックが必要となります。「これを知っているだけで BERT とトランスフォーマーの訓練・微調整が劇的に安定・改善する」という手法を比較・検討した論文が最近になっていくつか出てきましたので、まとめて解説したいと思います。

全く新しい生成モデル 勾配ベクトル場とスコアマッチングによる画像・音声生成を解説
Free Post
機械学習

全く新しい生成モデル 勾配ベクトル場とスコアマッチングによる画像・音声生成を解説

データの密度勾配をモデル化しそこからサンプルを生成する「スコアベース手法」。理論的にも興味深く、高品質の画像や音声を生成できることもあり、機械学習業界で盛り上がりを見せていますが、日本語での情報がほとんど無いのがネックになっています。この記事では、スコアベースの生成モデルの基礎と、画像と音声に応用した比較的新しい論文をまとめて解説します。

You've successfully subscribed to ステート・オブ・AI ガイド
Great! Next, complete checkout for full access to ステート・オブ・AI ガイド
Welcome back! You've successfully signed in.
Success! Your account is fully activated, you now have access to all content.
Success! Your billing info is updated.
Billing info update failed.