萩原 正人

萩原 正人

Google、MSR、バイドゥ、楽天技術研究所NY、Duolingo など、日中米の多くのテック大手等において、研究者・エンジニアとして自然言語処理・機械学習の研究開発に携わる。2019年にフリーランスとして独立し、教育応用・アジア言語処理を専門とする AI 研究所 Octanove Labs を設立。機械翻訳や教育応用の分野にて、世界トップレベルの研究機関等と共に数多くのプロジェクトに携わる

Seattle, WA, USA
77 posts
Website Twitter
これだけ人間に近づいた チャットボット・対話 AI 研究の最前線
Free Post
自然言語処理

これだけ人間に近づいた チャットボット・対話 AI 研究の最前線

最近も「エアフレンド」がネット上で話題になるなど、話題に事欠かないチャットボットや対話 AI。深層学習のモデルの発展に伴い、人間に近い自然な対話ができるモデルが次々に開発され、最近では、「共感」や「記憶」など、より人間らしい要素にフォーカスしたシステムも出現しています。本記事では、自由会話型のチャットボット・対話 AI について、主要な研究をたどりながら最新の動向まで解説します。

AI開発の常識を覆す 新トレンド「データ・セントリックな AI」とは
Free Post
機械学習

AI開発の常識を覆す 新トレンド「データ・セントリックな AI」とは

モデル中心だったこれまでのAI開発の考えに疑問を呈し、データを中心に据える「データ・セントリックな AI」が新たにトレンドとなっています。少ない開発コストで高精度なシステムを訓練できたりと、現実世界にAIを活用する際に重要になるヒントも多く、要チェックです。本記事では、このデータ・セントリック AI の基本的な考えや、関連するシステム・論文などを紹介します。

ビジョン・トランスフォーマーはなぜCNNより強い?その仕組みを解明【論文速報】
Free Post
コンピュータービジョン

ビジョン・トランスフォーマーはなぜCNNより強い?その仕組みを解明【論文速報】

昨年10月にビジョン・トランスフォーマー (ViT) が画像認識にて最高精度を達成して以来、コンピューター・ビジョンの分野を席巻しています。そもそも、ViT の強さはどこにあるのでしょうか?本記事では、Google Research から発表された最近の論文を論文速報として紹介しながら、CNN (ResNet) とビジョン・トランスフォーマーとの違いを探っていきます。

コードを数行変更するだけ PyTorch を高速化する16個の簡単テクニック
Free Post
機械学習

コードを数行変更するだけ PyTorch を高速化する16個の簡単テクニック

機械学習モデルの訓練には長い時間がかかるのが常ですが、PyTorch には、非常に簡単な変更によって学習や推論を高速化できるテクニックがいくつか知られています。本記事では、PyTorch の最新の機能も含め、コードを数行変更するだけで学習・推論のパフォーマンスを大きく改善できる簡単なテクニックを合計16個紹介します。

最新研究から学ぶ 言語モデルの性能を向上させる5つの簡単なトリック
Free Post
自然言語処理

最新研究から学ぶ 言語モデルの性能を向上させる5つの簡単なトリック

最近になって、言語モデルの性能を向上させる最新の研究が立て続けに発表されています。いずれも、比較的簡単な工夫で、トランスフォーマー・ベースの言語モデルの性能を改善したり、訓練を効率化したりといったことを可能にするものが多く、「GPT-3 超え」を達成したものもあれば、我々の日々の業務にも応用できそうなアイデアも多くあります。本記事では、最近の「言語モデルの性能向上テクニック」に関する文献をまとめて紹介します。

DALL·E の再現も間近か  最新のビジョン×言語研究と「使える」データセットを解説
Free Post
コンピュータービジョン

DALL·E の再現も間近か 最新のビジョン×言語研究と「使える」データセットを解説

テキストから画像を生成したり、その逆に画像からキャプションを生成したりといった「ビジョン×言語」の研究。人工知能で今最も盛り上がっている分野だと言っても過言ではありませんが、今年のはじめごろに OpenAI からCLIP / DALL·E が発表され、その勢いにさらに加速がつきました。本記事では、「ビジョン×言語」分野の最新の研究と、最近発表された「使える」データセットを中心に、最新の動向を解説しました。

テキストを使わないNLP!?音声から直接言語を生成・翻訳する最新モデル動向
Free Post
音声認識

テキストを使わないNLP!?音声から直接言語を生成・翻訳する最新モデル動向

音声に対する自己教師学習技術の発展により、「テキストを使わない NLP」、すなわち、音声から直接言語を生成・翻訳できる機械学習手法が最近になってさかんに研究されています。本記事では、この「音声に対する自己教師学習」「テキストを使わない言語生成・翻訳」に関するここ数ヶ月の研究動向を紹介します。

書き換えに基づく言語生成モデル・文法誤り訂正の最新トレンド
Free Post
自然言語処理

書き換えに基づく言語生成モデル・文法誤り訂正の最新トレンド

文書要約やテキスト簡素化などのタスクにおいて、入力を書き換えることによって出力を生成する「書き換えに基づく」言語生成モデルの利用が急速に広まっています。入力を最大限活用し、少ない語彙数でも高精度な生成を実現できるこれらのモデル。ここ最近のトレンドをまとめました。また、テキスト書き換えとして代表的な「文法誤り訂正」についても、このトレンドを受け、ここ1〜2年で新たな進展がありましたので、本記事で解説します。

タスクの難しさに応じて計算量を自動調節するモデル PonderNet を完全解説【論文速報】
Free Post
機械学習

タスクの難しさに応じて計算量を自動調節するモデル PonderNet を完全解説【論文速報】

DeepMind から、タスクの難しさに応じて計算量を自動で調整してくれるモデル PonderNet が最近発表され、話題になっています。PonderNet は入力の難しさに応じてを必要なだけ「熟考」を繰り返すことによって正解を導きます。本記事では、この実用的かつ興味深いモデル PonderNet を論文速報として解説します。

深層学習を使った音楽生成・音楽表現学習の最先端【2021年最新版】
Free Post
音楽情報処理

深層学習を使った音楽生成・音楽表現学習の最先端【2021年最新版】

生成モデル・表現学習の急速な発展に伴い、音楽生成・音楽表現学習の分野にも大きな変化が起きています。ここ2〜3年の間に、長い楽曲を安定して生成できたり、楽器や楽曲のオーディオを直接生成できたりと、芸術的・実用的にも大きく進歩しています。本記事では、特に 2018年〜2021年のごく最近の研究を中心に最新動向を解説してみたいと思います。

GANを超え、言語にも進出 拡散モデルによる画像言語生成の進歩がすごい
Free Post
機械学習

GANを超え、言語にも進出 拡散モデルによる画像言語生成の進歩がすごい

データに徐々にノイズを加え、その過程の逆を学習することにより画像や言語を生成する「拡散確率モデル」。ここ数ヶ月の間に、「画像生成で GAN を超えた」「尤度ベースで SOTA」「言語生成にも適用可」などの非常に画期的な手法・論文が次々と発表され、盛り上がりを見せています。本記事では最近発表された論文等も含め、最新動向を解説します。

自然言語処理トップ会議 ACL 2021 から厳選!要チェック論文トップ10
Free Post
自然言語処理

自然言語処理トップ会議 ACL 2021 から厳選!要チェック論文トップ10

先々週、自然言語処理のトップ会議である ACL 2021 がオンラインで開催されました。本記事では、ACL 2021 の論文の中から、現時点での引用数や、幅広い研究や開発に役立つかどうかなど、私の主観なども混ぜながら、要チェック論文トップ10 (といいながら、合計 11 本ありますが) を選んで解説しました。なるべく幅広いタスクやプロジェクトに役立つように、特定のタスク固有のものではなく、汎用的な手法のものを優先的に選んでいます。

AI の最新動向ブログを1年続けたら収益が爆発したのでチームを拡大します
Free Post

AI の最新動向ブログを1年続けたら収益が爆発したのでチームを拡大します

本ブログ「ステート・オブ・AI ガイド」の執筆をはじめ1年が経ちました。この記事では、このブログを1年間書き続けてきた振り返りと、僭越ながらここまで成長できた理由について少し書いてみたいと思っています。また、今後さらに良質の記事を会員の皆様に届けていくために、チームの拡大を考えていますので、興味のある方は読み進めていただければと思います。

知覚信号を前処理ナシで高速に処理!話題のモデル Perceiver IO を完全解説【論文速報】
Free Post
機械学習

知覚信号を前処理ナシで高速に処理!話題のモデル Perceiver IO を完全解説【論文速報】

最近、DeepMind から発表された「Perceiver (パーシーバー)」と、それを入出力に適用した「Perceiver IO」が、機械学習界隈で話題となっています。複数のモダリティの知覚信号を前処理ナシで高速に処理でき、様々なタスクで高い性能を達成しているこれらのモデル、本記事では、この Perceiver と、それを入出力に適用した「Perceiver IO」を、速報的に詳しく解説します。

深層学習に基づく系列・セッションベース推薦システムの最新動向
Free Post
機械学習

深層学習に基づく系列・セッションベース推薦システムの最新動向

AI の他分野で深層学習手法が発展するに従い、推薦システムも急速に発展しています。特に、ユーザーの行動履歴から商品などを推薦するセッションベースの推薦システムは、自然言語処理分野での技術の発展に追随しながら大きな発展を遂げています。本記事では、RNN・トランスフォーマーに基づく手法に主に注目しながら、系列・セッションベースの推薦システムの最新動向をまとめました。

You've successfully subscribed to ステート・オブ・AI ガイド
Great! Next, complete checkout for full access to ステート・オブ・AI ガイド
Welcome back! You've successfully signed in.
Success! Your account is fully activated, you now have access to all content.
Success! Your billing info is updated.
Billing info update failed.