TOPICS

トピックス

第8回ライフクリエイター入門演習が行われました。

ライフクリエイター入門演習

第8回 「現代AIの仕組み(2)」(2021年6月9日)

信州大学社会基盤研究所 特任教授 林憲一

第8回の講義では、第三次AIブームの中核技術「機械学習」について三種類の手法とそれぞれの特徴などを紹介しました。

1.機械学習の種類

機械学習には「教師あり学習」「教師なし学習」「強化学習」の三種類がある。教師あり学習は猫の画像などのデータ(入力)と「これは猫である」という正解ラベル(出力)をセットにして学習する手法である。過去の売り上げ情報から将来の売り上げを予測する「回帰」、画像にある動物やスパムメールを識別する「分類」などに使われている。

例えば「MNIST(エムニスト)」は0~9の手書きの数字を判別する学習用の画像データセットで、正解ラベルが付いた手書き数字画像6万枚とテスト画像1万枚からなる。人間が一つ一つ特徴量を見つけ出す方法ではプログラミングに何万行も必要だが、特徴量を自動的に抽出する機械学習ではわずか数行で済む。未知のデータに対しての予測能力(汎化性能)を高めるために学習に全てのデータを使い尽くすのではなく、腕試し用のテストデータを取っておくことが重要である。

「教師なし」学習では、データを入力する際に正解ラベルを付けず、入力データの持つ構造・特徴を自動的に学習し、クラスターに分ける。例えば、売り上げ情報から顧客の特徴を見出して分類するため、それぞれの顧客層に合ったマーケティング戦略などに使われる。

「強化学習」はAIが選択した行動に対し、その結果の状態に応じた報酬(罰)を与えて学習する手法である。状態が良くなるほど高い報酬を与え、AIの行動が最善化されていく。例えば、シミュレーション上のコースで数台の車を走らせ、壁や他の車に当たったら罰を、当たらずにスムーズに走行できたら報酬を与えていく。はじめは至る所にぶつかって走れなかった車が、強化学習を繰り返すうちにコース内を何にもぶつからずに走行できるようになる。

これら三つの学習方法は組み合わせて使うこともある。精度を上げるために複数の異なるモデルを使い多数決で一つの答えを導き出す手法を「アンサンブル学習」と呼ぶ。

2.機械学習のモデルの評価指標

機械学習によって得た入力と出力の関係性を表す計算式を「モデル」と呼び、人間にとっての頭脳を意味する。得られたモデルの有用性を示す評価指標は、分類や予測が答えと一致する「正解率」、間違いが少ない「適合率」、見逃しが少ない「再現率」、適合率と再現率の調和平均の「F値」があり、目的に合わせた評価尺度の選定が重要である。

3.学習用のデータの集め方

膨大なデータに正解ラベルを付けて(アノテーション)学習用データを作るのは人手がかかる大変な作業である。例えば自動運転のセマンティックセグメンテーションでは人が塗り絵のように背景に意味付けをしている。

ページの先頭へ