第3回：AIはどうやって勉強してる？

AIの勉強法：秘密は『トレーニング』にあり！

LLMの学習プロセスを大雑把に理解する。

LLMの学習過程を順に追っていきます。

本、新聞、ウェブサイトからテキストを収集

不要な情報を除去

人間の脳神経をコンピューターで模倣したニューラル・ネットワークで学習

不適切な質問への回答、不適切な回答を人間がチェックして調整。これを教師付学習と呼びます。

LLMは文章を組み立てる際に次に来る単語を確率と文脈から判断します。つまり、最終的に出来上がった文章は、それが良い回答なのかは完了するまで分かりません。

強化学習は完了した結果を自分で採点し、更に良い点数が取れるように自分で繰り返し学習を行います。

このプロセスを「トレーニング」と呼びます。ChatGPTの場合だと約3000億単語を学習しています。

LLMは膨大な量のテキストをニューラル・ネットワークを通し、単語の関連性パターンを見つけます。

また、文脈により単語の関連性が変わることも学習します。

最後に人間の手で調整が行われます。