AIの勉強法:秘密は『トレーニング』にあり!
学習目標
LLMの学習プロセスを大雑把に理解する。
LLMの学習過程
LLMの学習過程を順に追っていきます。
1.材料集め
本、新聞、ウェブサイトからテキストを収集
2. 下準備
不要な情報を除去
3. 学習開始
人間の脳神経をコンピューターで模倣したニューラル・ネットワークで学習
4. 人間がチェック
不適切な質問への回答、不適切な回答を人間がチェックして調整。これを教師付学習と呼びます。
5.強化学習
LLMは文章を組み立てる際に次に来る単語を確率と文脈から判断します。つまり、最終的に出来上がった文章は、それが良い回答なのかは完了するまで分かりません。
強化学習は完了した結果を自分で採点し、更に良い点数が取れるように自分で繰り返し学習を行います。
このプロセスを「トレーニング」と呼びます。ChatGPTの場合だと約3000億単語を学習しています。
まとめ
LLMは膨大な量のテキストをニューラル・ネットワークを通し、単語の関連性パターンを見つけます。
また、文脈により単語の関連性が変わることも学習します。
最後に人間の手で調整が行われます。
コメント