第4話なぜAIエージェントはCLIから始まったの？

AIエージェント入門

2026.04.09

では、GUI全盛の今、なぜ？AIエージェントはCLIなのでしょうか？

「GUIが不要だから」——これが最もシンプルで正確な答えです。

AIエージェントは、「あなたからの要求」を実現するために

計画を立て
ステップごとに実行し
結果を報告

しますが、

計画の許可（計画の表示・許可）も文字だけで完結
実行にはファイルの読み書き、Webでの検索（検索結果の読み込み）があるが経過表示は不要
実行結果の報告も文字だけで完結

するからです。

GUIは必要？

GUIが必要になる場面を考えてみます：

GUIが必要な場面	AIエージェントには必要か？
写真を表示する	❌ 不要（テキストで「猫の画像を生成しました」で十分）
マウスでドラッグ＆ドロップ	❌ 不要（ファイルパスを指定するだけ）
色やフォントを選ぶ	❌ 不要（そんな装飾、AIには無意味）
ボタンの位置を覚える	❌ 不要（すべてコマンドで済む）
リアルタイムのアニメーション	❌ 不要（進捗はテキストで十分）

つまり：AIエージェントがやること（ファイル読み込み、編集、実行、結果出力）は、すべてテキストで完結する。
「絵やボタン」は一切不要。

むしろ「GUIがあると邪魔」な理由まである

無駄な処理が増える
GUIを表示するには「絵を描く」「ボタンの位置を計算する」などの余計な計算が必要。AIはその分だけ遅くなる。
エラーが増える可能性
「ウィンドウが隠れていた」「ボタンが押せない状態だった」など、GUI固有のトラブルが発生する。CLIなら「コマンドが通らない＝エラー」だけでシンプル。
AIが「見る」必要がない
人間はGUIで「見て判断する」けど、AIはテキストを「読んで判断する」。CLIなら結果がそのままテキストで返ってくるから、AIはすぐに次の行動を決められる。

たとえ話：ロボットに道を教える

GUIで教える場合：
地図を見せて「ここを右に曲がって、赤い看板の前で止まって…」→ロボットは「赤い看板ってどれ？」「地図の縮尺は？」と混乱。
CLIで教える場合：
「緯度35.123、経度135.456に向かって、100m進む」→ロボットは迷わず実行。

AIエージェントにとって、CLIは「曇りのない、正確な指示」なんです。

じゃあ、なぜ人間はGUIを好むのか？

人間は「並列処理が苦手」で「視覚的な手がかり」がないと不安になるからです。

人間	AIエージェント
一度に見られる情報は少ない	テキストなら何万行でも読める
色や形で判断したい	文字列のパターンで判断したい
「今何をしているか」を絵で見たい	「今何をしているか」をテキストログで見たい
マウスがないと操作できない	マウスなんてそもそも持っていない

つまり：GUIは「人間の都合」で作られた。AIエージェントには最初から不要だった。

歴史を振り返ると…実は「CLIのほうが後から来た」説もある

面白いことに：

ごく初期のコンピューター（1940〜50年代）はスイッチとランプ（GUIでもCLIでもない）
その次にCLI（テレタイプ端末）
その次にGUI（人間のために作られた）

そして今、AIエージェントはCLIに戻った。
つまり「人間のための中間であるGUIを飛ばして、機械同士の最適なインターフェースに戻った」とも言えます。

最近はGUIのエージェントも

CLIから始まったAIエージェントですが、最近はGUIのAIエージェントもあります。

GUIエージェントは、あなたの要求を実現するために、

アイコンをクリックしてアプリを開き
ブラウザの入力やリンクのクリック
画面キャプチャ
作成したファイル内容の表示

などを行います。

まとめ：AIエージェントはGUIが不要

AIエージェントは、ボタンクリックなどが不要なためGUIは不要

つまり：

CLIは「十分」どころか 「最適」 です。余計なものが一切ない。
GUIは「人間が見るため」の装飾。AIには装飾が不要どころか邪魔。
だからAIエージェントはCLIから始まり、これからもCLIが基本であり続けるでしょう。

タイトルとURLをコピーしました