第17回 トークン化

プロンプト講座

AIが言葉を分解する方法

1. トークン化とは?

「AIは文章をパズルみたいに分解して理解する!」
この分解作業をトークン化(Tokenization)といいます。

2. トークンって何?

AIにとっての1単位です。
文章はそのまま読んでいるのではなく、「細かいかけら(=トークン)」に分解してから理解します。

分解結果(トークン化)
今日は晴天「今日」「は」「晴天」
Hello!「Hello」「!」
😊「😊」

3. 日本語も英語もルールが違う?

英語は「単語ごと」に分けるのが基本

Hello! → Hello, !

日本語は「文字ごと」「単語ごと」「助詞まで」バラバラ

今日は晴天 → 今日, は, 晴天

✅ 言語によってトークン化のルールが変わる!

4. これも知ってた?絵文字や記号もトークン

文字・記号トークン数
😊1トークン
🎉🍣2トークン
スーパーカリフラジリスティック(長い単語)5~7トークン
123451トークン
12,345円3~4トークン

単語の長さ=トークン数 ではないので注意!
記号や絵文字もちゃんとカウントされる!

5. トークン数を数えてみよう!(体験コーナー)

下のリンクで自分の名前好きな言葉を入れて、トークン数をチェックしよう!

👉 OpenAI公式トークンカウンター
※スマホでも使えるよ!

実験してみよう

  • 自分のフルネームは何トークン?
  • 「AIって面白い!」は何トークン?
  • 好きなアニメタイトルは何トークン?

まとめ

トークン=AIが文章を分解した“かけら”
文字数とトークン数は違う(特に日本語は要注意!)
絵文字・記号もトークンとして数える

チャレンジクイズ

次の文は何トークンになるでしょう?

2025年のAIはすごい!

① 8トークン
② 10トークン
③ 12トークン

✅ 答え合わせはトークンカウンターで!

おわりに

「トークン」を知っていると、AIに伝わりやすい文章のコツがわかるようになる!
「なるべく短く・わかりやすく」伝える練習をしてみよう。

コメント

タイトルとURLをコピーしました