「AIは何でも知っているけれど、具体的にどれくらいの知識量があるの?」
「人間が同じ量を勉強しようとしたら、一体どれくらいの時間がかかるんだろう?」
最近、ChatGPTなどの生成AIを使う機会が増え、その博識ぶりに驚かされることも多いのではないでしょうか。AIの知識量は、私たち人間の常識をはるかに超える規模です。
この記事では、AIの知識量が人間と比較してどれほど膨大なのかを、具体的な数字や最近のニュースを交えてわかりやすく解説します。
AIの知識量は「人間が数万年かけて読む量」に匹敵?
まず結論から言うと、現在の高性能な生成AIが学習しているデータ量は、人間が一生かかっても読み切れない量です。
一般的に、大規模なAIはインターネット上のウェブサイト、書籍、論文など、数兆語レベルのテキストデータを学習していると言われています。これを人間が読書で追いかけようとすると、数千年〜数万年かかるとも例えられます。
これだけでは少しイメージしにくいかもしれません。そこで、実際に日本国内で進められているAI開発の事例を使って、具体的な「年数」を計算してみましょう。
【実例で計算】30万冊のデータだけでも「約820年」かかる
AIの知識量の凄まじさを理解するために、国立国会図書館(NDL)と国立情報学研究所(NII)の取り組みを例に挙げてみます。
国産のAI(大規模言語モデル)を開発するために、国立国会図書館が保有する「約30万点」の官庁出版物などのテキストデータが提供されるという動きがあります。
この「30万点」という数字、人間が読もうとするとどうなるでしょうか?
もし人間が1日1冊読んだら?
- 1日1冊ペースで読むと仮定
- 300,000冊 ÷ 365日 = 約821年
なんと、たった一つのデータ提供プロジェクトに含まれる資料(約30万点)を読むだけで、800年以上もかかってしまう計算になります。平安時代から読み始めて、ようやく今読み終わるくらいの時間です。

AIは、こうした膨大なデータを学習の一部として取り込み、さらに世界中のウェブサイトや専門書の知識も組み合わせています。AIがいかに規格外の知識量を持っているかがわかります。
知識量が多いからこその「落とし穴」に注意
「それだけ知識があるなら、AIの言うことは全て正しいの?」と思うかもしれませんが、そうではありません。
総務省の「情報通信白書」などでは、AIの普及に伴うリスクについても指摘されています。
1. もっともらしいウソ(ハルシネーション)
AIは膨大な言葉のつながりを学習していますが、「事実かどうか」を人間のように判断しているわけではありません。そのため、非常に流暢な日本語で、全くのデタラメを答えることがあります。
これを「ハルシネーション(幻覚)」と呼びます。


2. 著作権や偽情報のリスク
大量のデータを学習しているため、著作権侵害や、悪意のある偽情報の拡散に使われるリスクもあります。
そのため、国は「AI事業者ガイドライン」を策定し、開発者や利用者が気をつけるべきルール作りを進めています。

まとめ:AIは「超・博識なパートナー」として付き合おう
AIの知識量は、人間が何百年、何万年かけても到達できないレベルにあります。しかし、その知識が常に「正解」とは限りません。
AIの知識量: 人間なら読み終わるのに数百年〜数万年かかるレベル。
付き合い方: 圧倒的な情報処理能力を頼りつつ、最終的な事実確認は人間が行う。
AIの凄まじい知識量を味方につけつつ、その回答を鵜呑みにせず上手に使いこなしていくことが、これからの時代には大切です。
