AI用語集
AIや機械学習に関するキーワードを、初心者にもわかるように解説しています。
ア行
AIエージェント(AI Agent)
人間に代わって、自分で考えて目標まで仕事を終わらせてくれる「自律型AI」。
タスクを与えるだけでAIが計画→ツール使用→結果確認→修正のループを繰り返して自律的に完遂します。ブラウザ操作・コード実行・ファイル操作など多様なツールを組み合わせられます。AutoGPT・Claude Code・Devinなどが代表例。「AIがパソコンを操作する」時代の中核技術です。
AGI(Artificial General Intelligence:汎用人工知能)
特定分野だけでなく、人間と同じように「何でも」こなせるAIのこと。まだ実現していない。
現在のAI(ChatGPTなど)は特定タスクで人間を超えますが、未知の状況への対応や常識的判断には限界があります。AGIは「あらゆる知的作業を人間レベルでこなせるAI」を指す概念で、OpenAIなどが開発目標に掲げています。実現時期や定義については研究者間でも議論が続いています。
アライメント(AI Alignment)
AIが人間の価値観や意図に沿って動くよう「方向を合わせる」こと。
AI安全性の中心的な研究テーマです。高性能なAIが人間の望まない方向に能力を使わないよう、人間の価値観・倫理・意図と「ズレなく整合した」行動をするよう訓練・設計する取り組みです。RLHFもアライメントの主要な手法のひとつです。
アノテーション(Annotation)
AIに学習させるために、画像や文章に「これは猫」「これは肯定的」とラベルを貼る下準備のこと。
機械学習の品質は訓練データの質に直結するため、アノテーション作業は非常に重要です。人間が手作業で行う場合(クラウドソーシング等)と、AI支援で半自動化する場合があります。「ゴミデータ→ゴミモデル(Garbage in, garbage out)」はAI界の格言です。
インコンテキストラーニング(In-Context Learning)
プロンプトの中にお手本をいくつか見せるだけでAIにその場で解き方を学ばせるテクニック。
モデルの重みを更新(ファインチューニング)しなくても、会話の中に例示を含めるだけでAIが挙動を変えられる能力です。Few-Shot Promptingとも呼ばれます。LLMの重要な特性のひとつで、コスト不要で特定タスクの精度を劇的に上げられます。
インファレンス / 推論(Inference)
学習済みAIが新しい入力に対して「回答をひねり出す」処理のこと。学習の逆フェーズ。
機械学習には「学習(Training)」と「推論(Inference)」の2フェーズがあります。学習は莫大なGPUリソースが必要ですが、推論は比較的軽量です。ChatGPTに質問して回答が返ってくる、その処理全体がインファレンスです。「推論コスト」はAPIの従量課金に直結します。
エンベディング(Embedding)
単語や文章を「数字の座標」に変換して、意味の近さを計算できるようにする技術。
「猫」と「ネコ」は表記が違っても意味が近いため、エンベディング空間では座標が近くなります。RAGシステムにおいてユーザーの質問と関連文書を照合する際の核心技術です。OpenAIやCohereなどがエンベディングAPIを提供しており、ベクターデータベースと組み合わせて使います。
オープンソースAI(Open Source AI)
設計図(モデルの重み)が無料公開されていて、誰でもダウンロードして改造できるAI(Llamaなど)。
MetaのLlama・MistralAI・QwenなどがオープンなAIモデルを公開しており、自社サーバーで動かしたり、LoRAでカスタマイズしたりできます。商用利用の可否はライセンスごとに異なります。クローズドなChatGPTやClaudeと対比される概念です。
カ行
画像生成AI(Image Generation AI)
文字で指示を出すだけで、プロ級のイラストや写真を数秒で描いてくれるAI。
Midjourney・Stable Diffusion・DALL-E・Fluxなどが代表例。テキストから画像を生成する「Text-to-Image」が基本形で、既存の画像を変換する「Image-to-Image」も可能です。主にDiffusion Modelというアーキテクチャが使われています。デザイン・マーケティング・映像制作の現場で急速に普及しています。
過学習(Overfitting)
AIが練習データを丸暗記しすぎて、本番の新しいデータに対応できなくなってしまう状態。
訓練データに過度に最適化された結果、未知のデータへの汎化性能が著しく低下します。防ぐ手法として正則化・ドロップアウト・データ拡張・早期終了などがあります。「ベンチマークで100点でも実運用でボロボロ」という典型的な失敗パターンの原因です。
GAN(Generative Adversarial Networks:敵対的生成ネットワーク)
「偽物を作るAI」と「偽物を見破るAI」を競わせて、超リアルな画像を生み出す技術。
生成器(Generator)と識別器(Discriminator)が互いに競い合うことで、どちらも高精度になっていく仕組みです。「存在しない人の顔写真」や「アーティスト風イラスト」の生成に広く使われました。現在はDiffusion Modelに主流の座を譲りつつありますが、動画生成などで今も活用されています。
強化学習(Reinforcement Learning)
AIにゲームを何度もプレイさせ、上手くいったらご褒美をあげることで自分で上達させる学習方法。
環境との相互作用を通じて報酬を最大化する行動を学ぶ手法です。囲碁・将棋AIの強さの秘密でもあります。LLMでは「人間のフィードバックによる強化学習(RLHF)」として応用され、より役立つ・安全な回答をするよう調整するために使われています。
コパイロット(Copilot)
仕事やプログラミングをすぐ隣でサポートしてくれる、頼れる「AIの副操縦士(助手)」。
MicrosoftのGitHub CopilotやMicrosoft 365 Copilotが代表例です。コードの自動補完・バグ修正・文書作成補助などをリアルタイムで行います。「Copilot」という名称は広義に「AIアシスタント機能全般」を指す場合もあります。
コンテキストウィンドウ(Context Window)
AIが一度の会話で記憶しておける「テキストの容量(文字数の上限)」のこと。
トークン数で表され、これを超えた情報はAIには見えません。古いモデルは数千トークンでしたが、Gemini 1.5 Proは100万トークン超、Claude 3.5は20万トークンを実現しています。長いPDF・コードベース全体・長い会話履歴を扱う場合に特に重要な概念です。
量子化 / クォンタイズ(Quantization)
AIモデルのデータを「軽量な数値形式」に変換して、性能をほぼ保ちながら容量・速度を大幅改善する技術。
通常32bit浮動小数点数で表されるパラメータを、8bitや4bitに圧縮します。70BパラメータのLlamaも量子化すれば普通のゲーミングPCで動作可能になります。ローカルAI実行ツール(Ollama・LM Studioなど)で必須の概念です。精度と軽量さのトレードオフが生じます。
サ行
サジェスト(Suggest)
入力中にAIが「次に打ちたい言葉」を予測して提案してくれる機能。
Google検索の予測変換が典型例ですが、現在はコード補完(GitHub Copilot)・文章続き予測(Gmail Smart Compose)など広範囲に使われています。言語モデルが「次のトークンを予測する」という基本原理そのものを活かした機能です。
事前学習(Pre-training)
AIに膨大なデータを読み込ませて、言葉の基礎や常識を身につけさせる最初の「義務教育」。
インターネット上のテキスト・書籍・コードなど兆単位のトークンを使い、数百〜数千台のGPUで数週間〜数ヶ月かけて行います。GPT・Claudeなどの基盤モデルはここで作られます。この後にファインチューニングやRLHFで用途に特化させます。
自然言語処理(NLP: Natural Language Processing)
コンピュータに人間の言葉(日本語・英語など)を理解・生成させる技術分野の総称。
翻訳・要約・感情分析・対話システム・文章校正など、言語に関わるAI技術すべてを指します。LLMの登場でNLPの性能は飛躍的に向上し、今やAI活用の中核となっています。
生成AI(Generative AI)
テキスト・画像・音楽・プログラムなど「新しいコンテンツを自ら作り出す」AIの総称。
従来のAIが「分類・予測」を行うのに対し、生成AIは存在しなかったコンテンツを作り出します。ChatGPT(テキスト)・Midjourney(画像)・Suno(音楽)・Sora(動画)などが代表例。2022年のChatGPT登場で一般への普及が爆発的に進みました。
ゼロショットプロンプティング(Zero-Shot Prompting)
お手本を一つも与えずに、いきなりAIに質問して答えさせる最もシンプルな指示の出し方。
「これは肯定的・否定的?」と例なしで聞く方法です。対してFew-Shot Prompting(フューショット)はいくつかの例を先に見せてから質問します。LLMの汎化能力が高いため、ゼロショットでも驚くほど高精度な結果が得られますが、タスクによってはFew-Shotの方が優れます。
セマンティック検索(Semantic Search)
キーワード完全一致ではなく、「言葉のニュアンス(意味)」をAIが汲み取って探す賢い検索。
エンベディングとベクターデータベースを組み合わせて実現します。「犬 散歩」で検索すると「ペット 屋外運動」という表記の文書もヒットするなど、同義語・類義語への対応が可能です。RAGシステムの文書検索部分の主要手法です。
タ行
チャットボット(Chatbot)
テキストや音声でユーザーと会話できる自動応答プログラム。AIで飛躍的に賢くなった。
以前のチャットボットはルールベースで決まった回答しか返せませんでしたが、LLMを組み込んだ現代のAIチャットボット(ChatGPT・Claudeなど)は自然な会話や複雑な質問対応が可能になりました。カスタマーサポート・FAQ自動化・社内問い合わせ対応などに広く使われています。
ディープフェイク(Deepfake)
AIを使って、実在する人物の顔や声を別の動画にリアルに合成した「偽物のメディア」。
「Deep Learning(深層学習)」と「Fake(偽物)」を組み合わせた造語です。政治家の偽演説動画・フィッシング詐欺・なりすまし犯罪などに悪用されるリスクが問題視されています。一方で映画・エンターテイメント産業では俳優の若返り表現などに活用されています。
ディープラーニング / 深層学習(Deep Learning)
人間の脳の神経回路を模倣した、AIを劇的に賢くした立役者的な技術。
多層のニューラルネットワーク(「深い=Deep」)を使って、画像・音声・テキストから特徴を自動抽出します。2012年頃から画像認識で人間超えを達成し、AIブームを牽引しました。現在のLLM(ChatGPT等)も深層学習の産物です。
テキスト音声合成 / TTS(Text-to-Speech)
文字を入力するだけで、人間のような自然なナレーションや声を自動生成する技術。
ElevenLabs・OpenAI TTS・Google WaveNetなどが有名です。以前の「ロボット声」から、感情・抑揚・方言まで再現できるレベルに進化しました。ポッドキャスト自動生成・動画ナレーション・音声アシスタントなど幅広く使われています。
トークン(Token)
AIが文章を処理する時の「最小の文字のブツ切り(単位)」。料金計算の基準にもなる。
英語では "hello" が1トークン、日本語では1〜2文字が1トークンになることが多いです。AIのAPIは入力・出力のトークン数で課金されます。また「コンテキストウィンドウ」の大きさもトークン数で表現されます。「1000トークン≒日本語500〜700文字」が目安です。
動画生成AI(Video Generation AI)
文字や画像を入力するだけで、映画のような動く映像を自動で作ってくれるAI。
OpenAIのSora・RunwayML・Pika・Kling・Veoなどが代表的なサービスです。テキストから動画を作る「Text-to-Video」が主流で、数秒〜数分の映像を生成できます。映画制作・広告・教育コンテンツなどでの活用が始まっています。
転移学習(Transfer Learning)
別分野で学んだAIの知識を新しい分野に活かす学習手法。ファインチューニングの土台。
人間が「英語を学んだ経験がスペイン語習得を早める」ように、大規模モデルが学んだ汎用知識を特定タスクに転用します。ゼロからモデルを学習するより圧倒的に少ないデータ・コストで高性能化できます。現代のLLM活用法の中核概念です。
ナ行
ニューラルネットワーク(Neural Network)
人間の脳の神経細胞のつながりを、コンピューター上で再現した計算の仕組み。
多数のノード(人工ニューロン)を層状に並べ、データを通すことでパターンを学習します。層を深く重ねたものが「ディープラーニング」です。画像認識・音声認識・言語理解など幅広い分野で人間を超える精度を実現しています。
ノーコードAI(No-Code AI)
プログラミング知識なしに、画面操作だけでAIアプリが作れるツール。
Zapier・Make(旧Integromat)・Dify・Voiceflowなどが代表例です。AIとWebサービスを視覚的なフロー図でつなぎ合わせて、業務自動化やAIチャットボットをノーエンジニアで構築できます。AIの民主化を象徴するトレンドです。
ハ行
パープレキシティ(Perplexity)
AIの「迷い度(不確実さ)」を表す指標。また、最新情報を検索して要約してくれるAI検索エンジンの名前でもある。
数値としてのPerplexityは低いほど良い(確信を持って予測できている)モデルを示します。一方「Perplexity.ai」はAI検索エンジンサービスで、Googleのように検索しながらChatGPT的な回答を生成する機能で急速にユーザーを獲得しています。
バイアス(AI Bias)
学習データの偏りが原因で、AIの回答に「差別・偏見・片寄り」が出てしまう現象。
採用AIが女性を不当に低評価した事例・顔認識AIが特定人種の精度が低かった事例など、実害が多数報告されています。データの偏りだけでなく、モデルの設計・評価基準・使用文脈も原因になります。AI倫理・アライメント研究の重要テーマです。
ハルシネーション(Hallucination)
AIがもっともらしい嘘をつく現象。「知ったかぶり」のこと。元の意味は「幻覚」。
LLMは「次に続く確率が最も高いトークン」を計算して文章を作るため、事実かどうかを理解していません。統計的に自然な文章を生成しながら、存在しない論文・人物・法律を堂々と述べることがあります。RAGや検索拡張で低減できますが、完全には防げないのが現状です。
パラメーター(Parameter)
AIの脳みそにある「思考のスイッチ(調整ツマミ)」の数。多いほど賢いが重くなる。
ニューラルネットワーク内の重みの総数で「70億パラメータ(7B)」などと表現されます。GPT-4は推定で数百B〜1T超とされています。パラメータ数が多いほど表現力が高いですが、計算コストと電力消費も増大します。
ファインチューニング(Fine-tuning)
一般常識を学んだAIに、専門データを追加学習させて「特定分野の専門家」に育てる特訓。
医療文書専用・法律文書専用・自社FAQ専用など、特化したモデルを作れます。フルスクラッチより圧倒的にコストが低く、少量のデータでも高い専門性を発揮できます。LoRAはファインチューニングの軽量版として特に人気です。
フューショット学習(Few-Shot Learning)
プロンプトの中に少数のお手本を見せてから質問することで、AIの精度を上げるテクニック。
「このように分類してください:例1)ポジティブ→〇、例2)ネガティブ→×」のように数例を示してから本番の質問をします。インコンテキストラーニングの代表的な手法で、ゼロショットより精度が上がることが多いです。
ベンチマーク(Benchmark)
AIモデルの「頭の良さ」を比較測定するための標準テスト。ランキングの基準になる。
MMLU(知識)・HumanEval(コーディング)・MT-Bench(対話)などが有名です。各AIサービスがアップデートを発表する際に「ベンチマークでGPT-4を超えた」などと示します。ただし「ベンチマークでは高得点でも実用ではイマイチ」という問題もあり、評価の難しさが課題です。
ベクターデータベース(Vector Database)
言葉の意味を「座標(数字)」に変換して保存し、似た意味のものを一瞬で探し出せる特殊なデータベース。
Pinecone・Weaviate・Chroma・pgvectorなどが代表例。エンベディングで変換した数値ベクトルを格納し、セマンティック検索やRAGの文書検索を高速に実現します。従来のSQLデータベースとは根本的に異なる仕組みです。
プロンプト(Prompt)
AIへの「命令文」や「質問のメッセージ」のこと。書き方次第で結果が激変する。
ChatGPTなどに入力するテキスト全般を指します。役割付与(「あなたはプロの編集者です」)・例示・制約の明示・出力形式の指定などを組み合わせると精度が上がります。プロンプトの書き方を専門的に磨くことを「プロンプトエンジニアリング」と呼びます。
プロンプトエンジニアリング(Prompt Engineering)
AIから最高の回答を引き出すために、質問・指示の書き方を工夫するテクニックの体系。
Chain-of-Thought(段階的に考えさせる)・Few-Shot(例示)・役割設定・制約明示など様々な手法があります。同じAIでもプロンプトの工夫で出力品質が劇的に変わるため、実用的なAI活用スキルとして注目されています。
マ行
機械学習 / マシンラーニング(Machine Learning)
人間がルールを手書きせず、AIがデータから自分でパターンやルールを見つけ出す技術。
教師あり学習・教師なし学習・強化学習の3種類が主な分類です。ディープラーニングは機械学習の一手法です。スパムフィルター・レコメンデーション・不正検知など、日常のシステムのあらゆる場所に使われています。
マルチエージェント(Multi-Agent)
複数の専門AIチームを組ませて、勝手に会議しながら成果物を作らせる仕組み。
「調査担当AI→執筆担当AI→校正担当AI」のように役割を分担させることで、1つのAIでは難しい複雑なタスクを高品質にこなせます。AutoGen・LangGraph・CrewAIなどが実装フレームワークとして使われています。
マルチモーダル(Multimodal)
テキストだけでなく、画像・音声・動画もまとめて同時に理解・処理できるAI。
「写真を見て説明文を書く」「音声を聞いてテキストに変換し要約する」「図表を読んで質問に答える」など複合的な処理が可能です。GPT-4o・Gemini 1.5・Claude 3.5 Sonnetなどが代表例。AI活用の幅を大きく広げた重要な能力です。
MoE / Mixture of Experts(混合エキスパート)
大勢の「専門AI(エキスパート)」を用意して、入力の種類に応じて担当を切り替えるアーキテクチャ。
全パラメータを毎回使うのではなく、必要な専門家モデルだけを活性化することで、巨大モデルの性能を保ちながら推論コストを大幅削減できます。GPT-4・Mixtral・DeepSeekなどに採用されており、効率的な次世代LLMの主流アーキテクチャになっています。
モデル(AI Model)
大量のお勉強を終えた「AIの脳みそ本体」。ChatGPTやClaudeなど各AI製品はそれぞれ独自のモデルを持つ。
学習によって作られた数十億〜数千億のパラメータの集合体です。同じサービスでも「GPT-4」「GPT-4o」「GPT-4o mini」のようにモデルが異なれば性能・価格が変わります。オープンソースモデル(Llama等)とクローズドモデル(GPT-4等)に大別されます。
ラ行
RAG / ラグ(Retrieval-Augmented Generation:検索拡張生成)
AIが回答前に社内データや最新ネット記事をコソコソ検索してカンニングすることで、嘘(ハルシネーション)を激減させる技術。
ユーザーの質問に関連する文書をベクターデータベースから検索し、その内容をプロンプトに追加してからLLMに回答させます。最新情報の反映・専門知識の参照・社内文書への対応が可能になります。AIを実業務で使う際の最重要設計パターンのひとつです。
リアルタイムウェブ検索(Real-time Web Search)
AIが過去の学習データだけでなく、今この瞬間の最新ネット情報を検索して回答に取り入れる機能。
ChatGPTのSearchやPerplexity.ai・Grokなどが実装しています。学習データのカットオフ(知識の期限切れ)問題を解決し、今日のニュース・株価・天気なども回答できます。ただし誤ったWebページを参照するリスクもあります。
ワ行
ワークフロー自動化(Workflow Automation)
「メールが来たらAIで要約して、Slackに通知して、スプレッドシートに保存する」といった一連の作業をAIを挟んで全自動化すること。
Zapier・Make・n8nなどのノーコードツールとLLMを組み合わせて実現します。反復的な業務タスクをパイプライン化することで、人間はより創造的な仕事に集中できます。AIエージェントとの組み合わせでさらに高度な自動化が可能です。
英字
API(Application Programming Interface)
AIの機能を自分のアプリから呼び出すための「接続口」。APIキーで認証する。
ChatGPTのAPIを使えば自社サービスにGPTの機能を組み込めます。料金はトークン数で課金されます。AI活用においてAPIの理解は必須で、コードが書ける人なら誰でもAIを自分のサービスに組み込めます。
Chain of Thought / CoT(チェーン・オブ・ソート)
「ステップバイステップで考えて」とAIに指示することで、複雑な問題の正答率を大幅に上げるプロンプト技法。
「答えだけ言って」ではなく「考える過程を順序立てて述べてから答えを出して」と指示するだけで、算数・論理問題・コーディングなど推論が必要なタスクの精度が劇的に改善します。現在のo1・o3などの「推論モデル」はこれを自動的に内部で行っています。
GPU(Graphics Processing Unit)
AI学習・推論に欠かせない「超並列計算のプロセッサ」。NVIDIAがほぼ独占。
もともとゲームのグラフィック描画用に開発されましたが、行列計算が大量に必要なAI学習に最適であることが判明し、AI時代の必須ハードウェアになりました。NVIDIAのA100・H100・H200が主要AI企業に奪い合われており、入手困難・価格高騰が社会問題化しています。
GPT(Generative Pre-trained Transformer)
OpenAIが開発したLLMシリーズの名前。ChatGPTの「エンジン」にあたる部分。
GPT-3(2020)・GPT-4(2023)・GPT-4o(2024)と進化しています。「Generative(生成)・Pre-trained(事前学習済み)・Transformer(アーキテクチャ)」の頭文字。ChatGPTはGPTモデルをベースにした対話インターフェースです。
LLM(Large Language Model:大規模言語モデル)
大量のテキストで学習した、文章を理解・生成できる巨大AIモデルの総称。
ChatGPT・Claude・Gemini・LlamaなどがすべてLLMに分類されます。「Large(大規模)」とは数十億〜数千億ものパラメータを持つことを指します。Transformerアーキテクチャを基盤とし、2022年頃から急速に性能が向上・普及しました。
LLM Ops(エルエルエム・オプス)
AIシステムを安全・安定・安くに24時間動かし続けるための運用管理の仕組み。
DevOps(ソフトウェア開発運用)のAI版です。モデルのバージョン管理・プロンプトのA/Bテスト・推論コストの最適化・品質モニタリング・安全フィルタリングなどを含みます。AIサービスを本番運用する際に必須の概念です。
LoRA(Low-Rank Adaptation)
AIのモデル全体を更新せず、小さな「追加レイヤー」だけを学習させてカスタマイズする軽量ファインチューニング手法。
通常のファインチューニングと比べて必要なVRAM(GPU記憶容量)が大幅に少なく、家庭用GPUでも大規模モデルの特化学習が可能になります。Stable Diffusionの画風・キャラクターLoRAが有名で、特定の絵柄・スタイルをモデルに追加するのに広く使われています。
MCP(Model Context Protocol)
AIと外部ツール・データソースをつなぐ「共通の接続規格」。Anthropicが提唱。
2024年にAnthropicが発表した標準プロトコルです。AIエージェントがファイルシステム・データベース・APIなど様々なツールを共通の方法で操作できるようになります。Tool CallingやFunction Callingをより標準化・拡張したもので、エコシステムが急速に拡大しています。
RLHF(Reinforcement Learning from Human Feedback:人間のフィードバックによる強化学習)
人間が「この回答の方が良い」と評価したデータを使ってAIを強化学習させ、より役立つ・安全な回答をするように調整する手法。
ChatGPTの安全性・有用性の多くはこのRLHFによって実現されています。人間のアノテーターが2つの回答を比較して「どちらが良いか」を評価し、その結果で報酬モデルを訓練してからPPOアルゴリズムで強化学習します。DPOなど改良手法も登場しています。
ツールコーリング / Tool Calling(Function Calling)
AIが自分の回答の中で「外部ツールを呼び出して」リアルタイムの情報を取得したり、アクションを実行したりする機能。
「今日の天気を調べて」「このデータをDBに保存して」「計算をPythonで実行して」といった指示にAIが対応できるようになります。MCPやAPIと組み合わせて使われます。AIエージェントの中核機能のひとつです。