モデルとは
モデルの概要
AIや機械学習を色々学んでいくと、星の数ほどある〇〇モデル。有名なものからマイナーなものまで、その数は日々増えていっています。
その〇〇モデルは、どのようなものなのか、他の〇〇モデルとの関係はどうなのかをここで整理していこうと思います。
このページや、当サイトで書いている「モデル」は、基本的に「機械学習モデル」のことになります。
モデルと機械学習モデルと統計モデル
モデルとは、そもそもは特定のタスクや問題を解決するために設計されたアルゴリズムや数理的な表現のことです。AIや機械学習におけるモデルは、あるアルゴリズムに従ってデータを利用して学習し、そのデータから得た知識を基に、予測、分類、推論、最適化などを行うもののことです。
そもそも機械学習のモデルという言葉の概念は、統計学や数学から来たようで、統計学には統計モデル、数学には数理モデルと言うものが存在します。
機械学習は、統計学や数学に密接に関係しているのです。
ただ、色々機械学習について読み進めていくと、モデルと言うのが統計学のモデルを意味しているのか、機械学習のモデルを意味しているのか、あやふやになってしまうことがあります。
更に、同じ名前のモデルでも、統計学と機械学習と両方に使われていたりするので、慌てないように心に留めておきましょう。
モデルと機械学習モデルとAIモデル
AIにおける「モデル」は、学習されたモデル、いわゆる機械学習モデル(学習モデル・AIモデル)のことです。そもそもモデルという意味は「ある事柄の手本や見本となるもの。 原型、典型、ひな型」などといった意味合いになります。
AIのジャンルでのこの「モデル」でも、特定の処理を解決するためにトレーニングされた数学的または計算的な構造を指すわけです。
学習モデルとは
機械学習モデルと似た言葉に「学習モデル」や「AIモデル」がありますが、学習モデルは機械学習モデルの呼称が単に短くなったものと考えれば良いでしょう。AIモデルとは
AIモデルに関しては、厳密に言うと、AIモデルは機械学習モデルよりも広義になります。ただ、機械学習以外のAIであるルールベース型AIにはモデルという概念がないので、ほぼ機械学習モデルとAIモデルは同義だと考えることができます。
AI界隈では、このモデルと呼ばれるものがかなり存在するので、どのような違いの意味合いがあるか明確化した方が良いでしょう。
ニューラルネットワークとは
また、モデルと近い用語にニューラルネットワークがありますが、ニューラルネットワークはモデルの中の一種、またはモデルの構造の一種になります。ニューラルネットワークは深層学習(いわゆるディープラーニング)の際に使われるモデルで、後述している識別モデルにも生成モデルにも存在します。
中間層である隠れ層が多層に渡るニューラルネットワーク(通常は5層以上)を持つ複雑なモデルの学習のことを、深層学習(ディープラーニング)と言われています。
詳しくは
ディープラーニング
のページに説明しています。
では、各モデルの種類について整理していきましょう。
機械学習モデルの用途の種類
機械学習モデルは、用途によってに分けられます。
分類や予測などをするモデルを識別的モデル、生成を行うモデルを生成的モデルと言います。
近年、世間では生成モデルと言う言葉はよく聞き馴染みがあり、識別モデルと言う言葉はあまりなじみがなかったりしますが、機械学習モデルの中の用途の分類としては、この2つが挙げられるということです。
では、なぜ「的」が付くのでしょうか。
wikipediaの識別的モデル
にも識別モデルではなく識別的とあります。
ちなみに、生成的モデルも同じくです。
wikipediaの生成的モデル
最初は識別的モデルと識別モデルの違いは、「的」があるのに違和感は感じてましたが、そこまで気にせず同じ意味かと思ってました。
しかし読み解いていくうちに、違いが分かりました。
識別モデルと言ってしまうと、識別するモデルなので、判別や分類系のモデルのことを指します。
しかし後述のように機械学習のモデルを大別する際に、回帰モデルや予測モデルや検知モデルなども含めるため、的を付けるようです。
識別や分類して予測や検知もしていく過程で、やはり生成モデルとは全く性質が異なるからです。
クリエイティブ関連の人たちは生成的モデル、統計分析関連の人たちは識別的モデルが身近に感じられるでしょう。
それでは順番に見ていきます。
識別的モデル
識別的モデルは、入力データがどのクラスに属するかを学習し、その分類を行います。これらのモデルは、データのクラスラベルを直接予測することに重点を置いています。
識別的モデルは、例外もありますが、基本的には何が正解かのラベルが付いた学習(後述の教師あり学習)によってトレーニングされたモデルになります。
識別しなければいけないので、正解ラベルがある、と覚えておけば良いですね。
そして識別的モデルは、その特徴において、
に分類することが出来ます。
ちなみに、後述の生成的モデルは複雑さがある故に多くは非線形モデル、クラスタリングは線形非線形といった概念が薄いため、識別的モデルの場合は合わせて線形か非線形かを覚えていくと良いでしょう。
詳しくは、
識別的モデル
のページに書いています。
さて、識別的モデルは、更に分野において、
をはじめ、他にも
など、これら以外にもAI化されうるものであれば様々なものが挙げられるでしょう。
また、様々な用途に共通して利用できるモデルもあったりもするので、その辺は柔軟に記憶していきましょう。
分類モデル
分類モデルは、データから特徴を学習し、その特徴を基に新しいデータを特定のカテゴリやクラスに分類するためのモデルです。以下に代表的な分類モデルを挙げます。
回帰モデル
回帰モデルは、あるデータの関係を数学的に表し、新しいデータから結果を予測するモデルです。以下に、代表的な回帰モデルを挙げます。
時系列分析モデル
回帰モデルは未来の点の予測に対して、時系列分析モデルは時間の経過に伴う予測をするためのモデルになります。以下に、代表的な時系列分析モデルを挙げます。
異常検知モデル
異常検知モデルは、通常のパターンから逸脱した異常データを検出するモデルです。以下に、代表的な異常検知モデルを挙げます。
物体検出モデル
物体検出モデルは、画像や映像から特定の物体を見つけて、その位置を特定し分類するモデルです。以下に、代表的な物体検出モデルを挙げます。
画像認識モデル
画像認識モデルは、画像データを解析して特定の情報を識別するために使われるモデルです。以下に、代表的な画像認識モデルを挙げます。
生成的モデル
生成的モデルは、データの生成プロセスをモデル化し、与えられた入力から新しいデータを生成するモデルです。一般的に、生成AIと言われているジャンルのモデルになります。
生成的モデルは、以下のような種類があります。
あと、注意しておきたいのが、同じ画像処理の中でも画像生成モデルは生成的モデルで画像認識モデルは識別的モデル、同じく音声処理の中でも音声生成モデルは生成的モデルで音声認識モデルは識別的モデルになります。
そのため、分野が異なり使用するモデルも変わってくるので、混同しないようにしましょう。
更に、生成AIは、生成モデルのみで成り立っているわけではありません。
生成するためには、様々な識別をしながら実行する必要があります。
そのため、生成的モデルと識別的モデルと絡み合いながら、生成される場合がほとんどなので、生成AIについて調べていくとき、なぜ識別的モデル?と慌てないようにしましょう。
自然言語処理モデル
自然言語処理モデルは、自然言語(日本語や英語や中国語やフランス語など)を、翻訳や要約や質疑応答などをして、生成してくれる機械学習モデルです。以下に、代表的な自然言語処理モデルを挙げます。
画像生成モデル
画像生成モデルは、イラスト風や写真風など、様々な画像の生成を目的とする機械学習モデルのことです。以下に、代表的な画像生成モデルを挙げます。
音声生成モデル
音声生成モデルは、テキストや他のデータから人間の音声を合成生成するために設計された機械学習モデルです。以下に、代表的な音声生成モデルを挙げます。
動画生成モデル
動画生成モデルは、まだまだ発展中の分野で、動画を生成出来る機械学習モデルです。以下に、代表的な動画生成モデルを挙げます。
クラスタリング
機械学習モデルは、識別的モデルと生成的モデルに分類されると言いましたが、実はそれ以外にクラスタリングと言うカテゴリーがあります。クラスタリングは、主に分類やクラス分けをするモデルやアルゴリズムになりますが、識別的モデルとは異なり、教師なし学習のモデルになります。
なので、識別的モデルと生成的モデルとは、また別のカテゴリーになります。
機械学習モデルの学習方法の種類
教師あり学習モデル
教師あり学習とは、ラベル付きデータを用いてモデルを訓練し、予測や分類を行うモデルのことをいいます。以下に、教師あり学習のモデルの例を挙げます。
- ロジスティック回帰(識別的モデル)
- SVM(識別的モデル)
- k近傍法(識別的モデル)
- 決定木(識別的モデル)
- ランダムフォレスト(識別的モデル)
- 勾配ブースティング(識別的モデル)
- 線形回帰(識別的モデル)
- リッジ回帰(識別的モデル)
- ラッソ回帰(識別的モデル)
教師なし学習モデル
教師なし学習とは、データにラベルが付いていない状況で、データの構造やパターンを学習させたモデルのことをいいます。以下に、教師なし学習のモデルの例を挙げます。
半教師あり学習モデル
半教師あり学習は、ラベル付きデータとラベルなしデータの両方を使って学習を行ったモデルのことをいいます。強化学習モデル
強化学習は、エージェントが環境内で行動を学び、報酬を通じて最適な戦略を見つけるプロセスで学習されたモデルのことをいいます。モデルと同じカテゴリの画像生成AI用語
機械学習モデル
- ALBERT
- AlexNet
- BERT
- BLOOM
- BigGAN
- CLIP
- CNN
- CVAE
- Checkpoint
- CycleGAN
- DALL-E
- DCGAN
- DDIM
- DDPM
- DPM
- DistilBERT
- ESRGAN
- FLUX
- FastSpeech
- GAN
- GMM
- GloVe
- Hunyuan
- Illustrious
- Imagen
- Isolation Forest
- K-平均法
- LCM
- LDM
- LaMDA
- MLP
- MPT
- OPT
- Parti
- PixArt
- PixelCNN
- Playground
- ProgressiveGAN
- R-CNN
- ResNet
- RoBERTa
- SRGAN
- SSD
- SVD
- SVM
- SVR
- Stable Cascade
- StyleGAN
- T5
- Tacotron
- U-Net
- VAE
- VGG
- VQ-VAE
- ViT
- WaveNet
- Word2Vec
- Würstchen
- XLNet
- YOLO
- fastText
- k近傍法
- ナイーブベイズ
- モデル
- ラッソ回帰
- ランダムフォレスト
- リッジ回帰
- ロジスティック回帰
- 一般化線形モデル
- 一般線形モデル
- 勾配ブースティング
- 拡散モデル
- 決定木
- 異常検知モデル
- 線形SVM
- 線形回帰
- 識別的モデル
- 非線形モデル
機械学習
- ARモデル
- Attention
- CFG
- CFGスケール
- Conv2D
- DBSCAN
- Dropout
- FSL
- GPT
- Gradient Accumulation
- Gradient Checkpointing
- LDSR
- LR Scheduler
- LR Warmup
- NER
- Optimizer
- Plateau
- SDE
- SOTA
- TTS
- X-Adapter
- ZSL
- アルゴリズム
- エポック
- オートエンコーダ
- カーネル関数
- クラスタリング
- コスト関数
- テキストエンコーダ
- データセット
- ニューラルネットワーク
- ニューロンの死
- ノイズ
- ノルム
- ハイパーパラメータ
- バイアス
- バッチ
- バッチサイズ
- プロンプト
- ミニバッチ
- モデル
- モーメント
- ラベル
- ロバスト
- 事前学習
- 再構成誤差
- 分散学習
- 分類モデル
- 勾配
- 勾配消失問題
- 勾配爆発問題
- 勾配降下法
- 半教師あり学習
- 収束
- 回帰
- 回帰モデル
- 回帰分析
- 回帰問題
- 基盤モデル
- 外れ値
- 多クラス分類
- 大規模言語モデル
- 学習
- 学習済みモデル
- 学習率
- 尤度
- 強化学習
- 損失関数
- 教師あり学習
- 教師なし学習
- 時系列分析モデル
- 条件付き確率分布
- 機械学習
- 機械学習モデル
- 次元削減
- 正則化
- 深層学習
- 潜在ベクトル
- 潜在変数
- 潜在空間
- 潜在表現
- 物体検出モデル
- 生成AI
- 生成的モデル
- 画像生成AI
- 画像生成モデル
- 画像認識モデル
- 異常検知
- 畳み込み
- 目的関数
- 線形モデル
- 自己回帰
- 自己教師あり学習
- 転移学習
- 逆伝播
- 逆拡散過程
- 過学習
- 重み
- 離散
- 音声生成モデル
- 順伝播
- 順拡散過程