オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】GPT #まとめ編

Index

GPT

Generative Pre-Training



Open AI が考案した、Transformer を利用した、自然言語の生成モデル.

GPT-1 / 2018

GPT-2 / 2019

GPT-3 / 2020

GPT-J / 2021

GPT-3 のモデルのひとつ.

Codex / 2021

プログラミング言語ソースコードで、GPT をファインチューニングしたモデル.

事前学習モデルに、GPT-3 を利用.

GPT-3.5 Series / 2021

テキストとコードを組み合わせ学習させたモデル、またはその総称.

code-davinci-002 と呼ばれるモデルが、ベースモデル.

  • A Comprehensive Capability Analysis of GPT-3 and GPT-3.5 Series Models

Instruct GPT / 2022

  • Training language models to follow instructions with human feedback

  • Aligning Language Models to Follow Instructions

Chat GPT / 2023

Instruct GPT の兄弟モデル.

Contrastive Pre Training / CPT / 2022

  • Text and Code Embeddings by Contrastive Pre-Training

SpikeGPT / 2023

SNN を利用.

GPT-4

言語と画像のマルチモーダル大規模言語モデル.

HuggingGPT / 2023

  • HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace

  • 「AI多すぎ、何使えばいいか分からない……」を解決するAI「HuggingGPT」 文章入力だけで、適切な機械学習モデルを自動選択

FrugalGPT / 2023

コスト削減のための改善.

特定のドメインの分野への応用

Finance

BloombergGPT / 2023

金融情報サービス会社「Bloomberg」が金融に強い汎用言語モデルを目標に、 506億パラメータの「BloombergGPT」を5690億トークンで学習した.

金融テキスト(約3630億トークン)と一般テキスト(約3450億トークン)からなるデータセットを作成(合計約7000億トークン)



  • BloombergGPT: A Large Language Model for Finance

他モーダルへの応用

画像

Image GPT

画像の生成.

Mario GPT / 2023

  • MarioGPT: Open-Ended Text2Level Generation through Large Language Models

Seg GPT / 2023

音響

AudioGPT / 2023

  • AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head

マルチモーダル

TagGPT / 2023

  • TagGPT: Large Language Models are Zero-shot Multimodal Taggers

Application / Service

GPT SAN

GraphGPT

nanoGPT

picoGPT

Viper GPT

X-GPT

  • X-GPT: Connecting generalist X-Decoder with GPT-3

Cerebras-GPT

オープンソースで最大130億パラメータの言語モデル「Cerebras-GPT」が発表.

chinchillaのスケーリング則を参考.

7つのサイズがある(パラメータ数: 111M、256M、590M、1.3B、2.7B、6.7B、13B).

オープンなデータセットを用いてスケーリング則を導出.

GPUで実行.



Auto-GPT

Rinna

Multi-modal GPT

評価方法

GPT SCORE / 2023

  • GPTScore: Evaluate as You Desire

GPTEval / 2023

  • GPTEval: NLG Evaluation using GPT-4 with Better Human Alignment

その他

  • How Good Are GPT Models at Machine Translation? A Comprehensive Evaluation

参考

Web サイト

動画