gpt-3 apiの使い方は?利用料金や日本語対応はできる?(OpenAI API)
【この記事にはPRを含む場合があります】
・利用するときは無料で使えるの?それとも有料?日本語対応は可能?
『gpt-3』とは、とは、イーロン・マスク氏が出資したことでも話題となった、OpenAI社の最新深層学習の手法を用いたクラウドサービス『OpenAI API』の言語モデルの1つです。
gpt-3の学習モデルについて、システムの完全な詳細は公開されていないので、「どうやって使えばいいのかわからない」と悩んでいる人もいるのではないでしょうか。
そこで今回は、gpt-3の簡単なプログラム例を交えながら、利用料金や日本語対応しているかどうかについて解説していきます。
- gpt-3とは
- gpt-3の4つのスゴさ
- gpt-3のスゴさ① 機械に学習させたパラメータ数の多さ
- gpt-3のスゴさ その② データ処理のさらなる高速化
- gpt-3のスゴさ その③ 公開されたプログラムは誰でも利用可能
- gpt-3のスゴさ その④ 人が書くものと遜色ない記事の生成
- gpt-3を使用するための準備(OpenAIのアカウントを作成)
- gpt-3のengine(エンジン/主要モデル)は4種類
- apiの重要な3つの概念
- gpt-3を使用して文章生成にチャレンジ
- gpt-3を利用するには有料利用(3か月間は18ドル無料クレジット枠が付与)
- gpt-3 apiは日本語に対応してる?
- gpt-3 apiの活用方法
- gpt-3 apiを使って斬新なアイデアを生み出そう!
gpt-3とは
gpt-3(ジーピーティースリー/Generative Pretrained Transformer)とは、OpenAIが開発している言語モデルの最新版で、AIを使った文章や画像の自動生成サービスの1つです。
「3」は3代目のモデルという意味で、gpt-3は2020年6月に発表されました。
ネット上にある膨大なテキストから得た知識をデータとして蓄積していき、事前学習による訓練を行うことで、前の単語に続く次の言葉が何であるかを数パターン予測、提案できるのがgptの仕組みです。
たとえば、下記の図のように「今日」という単語に続く助詞(「も」「は」「こそ」など)をいくつか推測し、文章をすらすらと書き出していくことができるのです。
“蓄積されたデータをもとに瞬時に単語の分析・処理を行う” ことで、人間が書いた文章と見分けがつかないほど、高品質で自然な文章を生成します。
このように、gptはとても高度な技術で便利なものではありますが、注意しなければいけない点も存在します。
それは、フェイクニュースの作成やヘイトスピーチなどへの悪用です。
gptを正しく使うためのガイドラインが定められていますので、しっかりと確認してから利用しましょう。
また、システムなどサービスとして開発・利用するためには、OpenAIの承認が必要です。忘れずに承認申請するようにしてください。
gpt-3の4つのスゴさ
gpt-3のなにがそんなにスゴいのか、4つの視点から見ていきます。
gpt-3のスゴさ① 機械に学習させたパラメータ数の多さ
“gpt-3のスゴいところ” として、まずは、機械に学習させたパラメータ数の多さがあげられます。
その数はなんと、“1750億個” !
パラメータとは、機械が文章の予測モデルを作る時に必要な数値(変数)のことで、パラメータ数が多いほど高い精度で文章を作ることができると言われています。
gpt-2までの言語モデルでは、”ファインチューニング(再学習)” を行うことで、文章生成における確率の精度を高めてきましたが、ファインチューニングには「例題と答えのデータ」を準備し、専門用語を学ばせるなど、膨大な時間と労力がかかります。
これに対し、gpt-3ではネット上にある「45TB」という莫大なテキストデータからの自然学習を実現させたため、ファインチューニングの必要がなくなり、利便性も格段にアップ!精度も使い勝手も良くなったのです。
gpt-3のスゴさ その② データ処理のさらなる高速化
“gpt-3のスゴいところ” 2つ目は、データ処理のさらなる高速化です。
gpt-2までのアルゴリズムでは、データを時系列で処理していましたが、gpt-3では並列処理が可能となりました。
時系列処理と並列処理では、スピードに雲泥の差があります。
ただし、処理するデータが莫大になったことで通常のパソコンでは開発が追いつかず、世界最速レベルのスーパーコンピュータを必要とします。米マイクロソフト社がOpenAIへ出資し強力なサポート体制を取ったことで、スムーズな開発ができるようになったのだとか。
gpt-3のスゴさ その③ 公開されたプログラムは誰でも利用可能
“gpt-3のスゴいところ” 3つ目は、公開されたプログラムは、誰でも自由に利用可能という点です。
gpt-3を使用して開発したapi(プログラム)は、申請することで公開できるようになります。
これはうれしいポイントですよね!
gpt-3のスゴさ その④ 人が書くものと遜色ない記事の生成
“gpt-3のスゴいところ” さいごの4つ目は、人が書くものと遜色ない自然で流暢な記事を書くことができるという点です。
書きたい文章のヒントを与えてあげるだけで、あっという間に記事を書き上げてしまいます。
人であれば1時間ほどかかる記事でも、gpt-3なら10分程度で生成可能です。
gpt-3を使用するための準備(OpenAIのアカウントを作成)
ここからは、gpt-3を使用するために必要な準備、「アカウントの作成方法」について解説していきます。
(出典:OpenAI社)
gpt-3を使用するためには、まず “OpenAIのアカウントを作成” しましょう。
難しいことは何もなく、メールアドレスとパスワードを設定するだけで簡単に登録できます。
OpenAIのサイトへアクセスして、アカウントを作成してみましょう。
<OpenAI 利用開始のステップ>
① OpenAI社のアカウント作成ページにアクセス。(https://openai.com/product)
② アカウントを作成する。(メールアドレス・パスワードを入力する)
アクセスしたら、「Get started」というボタンをクリックします。
下記画面に遷移するので、登録したいメールアドレスとパスワードを入力してください。
これでアカウント作成は完了です。
アカウントの作成ができたら、さっそくログインしてみましょう。
ログインすると、つぎのような画面に切り替わります。右上にある「Personal」をクリックし、「View API keys」を選択してください。
画面が切り替わり、「秘密キー(API Key)」の作成画面になります。
「Create new secret key」をクリックすると「秘密キー(API Key)」が生成されるので、このAPI Keyをコピーしましょう。
緑のリンクボタンをクリックすると簡単にコピーすることができますよ。
このAPI Keyは、のちほど文章生成の作成例で使用しますので、メモ帳やエクセルなどテキストファイルに貼り付けて保存しておいてください。
gpt-3のengine(エンジン/主要モデル)は4種類
gpt-3の活用方法をお伝えする前に、gpt-3のengine(エンジン/主要モデル)について解説します。
gpt-3で選択できる主要モデルは、下記4種類です。それぞれ特徴が異なるため、使用用途に合わせて最適なものを選択しましょう。
●Davinci
デフォルトでおすすめされているエンジン。最も使いやすく安定した動作で、複雑な文章生成などに向いている。しかし、他のエンジンと比べると速さでは劣る。
●Curie
非常に速い。より複雑な文章についてはDavinciの方が向いているが、Curieはセンチメント分析や翻訳などに向いている。センチメント分析とは、Web上に存在する口コミやブログの書き込み、SNSの投稿といったテキスト情報から個人が抱いている感情を分析する手法。
●Babbage
簡単なテキスト分類に向いている。
●Ada
一番速いモデル。テキストの解析、アドレス修正など単純な分類などに向いている。
apiの重要な3つの概念
apiの中核となる概念は、「プロンプト」「コンプレッション」「トークン」の3つです。
・プロンプト:apiへの入力テキスト
・コンプレッション:apiがプロンプトに基づいて生成する回答テキスト
・トークン:単語の文字列(デフォルトは2,048トークン)
gpt-3を使用して文章生成にチャレンジ
では、ここからは、実際にgpt-3を使って、文章生成にチャレンジしてみましょう。
使用言語やプログラムのインストール方法など、実際の使用方法を簡単にまとめてみましたので、参考にしてみてください。
使用言語はPython
ここでは、Pythonという言語を使ったgpt-3 apiの使い方を見ていきます。
「openai-python」をインストールすることで、OpenAI APIへのアクセスが可能となります。
gpt-3の深層学習モデル自体は、まだ公開されていません。
そのため、利用するには米マイクロソフト社のクラウドサービスからAPI経由でアクセスする必要があります。
まずは、自分のパソコンにPythonとVisual Studio Code(テキストディタ)をインストールし、開発環境を用意しましょう。
ライブラリをインストール
先ほどお伝えした通り、OpenAI APIを利用するには、ライブラリのインストールが必要です。
今回はAnaconda Promptなどからpipを経由してインストールを行います。
Anacondaは、日本語を含むフォルダにはインストールできません。
インストールの際は、ローカルディスク(C:)直下に「anaconda3」というフォルダを作成し、そこへインストールしてください。
インストールが完了したら、コマンドプロンプトを起動します。
パソコンの右下にあるWindowsマークを立ち上げ、検索バーに「cmd」と入力すると、コマンドプロンプトを起動できます。
コマンドプロンプトが起動したら、下記のPIPコマンドを入力し、実行(Enterキー)してみましょう。OpenAIと呼ばれるライブラリをインストールできます。
ライブラリをインストールしたら、Pythonを起動させるため「python」と入力し、実行。
続いて、以下のモジュールをインポートします。
import openai
モジュールのインポートができたら、最後にAPI keyの設定をしておきましょう。
API keyとは、先ほどOpenAI社のサイトで生成し、メモ帳などに保存しておいたものです。ログインしたあと右上の「Personal」から「View API keys」をクリックすることでも確認できます。
これで、事前準備は完了です。
gpt-3での文章生成方法(活用例)
gpt-3では、文章生成の際、apiに対してテキストで質問します。
“質問にヒントを付けくわえる” ことで、より回答の情報量や精度は増していきます。
求めている回答に近づけさせるには、たくさんヒントをあげるとよいでしょう。
このときの質問やヒントのことを『プロンプト』と呼びます。
プロンプトへの入力は、単語でも文章でもなんでもOKです。
今回は、英語での簡単な挨拶のやり取りをしてみようと思うので、プロンプトには「’Hi! How are you today?’」と入力しました。
プロンプトを決めたら、openai.Completion.create()メソッドを使い、回答の文章が生成できるように、いくつかパラメータ(変数)を設定していきます。
<コードは以下の通り>
問いかけたあと、api側に答えを求めてみました。
すると、「元気です、ありがとう!君はどう?」という返事が返ってきました!
AIと会話することができましたね。
gpt-3を利用するには有料利用(3か月間は18ドル無料クレジット枠が付与)
OpenAIのapiを利用する場合、料金がかかります。
なぜなら、OpenAIが提供している有料のapi経由で利用する必要があるからです。
サブスクのような定額制ではなく、使用量に応じた従量課金制です。
ただし、登録してから3か月間は18ドル分無料でお試しが可能なので、気になる方はその期間に資料作成やブログの執筆など、いろいろと試してみるとよいでしょう。
また、OpenAIには支払い上限を設定できる仕組みも備わっており、上限に達するとapiの利用ができなくなるため、使いすぎるのが心配な方は上限額を設定しておきましょう。
OpenAIでは、下記5つのサービスが利用可能です。
- Text Completion(文章生成)
- Code Completion(コード生成)
- Image Generation(画像生成)
- Fine-tuning(モデル学習)
- Embedding(数字変換)
文章生成の利用料金
OpenAIによる文章生成のapiでは、入力と出力のテキスト量に応じた料金体系となっています。
選択できるモデルは下記4種類で、それぞれのモデルによって課金される価格が異なります。
・Davinci:0.0200ドル/1000トークン(1K)
・Curie:0.0020ドル/1000トークン(1K)
・Babbage:0.0005ドル/1000トークン(1K)
・Ada:0.0004ドル/1000トークン(1K)
トークンとは文字数ではなく、「1単語」のこと。
英語の場合、1単語を1トークン、カンマ(,)やピリオド(.)、クエスチョンマーク(?)も1トークンとして扱うため分かりやすいのですが、日本語の場合、漢字などもあるため数え方がとても複雑です。
例)What is your hobby ? ⇒ 5トークン
あなたの趣味は何? ⇒ ※日本語の場合だとトークンはいくつになるんだろう?
入力したテキストがどれぐらいのトークン数になるのか事前に確認したい場合は、OpenAIのPlaygroundで確認できます。
OpenAIのgpt-3のベータプログラムに参加すると、誰でもこの「Playground」にアクセスできるようになり、とても便利です。
もうひとつ注意したい点は、課金対象は入力プロンプトのトークンだけでなく、答えとなる応答文のトークンも含まれるということです。
<モデルによる料金比較>
・Davinciの場合:12ドル(約1,740円)
・Curieの場合:1.28ドル(約174円)
・Babbageの場合:0.32ドル(約43円)
・Adaの場合:0.25ドル(約34円)※2023年3月8日時点
最高額のDavinciと最安値のAdaでは約50倍もの差があります。
使い方によっては想定外の出費になってしまう可能性があるため、自分の使用目的を明確にしてから利用モデルを検討するようにしましょう。
画像生成の利用料金
つぎに、画像生成におけるapiの利用料金について解説します。
画像生成の場合、生成する画像のサイズによって料金が変わってきます。
生成できるサイズは、下記の通りです。
<料金比較>
・512×512ピクセル:0.018ドル/1枚
・256×256ピクセル:0.016ドル/1枚
使用例としては、SNSなどの自身のアカウントに設定するプロフィール画像です。
Twitterは400×400ピクセル、Instagramは320×320ピクセルなので、512×512ピクセルで作成すれば十分でしょう。
gpt-3 apiは日本語に対応してる?
この記事を読んでくださっているみなさんの懸念点のひとつに、「gpt-3 apiは日本語に対応しているの?」という疑問もあるのではないかと思います。
結論からいうと、完璧ではないものの日本語にも対応しており、今話題の『ChatGPT(チャットジーピーティー)』は、日本語でも使用可能です。
これから先は、apiでも日本語対応がどんどん進んでいくのではないでしょうか。
gpt-3 apiの活用方法
gpt-3 apiの活用方法は、多岐に渡ります。
こちらをご覧ください。gpt-3 apiを使った活用例です。
<gpt-3 api 活用方法例>
・記事の作成
・ブログ記事の執筆
・小説の執筆・要約
・料理レシピ紹介
・商品紹介
・商品レビュー
・お店や商品のレビューの返答
・メルマガの作成
・デザイン
・プログラミングコード
・プレゼン資料の作成
・曲に合わせて歌詞を書く
・ゲームのストーリー内の会話を対話形式に
・掲示板のお悩み相談に回答
・画像生成 など
ざっと思いつくだけでも、これだけの活用方法があげられます。
gpt-3の一番の強みは、簡単な指示を与えるだけで、自動的に新たなテキスト文章や画像を生み出してくれるところ。
短いキャッチコピーから長いブログ記事など、対応範囲がかなり幅広いのが特徴です。
また、先述したとおり、文章だけでなく画像を自動生成するAIモデルにも応用されているため、簡単なテキストによる指示をするだけで、クリエイティブ画像の生成までしてくれます。
テキスト記述から画像を生成する人工プログラムの1つに「DALL-E 2」があります。
さっそく使ってみたところ、とてもクオリティの高い画像が生成されました。
「文章」と「単語の羅列」2パターンで試してみました。それぞれ与えたテキストはこちらです。
上記画像:「Please draw a yellow hamster sitting on a chair on the beach with colored pencils.」(砂浜の上で椅子に座る黄色のハムスターを色鉛筆で描いてください)
上記画像:「light blue elephant blowing a trumpet moon photo」(水色の象 トランペットを吹く 月 写真)
どちらの画像も、テキストを入力して10秒程度で完成しました。スゴいですよね!
gpt-3 apiを使って斬新なアイデアを生み出そう!
gpt-3 apiは、とても便利で高性能、かつ活用方法によっては作業効率のアップや想像力に富んだ画像作成ができるなど、使用用途は無限に広がっています。
ぜひgpt-3 apiを使って、いろいろな面白い体験をかさねて、斬新なアイデアを生み出してみてくださいね。