OpenAIの文字起こし「Whisper API」は無料?利用料金・日本語対応は?macでも使える?
【この記事にはPRを含む場合があります】
Whisper APIって何?無料で利用できるの?
『Whisper API(ウィスパーエーピーアイ)』とは、音声認識による文字起こしアプリで、さまざまな言語による会話をテキスト化してくれる便利なツールです。
たとえば、取材や仕事の会議で重要な会話を記録しておきたいとき、Whisper APIを使うと簡単にテキストとして記録してくれるので、業務効率化や時短につながります。便利ですよね!
そこで今回は、Whisper APIの利用料金や日本語対応の有無、macユーザーでも使えるかなどについてお伝えします。
Whisper APIとは?
『Whisper API』とは、Chat GPTを開発したOpenAI社が提供している、AI技術を活用した文字起こしツールです。
このWhisper APIには、最新のAIによる音声認識技術が導入されていて、従来の文字起こしツールよりも正確に音声を記録し、テキストとして出力してくれます。
Windowsはもちろん、Macでも使用することが可能です。
「IT初心者には活用がむずかしい…」という声もありますが、Open AI社ではWhisper APIのポリシーを逐一更新していて、開発者向けのドキュメントが拡充されるなど、開発者に対するサポートに取り組んでいるので、今後企業だけでなく、個人でもさらにAIによる文字起こしが利用しやすくなることが期待されます。
> OpenAI公式「Whisper API」紹介ページはこちら
Whisper APIの利用料金
『Whisper API』の利用料金は、無料ではなく “有料” で、1分あたり0.006ドル。
日本円にして、1分あたり約0.92円、1時間あたり、55.2円かかるイメージです。支払いは、クレジットカードのみ対応となっていて、
なお、GitHubにあるオープンソースを使えば “無料” で利用できるので、少しでもコストを抑えたい人は、GitHub版の利用も検討すると良いでしょう。
Whisper APIは無料ではないけれど安い
有料と聞くと手が出しづらく感じる人もいるかもしれませんが、Whisper APIは文字起こしを1分あたり1円未満でやってくれます。
一般的な日本語対応の文字起こしサービスを利用するとなると、1時間当たりで2,500~3,000円程度かかることが多いので、『Whisper API』は非常にお得なツールだと言えるでしょう。
Whisper APIは日本語に対応してくれる?
多くの日本人ユーザーにとって気がかりなのが、「日本語に対応しているか?」という点です。
『Whisper API』は、ChatGPTなど、ほかのOpenAI社のサービスと同様、日本語に対応しています。
日本語以外でも、英語やドイツ語、フランス語、中国語、イタリア語、タイ語、トルコ語などさまざまな言語の文字起こしが可能です。
日本語のみならず、業務の中で外国語を使う必要がある人にとっても、Whisper APIは役に立つでしょう。
Whisper APIの使い方
『Whisper API』の利用手順は、下記の通りです。
1. まずはWhisper APIアカウントを作成する
はじめに、『Whisper API』のOpenAIアカウントを作成しておく必要があります。
Whisper APIのWebサイトへアクセスして、「Get started」ボタンをクリック。
表示されている必要事項を入力し、アカウントを作成しておきます。
2. APIキーを取得する
つぎに、Whisper APIを利用するにあたって、『APIキー』を取得しておかなければなりません。
『APIキー』は、先に作成したOpenAIアカウントにログインした状態で、OpenAIのAPIキー管理画面にアクセスすることで取得が可能です。
※ ただし、クレジットカードを登録したアカウントしか発行できないので、手順に従いクレジットカードの登録を済ませましょう。
3. APIキーにアクセスする
APIキーの取得後、APIへアクセスします。
アクセスの際にはHTTPリクエストを送信しておきます。
APIのエンドポイントは次のようになります。
またリクエストにあたっては次のようにパラメータを指定しておきましょう。
リクエストメソッド:POST
Content-Type:audio/wav
Authorization:Bearer{APIキー}
リクエストボディに関しては、音声ファイルをバイナリ形式にしておきます。
Whisper APIに期待されること
今後、『Whisper API』が使いやすくなると、さまざまな用途での実用が期待できます。
1. 会議の文字起こし
ビジネスの会議となると1時間以上を要することが多いです。
また著名人のインタビューでも多くの時間をとることがあります。
長い時間に会話の内容を記録するとなると、それなりの労力が伴います。
そうしたときに、Whisper APIを活用すれば必要な会話の記録をすべてAIに任せることができます。
文字起こしに要する分の時間は他の業務に充てられます。
また会議だけではなく、裁判で必要とされる音声データの反訳書面の作成でもWhisper APIの活用は期待されています。
2. メッセージアプリの作成
民間でも自治体でも、音声を利用したやり取りをする際には音声だけではなく、文字による記録も残しておくことは非常に重要です。
Whisper APIを利用することにより、より正確なメッセージング機能が利用できるようになります。
3. 外国語の翻訳作業
企業によっては海外の関係者とのビジネスのやり取りも多くなっています。
多言語が混在しているビジネス会議では、出席者が理解できる言語ごとに原稿を作成しておかなければなりません。
そうしたときにWisper APIがあれば、参考資料としての文字起こしの作成がしやすくなります。
Whisper APIで文字起こしをもっと楽に!
このように、『Whisper API』は、日本語にも対応した、優秀な文字起こしツールです。
プログラミングのコードがあってとっつきにくいと感じる人も多いですが、今後、Chat GPTのように使いやすい仕様に変わればユーザーが増えていくことが予想されます。
ほかの文字起こしツールに比べると、1分で約1円と安価で、さまざまな用途で活用できます。
会議やインタビューなどでの文字起こしにかかる手間をできるだけ省きたい人や、動画の文字起こしをしてほしい人などは、一度導入を検討してみてはいかがでしょうか。