GPT4に目と耳がついた!?と話題のGPT-4oとは

近年、注目されている生成AI(ジェネレーティブAI)業界ですが、GPT-4がパワーアップした「GPT-4o(ジーピーティーフォーオムニ、以下『GPT-4o』)」が2024年にリリースされ、音声・画像・動画・テキストが組み合わさった入力内容に対してよりスムーズな反応が可能となりました。
数多くのモデルが発表され、ますます盛り上がりを見せる生成AIですが、今回はGPT-4との相違点や他社LLM(Large language Models:大規模言語モデル)との比較、業務での活用事例について説明します。
GPT-4oの概要
GPT-4oのoは「omni(すべての)」という意味でありLLMの一つです。LLMとは膨大なデータを元にディープラーニングを行ったモデルのことであり、GPT-4oは従来のChatGPT-4(以下、『GPT-4』)よりも以下の点がアップグレードされています。
音声による入力内容をより高精度に解析できるようになりました。今回のアップデートで、話者が複数いても解析でき、ノイズは認識せずに会話のみを解析することが可能となりました。
音声モードを用いた際、GPT-4では5.4秒の平均回答速度でタイムラグがありましたが、GPT-4oでは平均320ミリ秒の回答速度と非常にスピーディになりました。このように会話にタイムラグがほとんどないため、通話などのリアルタイムな音声チャットにも活用しやすくなりました。
GPT-4oでは従来のモデルでは不可能であった音声・画像・動画・テキストがミックスされた入力内容を解析することができるようになり、出力もそれらをミックスして返せるようになりました。
1分間で一度に送信できるメッセージの量も、GPT-4の5倍に増加しました。
API利用料は、GPT-4は1Mトークンの入力につき30ドル、1Mトークンの出力につき69ドルでしたが、GPT-4oでは1Mトークンの入力につき5ドル、1Mトークンの出力につき15ドルとなっております。このようによりローコストで利用できるようになったため、システムの導入がスモールにスタート可能となりました。
従来のモデルよりもセキュリティがアップデートされたため、よりプライバシーに配慮した利用ができるようになりました。
このように、ChatGPTは日進月歩でどんどん利用しやすく変化しているため、面倒な作業はChatGPTに任せて、人間は別の業務に注力できるようになっています。生成AIに対する出力の命令を「プロンプト」と言い、プロンプトを入力することで生成AIの出力を促す「プロンプトエンジニア」という職業も注目され始めています。しかし、生成AIで多くのことができるようになった一方で、出力された内容が正しいかのファクトチェックをする作業には専門家の手が必要であり、知識の深いプロの持つスキルの価値は未だ崩れていないと言えます。
生成AI戦国時代突入!?各社生成AIを比較
生成AIの筆頭となるChatGPTの登場から約1年半で多種多様な生成AIが発表され、今の時代は「生成AI戦国時代」とも表現でき、各社での競争が激化しています。
生成AIは、テキスト生成AI・画像生成AI・動画生成AI・音声生成AIなどが挙げられますが、その中でも代表的なサービス4社を比較すると、以下の相違点が浮き上がってきます。
Chat GPT
生成AIの中で最もメジャーと言えるサービスです。非営利法人OpenAI,Inc(OpenAI社)がリリースし、社会に大きな影響を与えました。ChatGPT-3.5まではテキストのみの入力が可能でしたが、GPT-4では音声や画像での入力が可能であり、マルチモーダルなプラットフォームとなっています。プログラミングの補助やコンテンツの生成、チャットサービスへの組み込みなどに用いられます。GPT-4は、4種類の料金形態があり、個人から大企業まで、あらゆる層の人々に使いやすいサービスとなっています。
Gemini
Google LLC(Google社)が開発したモデルであり、ChatGPTと類似したUIが特徴です。開発元がGoogle社であるため、Google拡張機能を利用することでGoogleマップやYouTube、Gmailと連動した作業をすることができます。テキストのほかに音声、画像、動画を入力することができ、出力はテキストと画像で行えます。また、一度の入力で3つの出力が提示されることも大きな特徴です。
Googleアカウントを持てば無料登録によって回数制限なしで利用できますが、有料プランの「Gemini Advanced」を契約すればより豊富な機能が利用できます。
Copilot for Microsoft 365(旧Bing AI)
日本マイクロソフト株式会社(マイクロソフト社)が発表した生成AIツールです。Copilotサブスクリプションを購入し、MIcrosoftアカウントにサインインすることで利用可能です。WordやExcel、PowerPoint、Outlookなどのマイクロソフト社が提供するサービスにシームレスに取り入れることができ、スライドの自動作成やメールの文面の生成などに使えます。また、マイクロソフト社が発表したソースコードエディタのVisual Studio Codeとも連携が可能であり、コーディングの補助として非常に有用です。
Claude3
Claude3は、Anthropic社によって作られたモデルです。Anthropic社は、元OpenAI社のリサーチャーやエンジニアを中心に設立されています。Claude3は画像内のテキスト認識、物体検出、シーン解析などが可能です。PDFなどの長文レポートを要約することや、コーディング能力に長けているのも特徴です。
GPT-4oはどんな場面で活躍するのか、活用事例について説明
このように数多くの生成AIがリリースされている中でも、先駆者と言えるChatGPTでは下記のような業務で活用することができます。
LINEチャットボットの作成
LINEチャットボットにGPT-4oを利用することで、顧客への自動返信がより高性能に行えます。開発の際は、LINE DeveloperアカウントとOpenAIアカウント、OpenAIのAPIが必要です。
リアルタイム検索
GPT-4までは、モデルが学習しているデータは2023年4月のものであったため、最新の情報に基づく出力はできませんでした。しかし、GPT-4oはChatGPT自身とBing(WEB検索エンジン)の情報を元に出力できるため、最新の情報とその出典を両方提示することができ、フリーランスとして生き残るための戦略を立てるための情報が気軽に入手できます。
商品検索
GPT-4oではアップデートされた画像検索機能と、前述したリアルタイム検索機能を両方使えるので、最新の情報に基づく、より正確な商品検索ができます。たとえばSNSで話題になっている最新の商品について調査するなどのマーケティング作業が捗ります。
経理作業
GPT-4oでは高度な画像解析ができるので、写真やPDFの画像を読み取って、請求書や領収書の仕訳などの経理作業がより手軽に可能です。そのため、スタッフを雇っていないフリーランスとしては確定申告などの業務が簡略化できます。
ExcelやGoogleスプレッドシートから図表を作成
今までは人力で行っていた、ExcelやGoogleスプレッドシートから作成した図表を元に行っていたレポーティング業務をGPT-4oで簡単に処理することができ、普段のマーケティング業務が効率的になります。
手書きの図表から画面レイアウトを作成
顧客との対面での打ち合わせの際に、要件を整理するためにざっと手書きでシステムの外観を描くこともあるでしょう。その際に、手書きで起こした図表を読み取って、GPT-4oを通して画面レイアウトに落とし込むことができます。
最新技術をキャッチアップしたいならギークスジョブへ
今回はGPT-4からGPT-4oへのアップデート内容や他社の生成AIとの違い、活用事例について解説しました。
前述した「プロンプトエンジニア」のように、単純にコードを書くだけやデザインを描くだけでは生成AIに業務が取って代わられる時代が到来しつつあり、生成AIを活用してよりクリエイティブなアウトプットが出せるかが重要なスキルとなります。
ギークスジョブでは仕事探しはもちろんのこと、ITフリーランスのライフプランの計画やキャリア形成、技術についてのサポートを強みとしています。
ITフリーランスになりたいという方、ITフリーランスでよりご自分にフィットした案件を探されている方はぜひ一度ご登録ください。
▽ 無料登録(エントリー)はこちら
https://geechs-job.com/entry
まだフリーランスになることに迷いがある方へは、独立のご相談から承ります。これまでのご経歴やキャリアの目標をお伺いしながら、お一人おひとりに寄り添ったキャリアプランのご提案をいたします。
▽ 独立相談会への無料エントリーはこちら
東京:https://geechs-job.com/event/details/1
大阪:https://geechs-job.com/event/details/2
福岡:https://geechs-job.com/event/details/3
名古屋:https://geechs-job.com/event/details/189
その他のおすすめ記事

動画生成AI「Sora」はITの現場にどう活かせる?|ITフリーランスをサポートするギークスジョブ
ITフリーランスの方のための『お役立ち情報』をご紹介しています。この情報のテーマは動画生成AI「Sora」はITの現場にどう活かせる?です。geechs job(ギークスジョブ)では、「フリーに生きる」ためのノウハウをご紹介し、ご希望のキャリアやライフプランを実現できるように、サポート致します!
ITフリーランスの案件探しならgeechs job
IT業界・企業情報の専門知識を持ったコーディネーターが、あなたに合う案件をご紹介。
ITエンジニアとしてのキャリアに弾みを付けませんか?
- ・独立して新しいキャリアを築きたい
- ・スキルを磨いて、更なる高みを目指したい
- ・今よりも高い報酬を
ITフリーランスエージェントのgeechs jobが、あなたの未来に向けて伴走します。