メインコンテンツに移動

テキストや画像を簡単に創り出せてしまう「生成AI(GeneratedAI)」とは?

生成AI

こんにちは。こよなしの雜賀です。

ChatGPTやDALL-Eなど、人間の言語や画像などのデータをもとに新しいコンテンツを自動的に作り出すAIの技術手法が注目されています。今後、様々な分野で活用され、クリエイティブな作品やビジネスに役立つ資料などを生み出すであろう生成AI(GeneratedAI)についてご紹介します。

生成AIとは?

生成AIは、AIを使ってさまざまなテキストや画像を生成することができるサービスです。例えば、小説や詩、エッセイ、レビュー、ニュース記事などの文章や、風景や人物、動物などの画像を作成することが可能です。生成AIは、自然言語処理や画像処理の最先端の技術を用いており、高品質で多様なコンテンツを提供しています。

生成AIの代表的な事例としては、以下のようなものが挙げられます。

  • 小説家や詩人がインスピレーションを得るために、生成AIにジャンルやキーワードを入力してテキストを生成させる。
  • ブロガーやライターが記事のアイデアやタイトルを考えるために、生成AIにトピックや視点を入力してテキストを生成させる。
  • デザイナーやイラストレーターが画像の素材や参考にするために、生成AIにスタイルやテーマを入力して画像を生成させる。
  • 教育者や学習者が教材や問題集を作成するために、生成AIに科目やレベルを入力してテキストや画像を生成させる。

生成AIは人間の創造力を拡張する技術です。今後もさらに進化していく生成AIがもたらす可能性や影響については、これからも要注目でしょう。

生成AIの善し悪し

生成AIは、多くの利用者に恩恵を与えています。その一方で利用にあたって注意を要することもあります。

<得られる恩恵>

  • ユーザーの要望に応じてある程度カスタマイズできるため、オリジナリティや個性を表現できる。
  • 短時間で大量のコンテンツを生成できるため、効率的に作業できる。
  • 人間の感性や知識を反映したコンテンツを生成できるため、自然で魅力的な作品に仕上がる。

<注意点>

  • 著作権や倫理などの法律や規範に違反する可能性がある。
  • ユーザーの入力に依存するため、不適切・不正確なコンテンツを生成する可能性がある。
  • 人間の創造性や感動を奪うという懸念がある。(利用者次第な気もしますが...)

生成AIはAIを使ってコンテンツを生成する革新的なサービスです。しかし、その利用には注意が必要です。生成AIは利用者の補助や参考として取り扱うことが望ましく、利用者自身の責任と判断が重要になるでしょう。

生成AIの肝要 - プロンプトエンジニアリング -

AIに対して特定の目的やタスクを達成するための指示や質問を作成する技術をプロンプトエンジニアリングといいます。AIの能力や限界を理解し、最適なプロンプト(指示や質問)を設計することで、AIのパフォーマンスや効率を向上させることができます。プロンプトエンジニアリングは、AIの応用分野や研究領域において、重要な役割を果たしています。

プロンプトエンジニアリングの利用例として、以下のようなものが挙げられます。

  • テキスト生成
    AIに対して、特定のキーワードや文体、長さなどを指定し、テキストを生成させることができます。例えば、「柴犬についての詩を書いてください。文体は古典的、韻を踏んで、長さは10行以内」というプロンプトを与えると、AIは以下のようなテキストを生成します。

    柴犬は日本の犬
    毛色は赤や黒や白
    忠実で勇敢な性格
    狩りや番犬に向く

    柴犬は小さくても
    力強くて元気
    飼い主に従順で
    愛情深くて優しい

    柴犬は可愛らしい
    しっぽはふさふさして
    耳は立って目はくりくり
    笑顔がとても素敵
     
  • テキスト要約
    AIに対して、長いテキストを短く要約するように指示することができます。例えば、「以下の記事を5文以内で要約」というプロンプトを与えると、AIは以下のようなテキストを生成します。

    記事:
    新しい Bing と Edge – ウェブの副操縦士
    マイクロソフトは、検索、ブラウジング、チャットをひとつにまとめ、ウェブ上のどこからでも呼び出せる統合的体験を実現しました。この体験は以下を実現します:
    より優れた検索: 新しい Bing は、スポーツの試合のスコア、株価、天気などのシンプルな検索に対して、より関連性の高い検索結果を提供し、必要に応じてより包括的な回答を表示するためのサイドバーを新たに備え、使い慣れた検索エクスペリエンスをさらに向上してくれます。
    完全な回答: Bing では、ウェブ上の検索結果を検証し、ユーザーが探している答えを見つけてまとめてくれます。例えば、今作っているケーキの卵を別の材料に置き換える方法を、複数の検索結果やレシピをスクロールすることなく、その場で詳しく教えてもらうことができます。
    新しいチャット体験: より複雑な検索、例えば詳細な旅程の計画や、購入予定のテレビを探している場合に、新しい Bing では新たな対話型チャットを提供します。チャット体験により、探している完全な答えを得るまで、詳細情報、解説、アイデアを繰り返し尋ねることによって検索を絞り込めるようになります。結果にはリンクが含まれているので、意思決定をすぐに行動に移すことができます。
    クリエイティブな触発: 単なる答えだけでなく、インスピレーションが必要なときがあります。新しい Bing はあなたに代わってコンテンツを生成してくれます。メールの下書き、ホテルと飛行機の予約リンクが付いた 5 日間のハワイ旅行の行程表の作成、採用面接の準備、トリビアナイト用のクイズ作成など、さまざまな場面で活用できます。
    Microsoft Edge の新体験: Edge ブラウザをアップデートし、新しい AI 機能と外観を備えて、チャットとコンテンツ作成 という 2 つの新機能を追加しました。Edge Sidebar を使って、長い財務報告書を要約して重要ポイントを把握できます。さらに、チャット機能を使って競合他社の財務との比較を依頼し、自動的に表にすることもできます。また、LinkedIn の投稿などのコンテンツを作成する際に、いくつかのプロンプトを与えて Edge に手伝ってもらうこともできます。作成後、投稿のニュアンス、形式、長さなどを更新する際にも手伝ってもらえます。
    出典:AI を搭載した新たな Microsoft Bing と Edge が検索を再発明 ― ウェブの副操縦士(マイクロソフト,2023)

    要約:
    マイクロソフトは、新しい Bing と Edge を発表しました。新しい Bing は、より優れた検索、完全な回答、新しいチャット体験、クリエイティブな触発を提供します。新しい Edge は、AI 機能と外観をアップデートし、チャットとコンテンツ作成の機能を追加しました。これらの体験は、ウェブ上のどこからでも呼び出せる統合的体験を実現します。
     
  • テキスト分類
    AIに対して、テキストがどのようなカテゴリーに属するかを判定させることができます。例えば、「以下のレビューがポジティブかネガティブか判断」というプロンプトを与えると、AIは以下のようなテキストを生成します。

    レビュー:
    この動画は最高でした!ワンコの表情やBGMも素晴らしくて、思わず笑顔になってしまいました。特に子犬がコロコロするところは堪りませんでした。この動画を見て損はありません。

    判断:
    以下のレビューはポジティブなものです。レビュー者は動画に対して高い評価をしており、感情的な言葉を多く使っています。レビュー者は動画の内容や音楽について具体的に述べており、見る人におすすめする姿勢を示しています。レビュー者は動画を見て楽しんだことが伝わってきます。

以上のように、プロンプトエンジニアリングは、簡単な指示や質問によって様々なタスクをAIに行わせることができます。しかし、登場から時間が経っていないこともあり、どのような文言が最適なのか、どのような順番で指示すれば良いのかといったことは工夫の余地を多分に残しています。

プロンプトエンジニアリング、延いては生成AIを上手く活用できれば、より良いアイデアや作品の創造につながり高い価値を生み出す源泉になるかもしれません。プロンプトエンジニアリングについては引き続き検証してみたいと思います。