Bingで使える無料の画像生成AIを使ってみよう

こんにちは。こよなしの雜賀です。
マイクロソフト社が提供しているAIサービス「Image Creator」は画像生成を無料で楽しめるサービスです。言葉を使って行われる画像生成AIの挙動を検証してみたいと思います!
Bingが提供する画像生成AI「Image Creator」
従来の画像生成AIというと、イラストや写真などの画像を元にして別の画像を生成するものを思い浮かべるかもしれません。しかし、画像生成AIにはテキストから画像を生成するものもあります。その一つとして、OpenAIが開発した「DALL-E」を基にしてマイクロソフト社が提供している「Image Creator」サービスがあります。
「Image Creator」は、自然言語で書かれたテキストから、それに対応する画像を生成するAIシステムです。例えば、「柴犬の顔をしたアボカド」というテキストを入力すると、柴犬の顔をしたアボカドの画像が出力されます。(何とも言えない画像でした…)「Image Creator」は、様々な概念や属性やスタイルを組み合わせて、オリジナルでリアルな画像やアートを作り出すことができます。
基となっている「DALL-E」では、暴力的・性的な表現や政治的な内容などは原則生成されません。さらに「Image Creator」ではセーフサーチを設定することで成人向けの画像や動画を検索結果から除外してくれるため、より安心して利用できるでしょう。
「Image Creator」は無料で作成できるMicrosoftアカウントがあれば誰でも無料で利用できます。
「Image Creator」の挙動を検証してみよう!
「Image Creator」は、絵が描けない人でも一瞬でプロ並みの絵や写真を生成することができます。しかし、生成した画像はあくまでAIの解釈であり、必ずしも正確・適切とは限りません。どのようなテキストを与えればどのような画像が生成されるのか。その挙動を検証してみたいと思います。
検証1. 与える言葉を徐々に具体化する。
与える言葉を最初は「動物」、次に「動物、イラスト」、次に「動物、イラスト、水彩画」と少しずつ具体化した場合の挙動を確認します。

「動物」だけの場合、写実的な表現になりました。何度か作成を繰り返した結果、草食動物が表示されやすいようです。



画風を具体的にすることで雰囲気が大きく変化しています。 単に「イラスト」とすればかわいい感じに、「水彩画」であれば写実的な感じに仕上がるようです。


対象(今回であれば「動物」)の種類を明示してあげれば近しいイメージが得られるようです。


細かな部分への反映も行われます。ただ、指定した色が首輪だけでなく犬本体にも反映されているケースが見受けられます。


場面が指定されれば問題なく追加されるようです。また、動詞である「遊ぶ」が入ったことで、表情が豊かになったり体全体が表示されるといった違いがあるようです。ただ、最後のケースになると「ハスキー」感がなくなっているようです。
与えられる言葉が徐々に増えれば、それに応じて生成されるイメージも具体化されました。ただ、「赤色」が「首輪」でなく「犬」や「花畑」に反映されているケースが見受けられており、読点による言葉の羅列ではAIが正しく意味をくみ取り切れないと想定されます。
検証2. 与える言葉を単語区切りでなく文にする。
なるべく読点で区切らず、文の形で指示した場合の挙動を確認します。



文として表現した方がより想定に近付けるようです。ただ、「水彩画のイラスト」を読点で区切っているfig2-2とfig2-3のうち、fig2-2ではハスキー犬らしからぬ表示も見受けられます。fig2-3のように、特徴を示す文を最後に位置付けることで効果を高める場合もあるようです。読点により文を区切る場合は、文の順序を入れ替えることで調整を試みることも効果的と考えられます。