第1章: DALL·E 3の基本と利用の手引き
はじめに、私たちのデジタル体験は個人の好みやニーズに合わせてますますカスタマイズされています。その中心には、AI(人工知能)が位置しており、この技術は日々進化しています。この章では、その進化の最前線に立つDALL·E 3というAIに焦点を当てます。ここで、その基本概念から利用のためのガイドラインまでを解説します。
DALL·E 3の紹介
DALL-E 3は、OpenAIが開発した画像生成AI(Image Generative AI)の新たなマイルストーンです。テキストプロンプトを基に画像を創出するこのツールは、前作のDALL-E 2の能力を飛躍的に進化させました。これは、さらに細やかなニュアンスやディテールを捉え、それに応じた画像を生成することが可能になったことを意味します。
本記事に使用されている画像は全てこのDALLE 3によって生成されいます。
DALL·E 3の基礎知識
この先進的なAIの主要な機能は以下の通りです。
- 理解の深さ: DALL-E 3はテキストの微細な意味合いや複雑な要求も理解し、それに応じた画像を生成します。
- プロンプト忠実度: このAIは安定拡散というプロセスを用いて、入力されたプロンプトに極めて忠実な画像を作り出します。
DALL·E 3を使う前に
DALL-E 3を活用するためには、Chat GPT Plusに登録(有料月額課金)する必要があります。サブスクライブすると、GPT-4メニューからDALL-E 3を選択し、自由に画像を生成することが可能となります。
利用規約とガイドライン
DALL-E 3によって生成される画像の著作権は、OpenAIの利用規約やコンテンツポリシーに基づきます。OpenAIは生成された画像に対する著作権を主張しないため、利用者は生成した画像を転載、販売、商品化する自由があります。しかし、その際には商用利用を含め、OpenAIの規約やポリシーに従うことが求められます。また、AIが生成するコンテンツの著作権の帰属に関しては、現行の法律の下ではまだ明確な定義がありません。OpenAIは、作品を共有する際にはAIの関与を明らかにすることを推奨しています。(2022年11月の情報です)
詳しくはOpenAIの利用規約を参照してください。
この章では、DALL-E 3の魅力とその使用に必要な基本情報をご紹介しました。続く章では、実際にDALL-E 3をどのように使用するか、さらに実例を交えながら探っていきます。
第二章:DALL・E 3でイメージ通りの画像を生成するための手順
第二章では、DALL・E 3を使って具体的な画像を生成するプロセスについて詳しく見ていきます。私たちは、描写する内容を決めるところから、最終的な画像が完成するまでの全ステップを案内します。加えて、実践的なプロンプトの例とテクニックも共有しますので、DALL・E 3を使いこなすための一助となることでしょう。
ステップ1: 描写する内容のテキストを考える
最初のステップでは、何を生成したいかを明確にする必要があります。具体性が鍵となり、DALL・E 3は提供されるテキストプロンプトの詳細を基に画像を生成するため、細部にまで注意を払いましょう。それでも、ChatGPTが足りない描写を補ってくれるので、最初の画像生成では少ないワードでの要求で大丈夫です。
ステップ2: 生成された画像の評価と修正項目の決定
DALL・E 3が画像を生成した後、それが求めるイメージと合致するかを評価します。何か修正が必要であれば、プロンプトを微調整して再度画像を生成させます。ここでのポイントは、修正が必要な要素を具体的かつ明確に指定することにあります。
ステップ3: 引用元のプロンプトの提示と修正箇所を入力
修正する部分が明確になったら、その部分のみを変更して新しいプロンプトを生成します。例えば、カヌーの色を変えたい場合は、「夕暮れ時の静かな湖上に浮かぶ赤いカヌー」というように修正を加えます。DALL・E 3はこれらの微妙な変更にも対応できるように設計されています。
実践的なプロンプトの例とテクニック
プロンプトの作成には一定の技術が必要です。例えば、色彩の強調、光の方向、対象の感情的な状態など、画像に含めたい要素を具体的に記述します。以下に、うまくプロンプトを作成するためのいくつかのテクニックを示します。
- 精密さ: 画像の細部まで具体的に記述します。
- バリエーション: 異なるプロンプトで複数のバリエーションを生成してみます。
- 修正: 生成した画像が期待に応えなかった場合、プロンプトを調整します。
- フィードバックの活用: 生成された画像を見て、何が足りないか、何が必要でないかを決定します。
DALL·E 3でイメージ通りの画像を生成する実践例
目標「焼き芋」をDALL·E 3で画像を生成
引用元:焼き芋のイラスト
この実践例では焼き芋をDALL・E3で生成することを目的にします。
焼き芋を練習例として選んだ理由は
- ちょうどよい難易度: 猫や犬など充分に学習されていないため、AIと具体的なイメージを共有しないと意図した通りの画像にならないから。
それでは早速始めてみましょう。
まずは、
ChatGPTにアクセスします。
GPT4を選択して、DALL・E3を選択すれば準備完了です。
ステップ1: 描写する内容のテキストを考える
最初の要求はアバウトで大丈夫です。
焼き芋をメインにしたいので、ここから余計な要素を取り除いていきます。
近づいてきましたが、焼き芋のホクホク感でていないのと、もっと写実的にしたいので、指示を出します。
ステップ2: 生成された画像の評価と修正項目の決定
だいぶイメージに近づいてきました。
この段階から、プロンプトのレビューを始めます。画像をクリックすると、下記のように画像と一緒にプロンプトが表示されます。
コピーボタンを押して、プロンプトをコピーして、Google翻訳先生に解説してもらいます。
プロンプトを確認すると、サツマイモの皮と中身の色が正しく表現されていないことがわかります。
#中身の色がオレンジになっているのは人参のデータを元に生成しているからかな?
ステップ3: 引用元のプロンプトの提示と修正箇所を入力
#すみません、プロンプトを少しいじってます。
プロンプトを引用して、変更要求を伝えます。
その結果、下記のような画像を生成することができました。
ちなみに、もっと良くなるかなと、再生成をやってみた結果出来上がったのがこちら。
生成AIは乱数で動いているので、このように、とんでもない画像を生成することもあります。同じプロンプトでも確実に同じ画像を生成するというわけでもないので注意してください。