[初回公開] 2023年12月01日
生成型 AI とは ChatGPT に代表される対話するように文章作成やデータ分析を行う人工知能のことだが、指示(プロンプト)で画像生成を行うことも可能で、ブラウザの Microsoft Edge に搭載されている Image Creator を利用してイラストを描いたり、写真撮影したような実写画像を無料で生成する方法を紹介する。
このページの目次
1.生成型 AI とは
生成型 AI とは、人工知能(AI)の一種で、データから新しい情報やコンテンツを生成することができる革新的な技術である。
文書だけでなく、音楽、画像、さらには全く新しいアート形態の創造にまで及んでいる。
特に近年では何もないところから文章作成させたり、文章を与えて要約させるなど作業効率アップを目的に対話型の ChatGPT が注目されている。
ChatGPT へは漠然とした指示でも、返って来た内容を指摘して再度指示させることを繰り返して学習させることで精度の高い回答を行うようになる。
また、プロンプトと呼ばれる生成 AI 用の指示形式があり、対話せずとも適格に指示を与えて回答を得る手段もある。
本記事では、特に画像生成に焦点を当て、その中でも「DALL-E3」と「Microsoft の Image Creator」について紹介する。
2.DALL-E3 とは
DALL-E3 は、ChatGPT を開発している非営利研究機関の OpenAI が画像を作成する生成型 AI として提供しているサービス名である。
ChatGPT が文章による対話で学習するように、DALL-E3 も対話により生成された画像を変更を加えていきながら求める画像に仕上げることができるが、ChatGPT と違い、有料の ChatGPT Plus に加入する必要があり、月額 20 ドル(約 3,000 円)となっている。
DALL-E3 の名称にある末尾の 3 はバージョンを示しており、2023年09月21日にリリースされた DALL シリーズである。
前バージョンの DALL-E2 は2022年04月にリリースされており、DALL-E2 は無料で利用できていた。
画像生成の流れとしてはテキストで説明を与えて、そのコンセプトに合った画像が生成される。
例えば、「青い斑点のあるキツネのようなクジラ」など、抽象的で独創的な要求にも画像生成に応えることが可能になっている。
DALL-E3 はブラウザ等から DALL-E3 の公式サイトにログインして利用するが、ブラウザの Microdoft Edge の機能「Image Creator from Designer」で簡単に利用することができる。
3.Edge の Image Creator とは
ブラウザの Microsoft Edge に搭載されている「Image Creator from Designer」は、生成型 AI を利用した画像を生成する機能である。
数ある生成型 AI の中から、OpenAI が提供している DALL-E3 が利用されている。
DALL-E3 と異なり、指示して 1 度生成された画像を対話側で変更していくことはできず、指示は最初の 1 度だけとなる。
反面、無料で画像生成 AI を利用することができる。
画像生成する際は、Microsoft アカウントが必要となり、Edge が Microsoft アカウントにログインしている状態であれば、ログイン操作を行うことなく Image Creator を呼び出すだけですぐに利用できる。
Image Creator は無料で利用できるが、ブーストと呼ばれる利用回数が設けられている。
ブーストは画像生成するたびに 1 つ消費され、ブーストが無くなると画像が生成されるまでの時間が通常は 10 から 30 秒ほどの待ち時間が約 5 分ほどになる。
ブーストが無くなっても毎日補充されるのと、Microsoft のポイントサービスの「Microsoft Rewards」を消費して回数を増やすことができる。
また、生成された画像は 90 日間保存されるので、その間にダウンロードする必要がある。
4.Edge の Image Creator を使って無料で AI 画像を作成する方法
Edge の Image Creator from Designer で AI 画像を作成する方法としては、Edge を起動して右側のサイドバーからボタン「Image Creator」をクリックする。
ボタン「Image Creator」をクリックすると、下図のようにブラウザ内に画像生成用のウィンドウが表示される。
次にウィンドウ上部にある入力欄に生成したい画像の内容を入れ、入力欄下部のボタン「作成」をクリックする。
作成したい画像の内容は日本語以外にも英語でも対応している。
ボタンを押して画像生成中は「作成中」の文字が表示されるため、画像が出来上がるまで待機する。
画像生成には下図の矢印の箇所が示すブースト回数が 1 つ消費され、数十秒ほどで完成する。
画像の生成が終了するとボタンの下に 4 つの画像が表示される。
4 つの画像をクリックすると画面左部に選択した画像が大きく表示される。
同時にボタン「共有」「保存」「ダウンロード」も表示されるので、操作したい内容を選択する。
「共有」では SNS などに画像と一緒に投稿することができ、「保存」は後から Image Creator を呼び出して画像を生成せずとも利用することができるため、ブーストの節約になる。
「ダウンロード」はパソコン内に JPEG 画像として保存することができる。
作成した画像は 90 日経過すると削除されてしまうため、後から利用する場合は「保存」を選択するとよい。
また、同じ指示で画像生成しても常に AI の解釈が異なり、毎回同じ画像にならないので生成後はダウンロードするなど都度、保存しておくほうがよい。
5.Image Creator の指示(プロンプト)の例と結果
Image Creator で画像生成する場合は DALL-E3 のように対話型で修正しながら画像を作り上げることができないため、最初の指示でどれだけ求める画像となるように具体的に情報を伝えるかが重要になる。
主に次の内容の構成で Image Creator に指示与えると思い描く画像に近くなる。
- 被写体の情報(性別や動物、建物の形状など)
- 被写体の状態(時間帯や場所など)
- 生成する画像のスタイル(イラストや写真撮影など)
上記を踏まえて下図は Image Creator に「20 代の丸顔の黒髪の日本人女性がスマホでイヤホンを使って音楽を聴いている。昼間のリビング。写真撮影」と指示した結果である。
被写体の状態に加えて、背景を指示することで実際にモデルを使った写真撮影したような画像を生成することができる。
指示はさらに着ている服装や、ポーズも与えることができる。
また、Image Creator は日本語で画像生成することができるが、英語で指示するとより的確に認識しやすい傾向がある。
望んだ構図やポーズを Image Creator で作成する場合の指示(プロンプト)の例と結果が次の通りである。
5-1.実物人物と架空の背景を組み合わせた例
実物人物と架空の背景を組み合わせた指示と結果の例が下図である。
指示(プロンプト): カジュアルな服を着た黒髪で長髪の20代丸顔の日本人女性が腕組みをして右斜め上を見て考え事をしている。女性の右斜め上には考え事の吹き出しが出ている。背景色は薄い黄緑。写真撮影。
人物が向く方法を指定してもその通りにならないことがあるが、概ね指示通りの画像が生成されている。
「吹き出し」のデザインが複数できているので、厳密に指示することで精度が上がると思われる。
5-2.実物人物に特定のポーズを取らせた例
実物人物に特定のポーズを取らせた指示と結果の例が下図である。
指示(プロンプト): カジュアルな服を着た黒髪で長髪の20代丸顔の日本人女性が指をL字型にして手で四角形を作ってカメラの構図を決めている。左手の親指と右手の人差し指、左手の人差し指と右手の親指がくっついている。こちらは女性と真正面で向かい合っている。背景色は薄いピンク色。写真撮影。
手の形を指定してもその通りにならない画像もあるが、背景や人物の特徴は差異無く画像生成が行われている。
5-3.実在するロゴを取り入れた例
実在するロゴを取り入れた指示と結果の例が下図である。
指示(プロンプト): 20代の黒髪の日本人女性がノートパソコンでインターネットでgoogleを表示している。女性の顔はパソコンの方を向いており、自分は女性とパソコンの横から見ている。昼間のリビング。写真撮影
実在するロゴとして今回は Google を指定し、その通りのロゴが入った画像が生成されている。
時間帯や場所の指定もほぼ指示通りの画像となっている。
5-4.時間と場所を指定した例
時間と場所を指定した指示と結果の例が下図である。
指示(プロンプト): 30代の丸顔の茶色の髪の日本人女性がノートパソコンでpowerpointで資料を作成している。女性の顔はパソコンの方を向いており、自分は女性とパソコンの横から見ている。夕方のオフィス。写真撮影
「夕方」と時間指定したので背景も全体的に暗くなり、場所の指示も望み通りの画像が生成されている。
ただ、左下のようにパソコンのディスプレイの位置がおかしく、稀に現実的でない画像が生成されることもある。
概ね指示(プロンプト)で詳しく被写体やその周辺の様子を指示(プロンプト)として与えることで希望する画像に近づけることが可能である。
ただし、生成により腕や指が多くなるなど現実的でない画像も生成されることがあるので、生成した画像を利用する場合は不自然な点がないか確認してから利用するとよい。
関連記事
Microsoft Edge のサイドバーを非表示/表示する方法
ウェブサイトを閲覧するブラウザ「Microsoft Edge」は検索や生成 AI が通常機能として搭載され、サイドバーから利用できるようになったがサイトを大きく表示できなくなったり、機能を利用しない人にとっては不要なので、この…
Windows 起動直後に CPU が 100% になる MRT.exe の正体と対応策
Windows を起動した直後にマウスカーソルがフリーズしたりソフトウェアが表示されないなど動作が重くなる原因の 1 つに MRT.exe が影響していることがあり、CPU の利用率が 100% となり操作に大きな支障が出るため MRT.exe…
Jword などアンインストールしてもブラウザで右クリックして表示される項目を削除する方法
Windows は右クリックするとソフトウェアごとにショートカットや操作項目のメニューが表示されるが、Internet Explorer(IE)などウェブブラウザで右クリックすると E START(Jword)などいつの間にか使わない不要な項目…