【Daily Choppy !】第1136回:Stable Diffusion を使った画像生成サービス DreamStudio β版で遊んでみた ~ そこにAIはあるのか? ~【画像28枚】

Daily Choppy ! アイキャッチ画像2Daily Choppy!

こんにちは。AI大好き、チョッピーです。

Stable Diffusion を使った画像生成サービス DreamStudio β版で遊んでみた ~ そこにAIはあるのか? ~
Stable Diffusion を使った画像生成サービス DreamStudio β版で遊んでみた ~ そこにAIはあるのか? ~

前書き

このところ「Stable Diffusion」というソフトウェアがネットの一部を騒がしている。

商用利用も可能な画像生成AI「Stable Diffusion」無料でリリース。誰でも簡単にテキストから画像を生成できるデモページを公開中
Stability AIは本日,高性能画像生成AI「Stable Diffusion」と,それを使用したサービス「DreamStudio」のβ版をリリースした。Stable Diffusionは,テキストから画像を生成できるAIで,商用利用も可能となっている。公開中のデモページでは,誰でも無料で簡単に画像を生成できる。

上に引用したニュース記事を僕の理解でザックリまとめると以下の通りだ。

文章を入力すると、それに対応した画像を自動的に生成してくれるAI「Stable Diffusion」が誰でも無料で利用できるようになった。また、それを利用したウェブサービス「DreamStudio」のβ版も同時に公開されている。生成した画像は商用利用も可能。来月には音声の生成、将来的には3D画像、ビデオなどの生成も行えるようにすると言う。

チョッピー
チョッピー

うわー! 面白そう! 僕は絵が描けないから、画像が自動的に作れるなら万々歳だぞ! さっそく試してみよう!

そう思って「Stable Diffusion」をダウンロードしようと思ったのだが…どうやらこのソフトウェアを自分のPCで動かすためには「VRAM」なる機器の性能が10GB必要らしい。

チョッピー
チョッピー

「VRAM」だぁ…? なんだか知らないけど、僕もそこそこ使いやすいPCを使ってるから、たぶん大丈夫だろう。でもまぁ、念のために先に性能を調べてみるか…。

そんなわけで自分のPCのVRAMの性能を調べてみたところ…

VRAMの性能は…?
VRAMの性能は…?
チョッピー
チョッピー

んん…? 小さくてよく見えないけど…。

VRAM128MB
VRAM128MB
チョッピー
チョッピー

性能、全く足りてない!

ビックリした。自分のPCの性能がこんなにプアだったなんて。

どうやら僕のPCの100倍くらい性能の良いモノではないと「Stable Diffusion」は動かせないみたいだ。

仕方がないので「DreamStudio」を使ってみる事にした。

DreamStudio

「DreamStudio」は有料のウェブサービス。しかしながら登録時に2.00ポンド分の無料枠が頂ける。

これを活用すれば、ある程度の枚数を生成するまでは無料でサービスを利用できるのだ。

というわけで、今回は僕が「DreamStudio」を使って生成した28枚の画像を、その生成ワード・所感と共に全てご紹介する。

なお、今回、僕が「DreamStudio」に与えた文章は全て DeepL翻訳を使って日本語から英語に変換したモノだ。そのため、英文が不自然になっている可能性もある。僕は英語が苦手だから仕方ない。ご了承ください。

チョッピー
チョッピー

ちなみに厳密には「Stable Diffusion」はVRAMが10GB未満の環境でも動かせないわけではないみたいです。気になる方は各自お調べ願います。

生成画像紹介

実際に僕が生成した順番に画像をご紹介していきます。

かわいい猫ちゃんと女の子

かわいい猫ちゃんと女の子
かわいい猫ちゃんと女の子

生成ワード

On a beautiful beach, an anime-style cute cat commands AI to create illustrations and sentences.

チョッピー
チョッピー

日本語だと「キレイな海岸でアニメ調のカワイイ猫がAIに命令してイラストと文章を作らせている」です。

所感

えぇ…?

出来れば今回の記事のサムネに使えるような画像が欲しくて『ふらとぴ』マスコットキャラクターの「猫のイジーン」がAIに命令してイラストと文章を作らせているような画像をイメージしていたのだけれど…?

なんだこれ…。

「AI」が謎の美少女キャラクターだと認識されちゃったのかな…?

「キレイな海岸」が完全に無視されてるような気もするけど…。

チョッピー
チョッピー

Twitter とかで目にする「AIが作ったキレイな画像」とは雲泥の差のクオリティの画像が生成されてしまいました。

どうやら画像を生成するにもコツがいるようだ。

バタ臭い猫ちゃん

バタ臭い猫ちゃん
バタ臭い猫ちゃん

生成ワード

In cyberspace, a photorealistic cat character is having a humanoid android do the painting and writing.

チョッピー
チョッピー

日本語だと「サイバー空間で、写実的な猫のキャラクターが人型のアンドロイドに絵画と文章を書かせている」です。

所感

うーん…。

1枚目の反省を活かして「AI」じゃなくて「人型のアンドロイド」を指定したんだけど、完全に無視されている…。

「写実的な猫のキャラクターが絵画を描いているイラスト」になっちゃってるなぁ…。

これはこれでアリなのかな…。

星空の下の豚と猫

星空の下の豚と猫
星空の下の豚と猫

生成ワード

A cute cat and a robot look up at the sky under the summer night sky with countless twinkling stars.

チョッピー
チョッピー

日本語だと「無数の星が煌めく夏の夜空の下、可愛らしい猫とロボットが空を見上げている」です。

所感

「無数の星が煌めく夏の夜空」は上手に表現されている気がする。

でも、なぜ「ロボット」が「豚」になるのか。猫も可愛らしくはない。

昔の洋画?

昔の洋画?
昔の洋画?

生成ワード

Sexy beauty in swimsuit and muscular man in swimsuit dancing a waltz together on the beach.

チョッピー
チョッピー

日本語だと「水着のセクシー美女と水着の筋肉ムキムキ男性が海辺で2人でワルツを踊っている」です。

所感

記事のサムネ用画像は諦めて、純粋に面白画像が作れるかどうかを試してみた。

なんだろう、もっとパリピ的なイメージでワードを与えたのだけれど…。

思ったよりも年齢層が高めな人物が描かれてしまった。

でも、「水着の筋肉ムキムキ男性」と「海辺」と「ワルツを踊っている」は上手に生成出来ている気もする。

ただの中華料理

ただの中華料理
ただの中華料理

生成ワード

Delicious hot and spicy Chinese food made with cake.

チョッピー
チョッピー

日本語だと「ケーキで作られた美味しい激辛中華料理」です。

所感

現実世界に存在しない画像を生成したくて意味不明なワードを与えてみた。

結果、普通に世の中に存在していそうな料理画像が生成されてしまった。

「ケーキで作られた」が完全に無視されている…。

あまりに意味不明なワードは無視されてしまうのだろうか?

謎の手紙

謎の手紙
謎の手紙

生成ワード

Flatpeer Editorial Officer.

チョッピー
チョッピー

日本語だと「ふらとぴ編集部」です。

所感

本サイト『ふらとぴ』の編集部を描きたかったのに…。

人間でも部署でもない謎の手紙が生成されてしまいました。なぜだ…。

地獄みたいな

地獄みたいな
地獄みたいな

生成ワード

The Sickness unto Death

チョッピー
チョッピー

日本語だと「死に至る病」です。

所感

怖い!

有名な本の名前を使ったら何が生成されるのかを試してみたところ、恐ろしめの画像が生成された。

書籍名だとは認識されなかったみたいだ。

これがAIがイメージする「死」の映像なのかな…。

本格派サウナ

本格派サウナ
本格派サウナ

生成ワード

A real sauna and many people enjoying it

チョッピー
チョッピー

日本語だと「本格派サウナと、それを楽しむ大勢の人々」です。

所感

「それを楽しむ大勢の人々」はどこに行ってしまったのか。

スタイリッシュアクションゲーム?

スタイリッシュアクションゲーム?
スタイリッシュアクションゲーム?

生成ワード

DEMON SLAYER

チョッピー
チョッピー

日本語だと「鬼滅の刃」です。

所感

なんか別の作品が生成されちゃった。

ただの夏フェス

ただの夏フェス
ただの夏フェス

生成ワード

People who enjoy summer festivals via YouTube streaming

チョッピー
チョッピー

日本語だと「夏フェスを YouTube の配信で楽しむ人々」です。

所感

「YouTube の配信で楽しむ」が無視されている気がする。

長いセンテンスを与えると、要素がガッツリ削られちゃうのかな。

完全にカードゲーム

完全にカードゲーム
完全にカードゲーム

生成ワード

AI-controlled mage

チョッピー
チョッピー

日本語だと「AIを操る魔導士」です。

所感

初心に帰ってサムネ用画像を生成しようとしたら、カードゲームが生成されてしまった。

意図したモノとは全く違うイラストだけれど、カードゲームのイラストだと考えれば、かなりクオリティは高いような気もする。

メリークリスマス

メリークリスマス
メリークリスマス

生成ワード

Christmas Parties and Drugs

チョッピー
チョッピー

日本語だと「クリスマスパーティーと薬物」です。

所感

海外ドラマのワンシーンみたいなイラストが生成されたら嬉しいな…と思っていたのだけれど、ただのクリスマスのイメージイラストみたいになってしまった。

かなりそれっぽい

かなりそれっぽい
かなりそれっぽい

生成ワード

the stillness the voice of a cicada seeping into the crags

チョッピー
チョッピー

日本語だと「閑さや岩にしみ入る蝉の声」です。

※こちらの英訳は国際俳句交流協会の「英語でわかる芭蕉の俳句」のページからの引用です。

所感

文学をベースに画像を生成したらどうなるのか試してみた。

今まで生成した画像の中では、一番、それっぽいのではないだろうか?

AIに与える文章のクオリティが高いと、生成される画像の質も良くなるのだろうか?

中華街のファイナルファイト

中華街のファイナルファイト
中華街のファイナルファイト

生成ワード

Young man and woman in a fistfight in Kabukicho

チョッピー
チョッピー

日本語だと「歌舞伎町で殴り合いの喧嘩をする若い男女」です。

所感

歌舞伎町に見えないんだよな…。

別人だけど、かなりそれっぽい!

別人だけど、かなりそれっぽい!
別人だけど、かなりそれっぽい!

生成ワード

Kenshi Yonezu

チョッピー
チョッピー

日本語だと「米津玄師」です。

所感

有名人の名前を与えてみた。

結果、かなりそれっぽい画像が生成された!

アーティストは世に出ている画像も大量にあるので、AIも学習しやすく、結果、高い再現度になるのかもしれない。

意味不明

意味不明
意味不明

生成ワード

Twitter

チョッピー
チョッピー

日本語だと「Twitter」です。

所感

何をイメージした画像なのかサッパリわからない。

青い鳥とかが描かれていれば、まだ理解できたと思うのだけれど…。

むしろパチモン

むしろパチモン
むしろパチモン

生成ワード

Doraemon

チョッピー
チョッピー

日本語だと「ドラえもん」です。

所感

色はかなり近い。色しか近くないとも言える。

狂気の昔話

狂気の昔話
狂気の昔話

生成ワード

Crayon Shin-chan

チョッピー
チョッピー

日本語だと「クレヨンしんちゃん」です。

所感

全然、意味が分からない。

印象派なのはわかる

印象派なのはわかる
印象派なのはわかる

生成ワード

Monet_ Rap Battle at the Cathedral

チョッピー
チョッピー

日本語だと「モネ 大聖堂でのラップバトル」です。

所感

絶対に存在しない絵画が観てみたくなって作ってみた。

「モネ」から印象派がイメージされたのだと思うけれど、「大聖堂」も「ラップバトル」も無視されてしまって残念。

CDのジャケットっぽい

CDのジャケットっぽい
CDのジャケットっぽい

生成ワード

Ukiyoe Metal Fest

チョッピー
チョッピー

日本語だと「浮世絵 メタルフェス」です。

所感

ヤクザな感じ漂う画像が生成されてしまった。

しかし、この画像はかなり指示通りだし、良い感じなのではないだろうか。

個人的には好き。

実年齢よりかなり上

実年齢よりかなり上
実年齢よりかなり上

生成ワード

Oil Painting, Dancing Kenshi Yonezu

チョッピー
チョッピー

日本語だと「油絵 米津玄師」です。

所感

米津玄師が40代くらいになったら、もしかしたら、こんな感じなのかもしれない。

完全にサル

完全にサル
完全にサル

生成ワード

Impressionist_ Monkey eating exploding curry bread

チョッピー
チョッピー

日本語だと「印象派:爆発するカレーパンを食べるサル」です。

所感

「爆発するカレーパン」ではない気がするけれど、誰がどう見ても「サル」だとわかる画像が生成された。印象派なのかどうかは微妙な気がする。

完全にサルじゃない

完全にサルじゃない
完全にサルじゃない

生成ワード

Cubism_ A monkey eating exploding curry bread

チョッピー
チョッピー

日本語だと「キュビズム:爆発するカレーパンを食べるサル」です。

所感

キュビズムであるのは確かな気がするけれど、サルでもないしカレーパンでもない。

サルは去る

サルは去る
サルは去る

生成ワード

Realism_ A monkey eating exploding curry bread

チョッピー
チョッピー

日本語だと「写実主義:爆発するカレーパンを食べるサル」です。

所感

サルはいなくなってしまった。

西遊記っぽい

西遊記っぽい
西遊記っぽい

生成ワード

Animation_ Monkey eating exploding curry bread

チョッピー
チョッピー

日本語だと「アニメ:爆発するカレーパンを食べるサル」です。

所感

サルシリーズの最後にアニメ調の画像を生成してみたら、妙に憎めない顔つきのサルが生成された。ちなみに「爆発するカレーパン」は一枚も正しく描画されていない気がする。

体がクリーチャー

体がクリーチャー
体がクリーチャー

生成ワード

Hatsune Miku

チョッピー
チョッピー

日本語だと「初音ミク」です。

所感

顔はかなりそれっぽいが、それ以外の部位が完全にクリーチャーである。何故、髪の毛から手が生えているのだろうか。

目を細めてもよくわからない

目を細めてもよくわからない
目を細めてもよくわからない

生成ワード

Obscene images

チョッピー
チョッピー

日本語だと「卑猥な画像」です。

所感

「DreamStudio」は卑猥な画像が出力される際には自動的にぼかしが入るようになっている。

チョッピー
チョッピー

それを回避する方法もあるらしいのですが、僕はやり方を知りません。

というわけで、そのものズバリの「卑猥な画像」でイラストを生成してみた。

結果、なんだかよくわからない画像が生成された。

ぼかしの向こうには目くるめく桃源郷が描写されているのだろうか。どうも、僕にはそうは思えないのだが。

暴力は直視できる

暴力は直視できる
暴力は直視できる

生成ワード

Brutal images

チョッピー
チョッピー

日本語だと「暴力的な画像」です。

所感

「卑猥な画像」にはぼかしが入る。では「暴力的な画像」はどうなのだろうか?

結果は「ぼかしは入らない」だ。

上の画像が暴力的なのかどうなのかについては色々な意見が出てくる気もするが。

今回の締め

以上が僕が「DreamStudio」を使って生成した画像、計28枚だ。

今回、初めて画像生成AIを使ってみたところ、個人的には「使いこなすのはかなり難しいツール」という印象を抱いた。

「狙った画像を生成させるワードチョイス」などに独特のセンスが必要とされそうだ。

おそらくだが、少なくとも現時点において画像生成AIというツールを使いこなすためには「イラスト・デザインなどの知識・技術」と「画像生成AIに対する愛」の両方が必要とされるのではないだろうか。

チョッピー
チョッピー

イラスト・デザインに造詣が深い方がこれらを使いこなせば、ムチャクチャ強力なツールに化ける気もします。そうでない人にとっては完全にじゃじゃ馬ですね。少なくとも今のところは。

とはいえ、今後はスキルセットとして「AIを活用してコンテンツを作れる人」と「そうではない人」に分かれそうな気もする。

「イラスト・デザインなどの知識・技術が無い人」であっても、これらのツールを触ってみる事は、少なくともマイナスにはならないのではなかろうか。

個人的には今後もちょくちょく「DreamStudio」などを使って遊んでみようかな、と思った。

本日もふらとぴにお越し頂きありがとうございます。

調子にのって28枚も画像を生成したので、今回の記事を作るのはムチャクチャ大変でした。記事生成AIの早期の誕生が待たれます。

タイトルとURLをコピーしました