Hugging FaceでAI画像生成を試してみました

※専門ではありませんので、あくまで素人が試した内容です。間違って理解している部分があるかもしれません。ご了承ください。

AIでの画像作成の精度が向上し、オープンソースとしても公開がされています。

アプリ等も開発、公開されていますが、自分で生成できるようにしたいと思い、最新の技術を試してみたいと思います。

データの利用(Huggingface)

今回はアメリカのHugging Face社のディープラーニング関係のデータについて、オープンソースとしてGitHubにて公開されているので、そちらを利用します。

ページを開き、右上のSign Upで登録をします。

メールアドレス、パスワード、名前等を入力すると確認メールが送られてきますので、URLをクリックし確認が完了します。

次にライブラリを導入します。下記の最新を取得します。

今回はstable-diffusion-v1-4が最新のようですので、こちらをクリックします。

利用についての同意が必要になりますので、同意して進みます。

次に、右上のアカウント(レインボーになっています。)のSettingsを開き、Access TokensにてNew tokenを発行します。

任意の名前と、writeに設定します。

トークンが完成しましたので、コピーしておきます。以上で、Hugging Faceでの作業は終了です。

Google Colabでの設定

次に動作をさせるためのコードを書くため、Google Colabを利用します。

others2/Stable_Diffusion.ipynb at main · cedro3/others2 · GitHub

Contribute to cedro3/others2 development by creating an account on GitHub.

上記GitHubでOpen in Colabをクリックします。

クリックするとGoogle Colabが開きますので、ドライブにコピーをクリックします。

コピーが完了すると、自分のGoogleドライブ内に保存されるようになります。

その後、Hugging Faceのアクセスキーを下記画像右上部分のAccess_Tokenに張り付けます。

セットアップ左上の再生ボタンを押します。

完了すると、画像生成の項目の右側、prompt部分に生成したい画像のテキストを入力します。

テキストはコツがいるそうで、呪文とも呼ばれているそうです。

17 th century flooded colonial village with broken aqueducts, light dust, by peter mohrbacher dan mumford nekro, cgsociety, pixiv, volumetric light, 3 d render

と入力すると17世紀の村の風景がきれいに出てくるとのことで、試したところ以下のようになりました。

参考サイト

こちらのサイトを参考に、試してみました。

【AI画像生成+ラフ清書】Stable Diffusionの使い方【人工知能】 | しぐにゃもブログ

テキストから画像を生成、ラフ画を清書できるAIの使い方解説。もっとも簡単なのはDreamStudioというWEBサービスを使う方法。テキストのコツは画風や画家名を入れる事。自…

終わりに

今回は最新技術を自分で試してみたいと思い、実際に環境を構築しました。

細かい部分はわかりませんが、このような技術は一般に浸透していくのだろうと感じました。

Follow me!