Hugging FaceでAI画像生成を試してみました
※専門ではありませんので、あくまで素人が試した内容です。間違って理解している部分があるかもしれません。ご了承ください。
AIでの画像作成の精度が向上し、オープンソースとしても公開がされています。
アプリ等も開発、公開されていますが、自分で生成できるようにしたいと思い、最新の技術を試してみたいと思います。
データの利用(Huggingface)
今回はアメリカのHugging Face社のディープラーニング関係のデータについて、オープンソースとしてGitHubにて公開されているので、そちらを利用します。
ページを開き、右上のSign Upで登録をします。
メールアドレス、パスワード、名前等を入力すると確認メールが送られてきますので、URLをクリックし確認が完了します。
次にライブラリを導入します。下記の最新を取得します。
今回はstable-diffusion-v1-4が最新のようですので、こちらをクリックします。
利用についての同意が必要になりますので、同意して進みます。
次に、右上のアカウント(レインボーになっています。)のSettingsを開き、Access TokensにてNew tokenを発行します。
任意の名前と、writeに設定します。
トークンが完成しましたので、コピーしておきます。以上で、Hugging Faceでの作業は終了です。
Google Colabでの設定
次に動作をさせるためのコードを書くため、Google Colabを利用します。
上記GitHubでOpen in Colabをクリックします。
クリックするとGoogle Colabが開きますので、ドライブにコピーをクリックします。
コピーが完了すると、自分のGoogleドライブ内に保存されるようになります。
その後、Hugging Faceのアクセスキーを下記画像右上部分のAccess_Tokenに張り付けます。
セットアップ左上の再生ボタンを押します。
完了すると、画像生成の項目の右側、prompt部分に生成したい画像のテキストを入力します。
テキストはコツがいるそうで、呪文とも呼ばれているそうです。
17 th century flooded colonial village with broken aqueducts, light dust, by peter mohrbacher dan mumford nekro, cgsociety, pixiv, volumetric light, 3 d render
と入力すると17世紀の村の風景がきれいに出てくるとのことで、試したところ以下のようになりました。
参考サイト
こちらのサイトを参考に、試してみました。
終わりに
今回は最新技術を自分で試してみたいと思い、実際に環境を構築しました。
細かい部分はわかりませんが、このような技術は一般に浸透していくのだろうと感じました。