lynx   »   [go: up one dir, main page]

タグ

StableDiffusionに関するsugyanのブックマーク (5)

  • Stable Diffusion API を使って塗り絵 自動生成アプリを作る

    Stable Diffusion は、GPU を利用した画像生成 AI の中でも最も有名なプロダクトだと思います。Stable Diffusion の利用者は一般的にまず GPU を準備し、そこで環境を構築してから画像生成を行うのですが、今回は Stability AI(Stable Diffusion の開発元)の用意している API を利用して、塗り絵の自動生成を作ってみました。 塗り絵 自動生成: https://color-painting.vercel.app/ 子どもたちのために、塗り絵を自動生成するサービスです。この記事では、どのようにこのアプリを作ったのか簡単に紹介しております。コードは全て JavaScript です。 ソースコードも github で公開しています。Stability AI Developer Platform, Vercel, Google reCAP

  • 世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説! - Qiita

    追記: U-Netの中間層は常にSelf-Attentionとなります。ご指摘いただきました。ありがとうございます。(コード) オミータです。ツイッターで人工知能のことや他媒体の記事など を紹介しています。 @omiita_atiimoもご覧ください! 世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説! 未来都市にたたずむサンタクロース(Stable Diffusionで生成) 2022年8月、世界に大きな衝撃が走りました。それは、Stable Diffusionの公開です。Stable Diffusionは、テキストを受け取るとそれに沿った画像を出力してくれるモデルです1。Stable Diffsuionは10億個近いパラメータ数をもち、およそ20億個の画像とテキストのペア(LAION-2B)で学習されています。これにより、Stable Diffusionは入

    世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説! - Qiita
  • Your connected workspace for wiki, docs & projects | Notion

    A new tool that blends your everyday work apps into one. It's the all-in-one workspace for you and your team

    Your connected workspace for wiki, docs & projects | Notion
  • AIで画像の美しさを評価する LAION Aesthetics - A Day in the Life

    画像の美しさ、というのは主観が多分に含まれるものなので、コンピュータが評価するタスクとしては難しいのかな、と思っていたのだけどLAION-AESTHETICS を読んでびっくり、だいぶきちんと評価できてそう。実際にLAION Aesthetics V2でデータセットをスコア付した結果(リンク先ページは大量の画像ロードが走って遅いので注意)ではこんな感じ。例えばスコアが1.5~1.75の画像だと となる。またスコア7~7.25の画像では という感じになる。おーすごい、それっぽい。そしてこのスコアを学習・導出しているものも複雑なディープラーニング処理ではなく、単純なMLP(5つの線型層+Dropoutで、活性化関数を挟まない)というのもすごい。 LAION-Aesthetics V1 V1 では SAC というStable Diffusion等が生成した画像とプロンプトを約24万枚のデータセッ

    AIで画像の美しさを評価する LAION Aesthetics - A Day in the Life
  • Google Colab ではじめる Textual Inversion|npaka

    今回は、「Diffusers」の「textual_inversion.py」を使います。書くべきコード量も、GPUのメモリ消費量も少なくて良い感じです。 2. ライセンスの確認以下のモデルカードにアクセスして、ライセンスを確認し、「Access Repository」を押し、「Hugging Face」にログインして(アカウントがない場合は作成)、同意します。 3. 学習用画像の準備ファインチューニングには、3〜5枚の学習用画像が必要です。 ・画像サイズ は512×512。 ・Exifで回転してない画像。 ・最良の結果を得るには約 3~5個の画像。 使用する画像の枚数が多すぎると、モデルが収束しない場合がある。 ・画像には共通のコンテキスト情報が含まれている必要がある。 ・オブジェクト : 同じオブジェクトを異なる視点から写す。 ・画風 : 配色とアートスタイルを一貫させる。 4. ファイ

    Google Colab ではじめる Textual Inversion|npaka
  • 1
Лучший частный хостинг