
img2prompt (モバイル -> モバイル)とは
Methexis-Inc/img2promptは、画像に合わせたおおよそのテキストプロンプトを生成するためのツールです。
このツールは、特に安定した拡散(clip ViT-L/14)に最適化されています。
このツールは、@pharmapsychoticによって作成されたオープンソースのCLIPインターロゲーターノートブックに基づいており、OpenAI CLIPモデルを使用して、画像をさまざまなアーティスト、媒体、スタイルにマッチングします。
比較の結果は、BLIPキャプションと組み合わせて、元の画像に似た追加の画像を作成するために使用できるテキストプロンプトを生成します。
このツールはAPIを介して実行でき、GitHubリポジトリおよびライセンスにアクセスして詳細を確認できます。
予測は通常24秒以内に完了し、Nvidia T4 GPUハードウェア上で実行されます。