text-to-image-generation · GitHub Topics

NVlabs / Sana

SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer

diffusion dit PyTorch sana text-to-image-generation transformers

Python 4.49 k

1 天前

Lightricks / ComfyUI-LTXVideo

LTX-Video Support for ComfyUI

comfyui diffusion-models dit image-to-video image-to-video-generation text-to-image text-to-image-generation

Python 2.34 k

2 个月前

adobe-research / custom-diffusion

Custom Diffusion: Multi-Concept Customization of Text-to-Image Diffusion (CVPR 2023)

customization fine-tuning text-to-image-generation 机器视觉 diffusion-models few-shot PyTorch

Python 1.96 k

2 年前

FoundationVision / Infinity

[CVPR 2025 Oral]Infinity ∞ : Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis

auto-regressive-model autoregressive-models generative-model gpt gpt-2 image-generation text-to-image text-to-image-generation transformers

Python 1.43 k

3 个月前

muzishen / IMAGDressing

#数据仓库#[AAAI 2025]👔IMAGDressing👔: Interactive Modular Apparel Generation for Virtual Dressing. It enables customizable human image generation with flexible garment, pose, and scene control, ensuring high f...

数据集 diffusion-models text-to-image-generation

Python 1.28 k

23 天前

songweige / rich-text-to-image

Rich-Text-to-Image Generation

机器视觉 diffusion-models PyTorch rich-text text-to-image-generation

Python 801

2 年前

PKU-YuanGroup / UniWorld-V1

UniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation

diffusion high-level-feature image-editing image-understanding low-level-vision text-to-image-generation unify unify-ai vlm

Python 701

1 个月前

AIDC-AI / Awesome-Unified-Multimodal-Models

Awesome Unified Multimodal Models

multimodal-large-language-models text-to-image-generation multimodal-models vision-language-model

690

1 个月前

FoundationVision / Liquid

Liquid: Language Models are Scalable and Unified Multi-modal Generators

generative generative-ai 大语言模型 text-to-image text-to-image-generation autoregressive-models large-language-models multimodal-large-language-models

Python 613

5 个月前

donahowe / AutoStudio

AutoStudio: Crafting Consistent Subjects in Multi-turn Interactive Image Generation

image-generation text-to-image-generation

Jupyter Notebook 446

5 个月前

Paranioar / Awesome_Matching_Pretraining_Transfering

#Awesome#The Paper List of Large Multi-Modality Model (Perception, Generation, Unification), Parameter-Efficient Finetuning, Vision-Language Pretraining, Conventional Image-Text Matching for Preliminary Insigh...

cross-modal-retrieval 教程 Awesome Lists image-text-matching image-text-retrieval large-language-models large-vision-language-models multimodal-pretraining parameter-efficient-fine-tuning vision-and-language multimodal-large-language-models 大语言模型 text-to-image-generation text-to-image-synthesis text-to-video-generation

428

9 个月前

ByteVisionLab / TokenFlow

[CVPR 2025] 🔥 Official impl. of "TokenFlow: Unified Image Tokenizer for Multimodal Understanding and Generation".

large-language-models text-to-image-generation

Python 377

1 个月前

OSU-NLP-Group / MagicBrush

[NeurIPS'23] "MagicBrush: A Manually Annotated Dataset for Instruction-Guided Image Editing".

diffusion-models image-editing image-generation image-synthesis instruction-following text-to-image text-to-image-generation text-to-image-synthesis

Python 375

7 个月前

woctezuma / stable-diffusion-colab

#计算机科学#Colab notebook for Stable Diffusion Hyper-SDXL.

colab colab-notebook colaboratory stable-diffusion huggingface-diffusers diffusion diffusion-models text-to-image text-to-image-generation text-to-image-synthesis diffusers google-colab google-colab-notebook image-generation text2image 深度学习

Jupyter Notebook 326

5 个月前

RockeyCoss / SPO

[CVPR 2025] Aesthetic Post-Training Diffusion Models from Generic Preferences with Step-by-step Preference Optimization

diffusion-models dpo sdxl text-to-image text-to-image-generation

Python 245

5 个月前

huggingface / diffusion-fast

Faster generation with text-to-image diffusion models.

diffusers diffusion-models PyTorch sdxl text-to-image-generation

Python 226

3 个月前

CFGpp-diffusion / CFGpp

Official repository for "CFG++: manifold-constrained classifier free guidance for diffusion models" (ICLR2025)

diffusion-model image-editing 机器学习 PyTorch text-to-image text-to-image-generation

Python 224

6 个月前

yunqing-me / AttackVLM

[NeurIPS-2023] Annual Conference on Neural Information Processing Systems

generative-ai text-to-image-generation foundation-models large-language-models vision-language-model

Python 211

9 个月前

tsunghan-wu / SLD

🔥 [CVPR2024] Official implementation of "Self-correcting LLM-controlled Diffusion Models (SLD)

diffusion-models image-editing text-to-image-generation dalle-3 stable-diffusion

Python 182

1 年前

markfulton / NanoBananaEditor

The most advanced Nano Banana image generator and editor application. Your central hub for AI image generation and revisions. Intuitive UI features reference images, editing with image masks, version ...

bolt imageeditor text-to-image text-to-image-generation vibecoding

TypeScript 180

13 天前