SONIC: Spectral Optimization of Noise for Inpainting with Consistency

Seungyeon Baek, Erqun Dong, Shadan Namazifard, Mark J. Matthews, Kwang Moo Yi

Inpainting Example

Given a nearest-pixel inpainted image (left) and its corresponding prompt, we can inpaint the image via noise optimization.

Input	Inpainted Output

"A young man with short black hair styled upward, dark brown eyes, and fair skin with light stubble. He has well-defined eyebrows and is wearing a black collar or shirt. The background is a clean white."

Environment Setup

Installation

Clone the repository

git clone git@github.com:ubc-vision/sonic.git
cd sonic

Install PyTorch

Install PyTorch with CUDA support. Visit https://pytorch.org for installation instructions. The codebase was tested with PyTorch 2.7.1+cu128, and 2.9.1+cu128.

Install required packages

For inpainting only:

pip install diffusers==0.31.0 transformers==4.46.3 accelerate==1.9.0 pillow==10.4.0 numpy==1.26.4 protobuf==6.31.1 sentencepiece==0.2.0

For metrics evaluation (optional):

pip install torchmetrics torchvision tqdm pandas open_clip_torch hpsv2 image-reward

Usage

Option 1: Using sample datasets

Run the inpainting script with predefined datasets:

python sonic_inpaint.py \
    --dataset_name FFHQ \
    --image_index 00064 \
    --num_iterations 20 \
    --step_nums 20 \
    --CFG_scale 2.0 \
    --learning_rate 3.0

Option 2: Using custom images

Run the inpainting script with custom images and prompts:

python sonic_inpaint.py \
    --image_path /path/to/image.png \
    --mask_path /path/to/mask.png \
    --prompt "Your text prompt here" \
    --num_iterations 20 \
    --step_nums 20 \
    --CFG_scale 2.0 \
    --learning_rate 3.0

Output

Results are saved to inpaint_results/{dataset_name}_{image_name}_steps{step_nums}_iter{num_iterations}/:

target_image.png - Masked target image
epsilon/ - Optimized noise at each iteration
x_0_hat/ - Predicted clean images during optimization
inpainted_output/inpainted.png - Final inpainted result

Code Release

✅ Inpainting code with sample images and prompts
✅ Environment setup guide
✅ Metrics code
✅ (Experimental) Wan 2.1 code update
⬜ (To be updated!) Video inpainting examples with Wan2.1

Citation

@article{baek2025sonicspectraloptimizationnoise,
      title={SONIC: Spectral Optimization of Noise for Inpainting with Consistency}, 
      author={Seungyeon Baek and Erqun Dong and Shadan Namazifard and Mark J. Matthews and Kwang Moo Yi},
      year={2025},
      eprint={2511.19985},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2511.19985}, 
}

Name		Name	Last commit message	Last commit date
Latest commit History 37 Commits
docs		docs
experimental/video_inpainting		experimental/video_inpainting
inpaint_output_samples		inpaint_output_samples
metrics		metrics
samples		samples
setup		setup
utils		utils
.gitignore		.gitignore
.gitmodules		.gitmodules
LICENSE		LICENSE
README.md		README.md
sonic_inpaint.py		sonic_inpaint.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

SONIC: Spectral Optimization of Noise for Inpainting with Consistency

Inpainting Example

Environment Setup

Installation

Usage

Option 1: Using sample datasets

Option 2: Using custom images

Output

Code Release

Citation

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

License

ubc-vision/sonic

Folders and files

Latest commit

History

Repository files navigation

SONIC: Spectral Optimization of Noise for Inpainting with Consistency

Inpainting Example

Environment Setup

Installation

Usage

Option 1: Using sample datasets

Option 2: Using custom images

Output

Code Release

Citation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages