feat: add shift factor support (#903)

leejet · web-flow · commit 48e0a28ddfa7 · 2025-10-23T01:20:29.000+08:00
diff --git a/stable-diffusion.cpp b/stable-diffusion.cpp
@@ -94,6 +94,7 @@ class StableDiffusionGGML {
     std::shared_ptr<RNG> rng = std::make_shared<STDDefaultRNG>();
     int n_threads            = -1;
     float scale_factor       = 0.18215f;
+    float shift_factor       = 0.f;
 
     std::shared_ptr<Conditioner> cond_stage_model;
     std::shared_ptr<FrozenCLIPVisionEmbedder> clip_vision;  // for svd or wan2.1 i2v
@@ -324,9 +325,10 @@ class StableDiffusionGGML {
             scale_factor = 0.13025f;
         } else if (sd_version_is_sd3(version)) {
             scale_factor = 1.5305f;
+            shift_factor = 0.0609f;
         } else if (sd_version_is_flux(version)) {
             scale_factor = 0.3611f;
-            // TODO: shift_factor
+            shift_factor = 0.1159f;
         } else if (sd_version_is_wan(version) || sd_version_is_qwen_image(version)) {
             scale_factor = 1.0f;
         }
@@ -1404,7 +1406,11 @@ class StableDiffusionGGML {
                 }
             }
         } else {
-            ggml_tensor_scale(latent, scale_factor);
+            ggml_tensor_iter(latent, [&](ggml_tensor* latent, int64_t i0, int64_t i1, int64_t i2, int64_t i3) {
+                float value = ggml_tensor_get_f32(latent, i0, i1, i2, i3);
+                value       = (value - shift_factor) * scale_factor;
+                ggml_tensor_set_f32(latent, value, i0, i1, i2, i3);
+            });
         }
     }
 
@@ -1444,7 +1450,11 @@ class StableDiffusionGGML {
                 }
             }
         } else {
-            ggml_tensor_scale(latent, 1.0f / scale_factor);
+            ggml_tensor_iter(latent, [&](ggml_tensor* latent, int64_t i0, int64_t i1, int64_t i2, int64_t i3) {
+                float value = ggml_tensor_get_f32(latent, i0, i1, i2, i3);
+                value       = (value / scale_factor) + shift_factor;
+                ggml_tensor_set_f32(latent, value, i0, i1, i2, i3);
+            });
         }
     }
 

Original file line number	Diff line number	Diff line change
`@@ -94,6 +94,7 @@ class StableDiffusionGGML {`
`94`	`94`	`std::shared_ptr<RNG> rng = std::make_shared<STDDefaultRNG>();`
`95`	`95`	`int n_threads = -1;`
`96`	`96`	`float scale_factor = 0.18215f;`
	`97`	`+ float shift_factor = 0.f;`
`97`	`98`
`98`	`99`	`std::shared_ptr<Conditioner> cond_stage_model;`
`99`	`100`	`std::shared_ptr<FrozenCLIPVisionEmbedder> clip_vision; // for svd or wan2.1 i2v`
`@@ -324,9 +325,10 @@ class StableDiffusionGGML {`
`324`	`325`	`scale_factor = 0.13025f;`
`325`	`326`	`} else if (sd_version_is_sd3(version)) {`
`326`	`327`	`scale_factor = 1.5305f;`
	`328`	`+ shift_factor = 0.0609f;`
`327`	`329`	`} else if (sd_version_is_flux(version)) {`
`328`	`330`	`scale_factor = 0.3611f;`
`329`		`- // TODO: shift_factor`
	`331`	`+ shift_factor = 0.1159f;`
`330`	`332`	`} else if (sd_version_is_wan(version) \|\| sd_version_is_qwen_image(version)) {`
`331`	`333`	`scale_factor = 1.0f;`
`332`	`334`	`}`
`@@ -1404,7 +1406,11 @@ class StableDiffusionGGML {`
`1404`	`1406`	`}`
`1405`	`1407`	`}`
`1406`	`1408`	`} else {`
`1407`		`- ggml_tensor_scale(latent, scale_factor);`
	`1409`	`+ ggml_tensor_iter(latent, [&](ggml_tensor* latent, int64_t i0, int64_t i1, int64_t i2, int64_t i3) {`
	`1410`	`+ float value = ggml_tensor_get_f32(latent, i0, i1, i2, i3);`
	`1411`	`+ value = (value - shift_factor) * scale_factor;`
	`1412`	`+ ggml_tensor_set_f32(latent, value, i0, i1, i2, i3);`
	`1413`	`+ });`
`1408`	`1414`	`}`
`1409`	`1415`	`}`
`1410`	`1416`
`@@ -1444,7 +1450,11 @@ class StableDiffusionGGML {`
`1444`	`1450`	`}`
`1445`	`1451`	`}`
`1446`	`1452`	`} else {`
`1447`		`- ggml_tensor_scale(latent, 1.0f / scale_factor);`
	`1453`	`+ ggml_tensor_iter(latent, [&](ggml_tensor* latent, int64_t i0, int64_t i1, int64_t i2, int64_t i3) {`
	`1454`	`+ float value = ggml_tensor_get_f32(latent, i0, i1, i2, i3);`
	`1455`	`+ value = (value / scale_factor) + shift_factor;`
	`1456`	`+ ggml_tensor_set_f32(latent, value, i0, i1, i2, i3);`
	`1457`	`+ });`
`1448`	`1458`	`}`
`1449`	`1459`	`}`
`1450`	`1460`