Fix 'HPUCompressedTensorsWNA16MoEMethod' object has no attribute 'fused_experts'

pawel-olejniczak · pawel-olejniczak · commit 7dd034de19c2 · 2025-11-06T15:27:22.000+01:00
Signed-off-by: Paweł Olejniczak &lt;polejniczakx@habana.ai&gt;
diff --git a/vllm_gaudi/ops/hpu_compressed_tensors.py b/vllm_gaudi/ops/hpu_compressed_tensors.py
@@ -654,7 +654,6 @@ def apply(
         logical_to_physical_map: Optional[torch.Tensor] = None,
         logical_replica_count: Optional[torch.Tensor] = None,
     ) -> Union[torch.Tensor, tuple[torch.Tensor, torch.Tensor]]:
-        assert self.fused_experts is None
 
         if enable_eplb:
             raise NotImplementedError("EPLB not supported for "
diff --git a/vllm_gaudi/ops/hpu_fp8.py b/vllm_gaudi/ops/hpu_fp8.py
@@ -72,7 +72,6 @@ def __init__(self, quant_config: Fp8Config, layer: torch.nn.Module):
         self.allow_deep_gemm = False
 
         self.topk_indices_dtype = None
-        self.fused_experts = None
 
     def create_weights(self, *args, **kwargs) -> None:
         if hpu_ops.is_hpu_gaudi2: