Spaces:

Alovestocode
/

ZeroGPU-LLM-Inference

Sleeping

Alikestocode commited on Nov 10

Commit

ecf6a69

1 Parent(s): 022b2da

Fix QuantizationConfig: use config_groups with BaseQuantizationConfig

- QuantizationConfig requires config_groups dict, not direct parameters
- Use BaseQuantizationConfig for default group with num_bits=4
- Fixes missing config_groups field error

Files changed (1) hide show

quantize_to_awq_colab.ipynb +11 -5

quantize_to_awq_colab.ipynb CHANGED Viewed

@@ -254,15 +254,21 @@
         "        print(f\"  → Starting quantization with LLM Compressor...\")\n",
         "        print(f\"  → This may take 30-60 minutes depending on model size...\")\n",
         "        \n",
-        "        # AWQModifier requires quantization_config with num_bits\n",
         "        # Create quantization config for 4-bit AWQ\n",
-        "        from compressed_tensors.quantization import QuantizationConfig\n",
         "        \n",
         "        print(f\"  → Creating quantization config for 4-bit AWQ...\")\n",
         "        quant_config = QuantizationConfig(\n",
-        "            num_bits=4,  # 4-bit quantization\n",
-        "            group_size=128,  # Group size\n",
-        "            zero_point=True  # Zero-point quantization\n",
         "        )\n",
         "        \n",
         "        print(f\"  → Creating AWQModifier with quantization config...\")\n",

         "        print(f\"  → Starting quantization with LLM Compressor...\")\n",
         "        print(f\"  → This may take 30-60 minutes depending on model size...\")\n",
         "        \n",
+        "        # AWQModifier requires quantization_config with config_groups\n",
         "        # Create quantization config for 4-bit AWQ\n",
+        "        from compressed_tensors.quantization import QuantizationConfig, BaseQuantizationConfig\n",
         "        \n",
         "        print(f\"  → Creating quantization config for 4-bit AWQ...\")\n",
+        "        # QuantizationConfig requires config_groups - a dict mapping layer names to configs\n",
+        "        # For AWQ, we use a default config group that applies to all layers\n",
         "        quant_config = QuantizationConfig(\n",
+        "            config_groups={\n",
+        "                \"default\": BaseQuantizationConfig(\n",
+        "                    num_bits=4,      # 4-bit quantization\n",
+        "                    group_size=128,  # Group size\n",
+        "                    zero_point=True   # Zero-point quantization\n",
+        "                )\n",
+        "            }\n",
         "        )\n",
         "        \n",
         "        print(f\"  → Creating AWQModifier with quantization config...\")\n",