Merge pull request #5206 from ollama/mxyng/quantize

fix: quantization with template
2024-06-21 13:44:34 -07:00 · 2024-06-21 13:44:34 -07:00 · 189a43caa2
commit 189a43caa2
parent c7c2f3bc22 e835ef1836
1 changed files with 10 additions and 5 deletions
--- a/server/images.go
+++ b/server/images.go
@ -414,17 +414,22 @@ func CreateModel(ctx context.Context, name model.Name, modelFileDir, quantizatio
 							return err
 						}
-						layers, err := parseFromFile(ctx, temp, "", fn)
+						layer, err := NewLayer(temp, baseLayer.MediaType)
 						if err != nil {
 							return err
 						}
-						if len(layers) != 1 {
+						if _, err := temp.Seek(0, io.SeekStart); err != nil {
-							return errors.New("quantization failed")
+							return err
 						}
-						baseLayer.Layer = layers[0].Layer
+						ggml, _, err := llm.DecodeGGML(temp)
-						baseLayer.GGML = layers[0].GGML
+						if err != nil {
 							return err
 						}
 						baseLayer.Layer = layer
 						baseLayer.GGML = ggml
 					}
 				}