Merge pull request #809 from jmorganca/mxyng/fix-gpu

fix: regression unsupported metal types
2023-10-17 08:40:40 -07:00 · 2023-10-17 08:40:40 -07:00 · c031c211d1
commit c031c211d1
parent 68391b0055 cb4a80b693
1 changed files with 1 additions and 4 deletions
--- a/llm/llama.go
+++ b/llm/llama.go
@ -292,13 +292,10 @@ func newLlama(model string, adapters []string, runners []ModelRunner, numLayers
 		"--rope-freq-base", fmt.Sprintf("%f", opts.RopeFrequencyBase),
 		"--rope-freq-scale", fmt.Sprintf("%f", opts.RopeFrequencyScale),
 		"--batch-size", fmt.Sprintf("%d", opts.NumBatch),
+		"--n-gpu-layers", fmt.Sprintf("%d", numGPU),
 		"--embedding",
 	}

-	if numGPU > 0 {
-		params = append(params, "--n-gpu-layers", fmt.Sprintf("%d", numGPU))
-	}
-
 	if opts.NumGQA > 0 {
 		params = append(params, "--gqa", fmt.Sprintf("%d", opts.NumGQA))
 	}