Merge pull request #415 from lexin4ever/patch-1

server: pass seed param from command line to llama
2023-06-23 10:09:38 -04:00 · 2023-06-23 10:09:38 -04:00 · 0952d533fe
commit 0952d533fe
parent 3e7eae4796 282698b6d3
1 changed files with 4 additions and 0 deletions
--- a/llama_cpp/server/app.py
+++ b/llama_cpp/server/app.py
@ -30,6 +30,9 @@ class Settings(BaseSettings):
        ge=0,
        description="The number of layers to put on the GPU. The rest will be on the CPU.",
    )
    seed: int = Field(
        default=1337, description="Random seed. -1 for random."
    )
    n_batch: int = Field(
        default=512, ge=1, description="The batch size to use per eval."
    )
@ -109,6 +112,7 @@ def create_app(settings: Optional[Settings] = None):
    llama = llama_cpp.Llama(
        model_path=settings.model,
        n_gpu_layers=settings.n_gpu_layers,
        seed=settings.seed,
        f16_kv=settings.f16_kv,
        use_mlock=settings.use_mlock,
        use_mmap=settings.use_mmap,