b99e758045
Add doc string for n_gpu_layers argument and make -1 offload all layers |
||
---|---|---|
.. | ||
server | ||
__init__.py | ||
llama.py | ||
llama_cpp.py | ||
llama_grammar.py | ||
llama_types.py | ||
utils.py |
b99e758045
Add doc string for n_gpu_layers argument and make -1 offload all layers |
||
---|---|---|
.. | ||
server | ||
__init__.py | ||
llama.py | ||
llama_cpp.py | ||
llama_grammar.py | ||
llama_types.py | ||
utils.py |