fix(server): minor type fixes

2024-03-23 17:14:15 -04:00 · 2024-03-23 17:14:15 -04:00 · d11ccc3036
commit d11ccc3036
parent c1325dcdfb
2 changed files with 4 additions and 4 deletions
--- a/llama_cpp/server/app.py
+++ b/llama_cpp/server/app.py
@ -493,7 +493,7 @@ async def tokenize(
 ) -> TokenizeInputResponse:
    tokens = llama_proxy(body.model).tokenize(body.input.encode("utf-8"), special=True)
-    return {"tokens": tokens}
+    return TokenizeInputResponse(tokens=tokens)
@router.post(
@ -508,7 +508,7 @@ async def count_query_tokens(
 ) -> TokenizeInputCountResponse:
    tokens = llama_proxy(body.model).tokenize(body.input.encode("utf-8"), special=True)
-    return {"count": len(tokens)}
+    return TokenizeInputCountResponse(count=len(tokens))
@router.post(
@ -523,4 +523,4 @@ async def detokenize(
 ) -> DetokenizeInputResponse:
    text = llama_proxy(body.model).detokenize(body.tokens).decode("utf-8")
-    return {"text": text}
+    return DetokenizeInputResponse(text=text)
--- a/llama_cpp/server/types.py
+++ b/llama_cpp/server/types.py
@ -268,7 +268,7 @@ class ModelList(TypedDict):
 class TokenizeInputRequest(BaseModel):
    model: Optional[str] = model_field
-    input: Optional[str] = Field(description="The input to tokenize.")
+    input: str = Field(description="The input to tokenize.")
    model_config = {
        "json_schema_extra": {"examples": [{"input": "How many tokens in this query?"}]}