llama.cpp/examples/high_level_api/langchain_custom_llm.py

import argparse

from llama_cpp import Llama

from langchain.llms.base import LLM
from typing import Optional, List, Mapping, Any


class LlamaLLM(LLM):
    model_path: str
    llm: Llama

    @property
    def _llm_type(self) -> str:
        return "llama-cpp-python"

    def __init__(self, model_path: str, **kwargs: Any):
        model_path = model_path
        llm = Llama(model_path=model_path)
        super().__init__(model_path=model_path, llm=llm, **kwargs)

    def _call(self, prompt: str, stop: Optional[List[str]] = None) -> str:
        response = self.llm(prompt, stop=stop or [])
        return response["choices"][0]["text"]

    @property
    def _identifying_params(self) -> Mapping[str, Any]:
        return {"model_path": self.model_path}


parser = argparse.ArgumentParser()
parser.add_argument("-m", "--model", type=str, default="../models/7B/ggml-models.bin")
args = parser.parse_args()

# Load the model
llm = LlamaLLM(model_path=args.model)

# Basic Q&A
answer = llm(
    "Question: What is the capital of France? Answer: ", stop=["Question:", "\n"]
)
print(f"Answer: {answer.strip()}")

# Using in a chain
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

prompt = PromptTemplate(
    input_variables=["product"],
    template="\n\n### Instruction:\nWrite a good name for a company that makes {product}\n\n### Response:\n",
)
chain = LLMChain(llm=llm, prompt=prompt)

# Run the chain only specifying the input variable.
print(chain.run("colorful socks"))
Update examples 2023-03-24 03:12:42 +00:00			`import argparse`

Add basic langchain demo 2023-03-23 20:25:24 +00:00			`from llama_cpp import Llama`

			`from langchain.llms.base import LLM`
			`from typing import Optional, List, Mapping, Any`

Black formatting 2023-03-24 18:35:41 +00:00
Add basic langchain demo 2023-03-23 20:25:24 +00:00			`class LlamaLLM(LLM):`
			`model_path: str`
			`llm: Llama`

			`@property`
			`def _llm_type(self) -> str:`
			`return "llama-cpp-python"`

			`def __init__(self, model_path: str, **kwargs: Any):`
			`model_path = model_path`
			`llm = Llama(model_path=model_path)`
Black formatting 2023-03-24 18:35:41 +00:00			`super().__init__(model_path=model_path, llm=llm, **kwargs)`
Add basic langchain demo 2023-03-23 20:25:24 +00:00
			`def _call(self, prompt: str, stop: Optional[List[str]] = None) -> str:`
			`response = self.llm(prompt, stop=stop or [])`
			`return response["choices"][0]["text"]`

			`@property`
			`def _identifying_params(self) -> Mapping[str, Any]:`
			`return {"model_path": self.model_path}`

Black formatting 2023-03-24 18:35:41 +00:00
Update examples 2023-03-24 03:12:42 +00:00			`parser = argparse.ArgumentParser()`
Update model paths to be more clear they should point to file 2023-04-10 02:45:55 +00:00			`parser.add_argument("-m", "--model", type=str, default="../models/7B/ggml-models.bin")`
Update examples 2023-03-24 03:12:42 +00:00			`args = parser.parse_args()`

			`# Load the model`
			`llm = LlamaLLM(model_path=args.model)`

			`# Basic Q&A`
Black formatting 2023-03-24 18:35:41 +00:00			`answer = llm(`
			`"Question: What is the capital of France? Answer: ", stop=["Question:", "\n"]`
			`)`
Update examples 2023-03-24 03:12:42 +00:00			`print(f"Answer: {answer.strip()}")`

			`# Using in a chain`
			`from langchain.prompts import PromptTemplate`
			`from langchain.chains import LLMChain`

			`prompt = PromptTemplate(`
			`input_variables=["product"],`
			`template="\n\n### Instruction:\nWrite a good name for a company that makes {product}\n\n### Response:\n",`
			`)`
			`chain = LLMChain(llm=llm, prompt=prompt)`
Add basic langchain demo 2023-03-23 20:25:24 +00:00
Update examples 2023-03-24 03:12:42 +00:00			`# Run the chain only specifying the input variable.`
Black formatting 2023-03-24 18:35:41 +00:00			`print(chain.run("colorful socks"))`