Spaces:

tejastake
/

p4-q4

Sleeping

tejastake commited on 8 days ago

Commit

d0b184f

verified ·

1 Parent(s): a8d92c0

Upload 3 files

Files changed (3) hide show

Dockerfile ADDED Viewed

+FROM python:3.11
+WORKDIR /code
+COPY ./requirements.txt /code/requirements.txt
+COPY ./app.py /code/app.py
+RUN pip install --no-cache-dir --upgrade -r /code/requirements.txt
+RUN useradd -m -u 1000 user
+USER user
+ENV HOME=/home/user \
+ PATH=/home/user/.local/bin:$PATH
+WORKDIR $HOME/app
+COPY --chown=user . $HOME/app
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

+from fastapi import FastAPI
+from pydantic import BaseModel
+from llama_cpp import Llama
+app = FastAPI()
+# Load the model
+llm = Llama.from_pretrained(
+    repo_id="unsloth/phi-4-GGUF",
+    filename="phi-4-Q4_K_M.gguf",
+)
+# Define request model
+class ChatRequest(BaseModel):
+    system_prompt: str
+    query: str
+@app.post("/chat-p4q4")
+async def chat(request: ChatRequest):
+    response = llm.create_chat_completion(
+        messages=[
+            {"role": "system", "content": request.system_prompt},
+            {"role": "user", "content": request.query},
+        ]
+    )
+    return {"response": response}

requirements.txt ADDED Viewed

+llama-cpp-python
+fastapi
+pydantic