Spaces:

schroneko
/

demo-AtlaAI-Selene-1-Mini-Llama-3.1-8B

Sleeping

schroneko commited on 12 days ago

Commit

f5e51f3

1 Parent(s): 60a9f5b

Initial commit with Selene-1-Mini-Llama implementation

Files changed (5) hide show

.python-version ADDED Viewed

	@@ -0,0 +1 @@


1	+ 3.12

app.py ADDED Viewed

+from transformers import AutoModelForCausalLM, AutoTokenizer
+import gradio as gr
+import spaces
+import torch
+model_id = "AtlaAI/Selene-1-Mini-Llama-3.1-8B"
+model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto")
+tokenizer = AutoTokenizer.from_pretrained(model_id)
+@spaces.GPU
+def generate_response(prompt):
+    messages = [{"role": "user", "content": prompt}]
+    text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
+    model_inputs = tokenizer([text], return_tensors="pt").to("cuda")
+    generated_ids = model.generate(
+        model_inputs.input_ids,
+        max_new_tokens=512,
+        do_sample=True
+    )
+    generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]
+    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
+    return response
+demo = gr.Interface(
+    fn=generate_response,
+    inputs=gr.Textbox(label="プロンプトを入力してください"),
+    outputs=gr.Textbox(label="生成された応答"),
+    title="Selene-1-Mini-Llama-3.1-8B デモ",
+    description="プロンプトを入力すると、モデルが応答を生成します。"
+)
+if __name__ == "__main__":
+    demo.launch()

pyproject.toml ADDED Viewed

+[project]
+name = "demo-atlaai-selene-1-mini-llama-3-1-8b"
+version = "0.1.0"
+description = "Add your description here"
+readme = "README.md"
+requires-python = ">=3.12"
+dependencies = [
+    "gradio>=5.13.2",
+    "spaces>=0.32.0",
+    "torch>=2.6.0",
+    "transformers>=4.48.1",
+]

requirements.txt ADDED Viewed

+transformers
+torch
+gradio
+spaces

uv.lock ADDED Viewed

The diff for this file is too large to render. See raw diff