Spaces:

schroneko
/

demo-AtlaAI-Selene-1-Mini-Llama-3.1-8B

Sleeping

Initial commit with Selene-1-Mini-Llama implementation

f5e51f3 12 days ago

1.27 kB

	from transformers import AutoModelForCausalLM, AutoTokenizer
	import gradio as gr
	import spaces
	import torch

	model_id = "AtlaAI/Selene-1-Mini-Llama-3.1-8B"

	model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto")
	tokenizer = AutoTokenizer.from_pretrained(model_id)

	@spaces.GPU
	def generate_response(prompt):
	messages = [{"role": "user", "content": prompt}]
	text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
	model_inputs = tokenizer([text], return_tensors="pt").to("cuda")

	generated_ids = model.generate(
	model_inputs.input_ids,
	max_new_tokens=512,
	do_sample=True
	)
	generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]

	response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
	return response

	demo = gr.Interface(
	fn=generate_response,
	inputs=gr.Textbox(label="プロンプトを入力してください"),
	outputs=gr.Textbox(label="生成された応答"),
	title="Selene-1-Mini-Llama-3.1-8B デモ",
	description="プロンプトを入力すると、モデルが応答を生成します。"
	)

	if __name__ == "__main__":
	demo.launch()