Safetensors
Japanese
qwen2
unsloth
trl
sft
File size: 5,188 Bytes
799dfac
 
 
 
 
24300f6
 
 
 
8ab8568
 
 
 
0a7e92c
799dfac
 
 
 
210c126
8ab8568
d89240d
8ab8568
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
d38339b
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
8ab8568
d38339b
 
 
 
 
 
 
 
 
 
8ab8568
d38339b
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
---
language:
- ja
base_model:
- Qwen/Qwen2.5-7B-Instruct
tags:
- unsloth
- trl
- sft
datasets:
- Nurture-intelligence/thinking_dataset_v1
- Manual-Dataset-Creation-Project/Malum-230
- team-hatakeyama-phase2/LLMChat
license: apache-2.0
---

# ๆฆ‚่ฆ
่ณชๅ•ใจๅฟœ็ญ”ใ‹ใ‚‰ใ€ใใฎ้Ž็จ‹ใฎๆ€่€ƒใ‚’็”Ÿๆˆใ™ใ‚‹่จ€่ชžใƒขใƒ‡ใƒซใงใ™ใ€‚  
[GGUFใฏใ“ใกใ‚‰](https://huggingface.co/SousiOmine/Kuroiso-CR-7B-20250124-GGUF)  
Qwen2.5-7B-Instructใ‚’ใƒ•ใ‚กใ‚คใƒณใƒใƒฅใƒผใƒ‹ใƒณใ‚ฐใ—ไฝœๆˆใ—ใพใ—ใŸใ€‚
ใƒ‡ใƒผใ‚ฟใ‚ปใƒƒใƒˆใซใฏ่ค‡ๆ•ฐใƒ‡ใƒผใ‚ฟใ‚ปใƒƒใƒˆ๏ผˆdatasetsๆฌ„ใซ่จ˜่ผ‰๏ผ‰ใฎ่ณชๅ•้ƒจๅˆ†ใ‚’ใŠๅ€Ÿใ‚Šใ—ใŸใ‚‚ใฎใ€ใŠใ‚ˆใณ็งใฎไฝœๆˆใ—ใŸ่ณชๅ•ใ‚’็”จใ„ใ€
ๆ€่€ƒใ‚’allura-org/Qwen2.5-32b-RP-Inkใ€ๅ›ž็ญ”ใ‚’AXCXEPT/EZO-Qwen2.5-32B-Instructใง1225ไปถ็”Ÿๆˆใ—ใŸใ‚‚ใฎใ‚’ไฝฟ็”จใ—ใพใ—ใŸใ€‚  

Instructionใ‚’
```
ใ‚ใชใŸใซใฏ่ฆๆฑ‚ใจๅ›ž็ญ”ใ‹ใ‚‰่ซ–็†็š„ๆ€่€ƒใ‚’ไฝœๆˆใ™ใ‚‹ไปปๅ‹™ใŒไธŽใˆใ‚‰ใ‚Œใฆใ„ใพใ™ใ€‚ไธ‡่ƒฝใชใ‚ขใ‚ทใ‚นใ‚ฟใƒณใƒˆใŒQueryใ‚ฟใ‚ฐๅ†…ใฎ่ณชๅ•ใ‚’ๅ—ใ‘ใ€Answerใ‚ฟใ‚ฐๅ†…ใฎๅ›ž็ญ”ใ‚’ใ™ใ‚‹ใพใงใฎๆ€่€ƒใ‚’Chain-of-Thoughtๅฝขๅผใง่จ˜่ฟฐใ—ใฆใใ ใ•ใ„ใ€‚ๆ€่€ƒใฏ<Thought>ใ‚ฟใ‚ฐๅ†…ใซ่จ˜่ฟฐใ—ใฆใใ ใ•ใ„ใ€‚
```
ใจใ—ใ€ใƒฆใƒผใ‚ถใƒผๅ…ฅๅŠ›ใ‚’
```
<Query>
{่ณชๅ•}
</Query>
<Answer>
{ๅฟœ็ญ”}
</Answer>
```
ใฎๅฝขๅผใง่กŒใ†ใ“ใจใงใ€
```

<Thought>
{ๆ€่€ƒ}
</Thought>
<|im_end|>
```
ใฎๅฝขๅผใงใ€่ณชๅ•ใ‚’ๅ—ใ‘ใฆๅฟœ็ญ”ใ‚’่ฟ”ใ™ใพใงใฎๆ€่€ƒใ‚’ๅ–ๅพ—ใ™ใ‚‹ใ“ใจใŒใงใใพใ™ใ€‚

# ๆณจๆ„็‚น
- ๅญฆ็ฟ’ใซไฝฟ็”จใ—ใŸใƒ‡ใƒผใ‚ฟใฎใ†ใกใ€่จˆ็ฎ—ใŠใ‚ˆใณใ‚ณใƒผใƒ‡ใ‚ฃใƒณใ‚ฐใ€ใƒญใƒผใƒซใƒ—ใƒฌใ‚คใฎๅ‰ฒๅˆใŒๆฅต็ซฏใซๅฐใ•ใใ€ใ“ใ‚Œใ‚‰ใ‚ฟใ‚นใ‚ฏใงใฏๆœŸๅพ…ใ—ใŸๆ€่€ƒ็”ŸๆˆใŒใ†ใพใใ„ใ‹ใชใ„ใ“ใจใŒใ‚ใ‚Šใพใ™ใ€‚็‰นใซๆ•ฐๅญฆใ‚ฟใ‚นใ‚ฏใงใฏๅพฎๅฆ™ใงใ™ใ€‚  
- ใ‚ฏใ‚จใƒชใจๅฟœ็ญ”ใŒไน–้›ขใ—ใฆใ„ใ‚‹ๅ ดๅˆใฎๆ€่€ƒใŒใ†ใพใ็”Ÿๆˆใงใใพใ›ใ‚“๏ผˆไพ‹ Query="ใ“ใ‚“ใซใกใฏ", Answer="python" ใชใฉ๏ผ‰ใ€‚
- ใใ‚‚ใใ‚‚ๅญฆ็ฟ’ใƒ‡ใƒผใ‚ฟใฎ่ณชใ€้‡ใจใ‚‚ใซไธ่ถณใ—ใฆใ„ใ‚‹ใฎใงใ€ใ‚ใพใ‚Š้ซ˜ๅ“่ณชใชๆ€่€ƒใ‚’็”Ÿๆˆใ™ใ‚‹ใ“ใจใฏใงใใพใ›ใ‚“ใ€‚  

# transformersใงใฎๆŽจ่ซ–ไพ‹
```
model = AutoModelForCausalLM.from_pretrained(
    "SousiOmine/Kuroiso-CR-7B-20250124", device_map="auto", load_in_4bit=True
)
tokenizer = AutoTokenizer.from_pretrained("SousiOmine/Kuroiso-CR-7B-20250124")

qwen_prompt = """<|im_start|>system
{}<|im_end|>
<|im_start|>user
{}<|im_end|>
<|im_start|>assistant
{}
"""

query_template = """<Query>
{}
</Query>
<Answer>
{}
</Answer>"""

inputs = tokenizer(
[
    qwen_prompt.format(
        "ใ‚ใชใŸใซใฏ่ฆๆฑ‚ใจๅ›ž็ญ”ใ‹ใ‚‰่ซ–็†็š„ๆ€่€ƒใ‚’ไฝœๆˆใ™ใ‚‹ไปปๅ‹™ใŒไธŽใˆใ‚‰ใ‚Œใฆใ„ใพใ™ใ€‚ไธ‡่ƒฝใชใ‚ขใ‚ทใ‚นใ‚ฟใƒณใƒˆใŒQueryใ‚ฟใ‚ฐๅ†…ใฎ่ณชๅ•ใ‚’ๅ—ใ‘ใ€Answerใ‚ฟใ‚ฐๅ†…ใฎๅ›ž็ญ”ใ‚’ใ™ใ‚‹ใพใงใฎๆ€่€ƒใ‚’Chain-of-Thoughtๅฝขๅผใง่จ˜่ฟฐใ—ใฆใใ ใ•ใ„ใ€‚ๆ€่€ƒใฏ<Thought>ใ‚ฟใ‚ฐๅ†…ใซ่จ˜่ฟฐใ—ใฆใใ ใ•ใ„ใ€‚",
        query_template.format(
            "ใ“ใ‚“ใซใกใฏ",
            "ใ“ใ‚“ใซใกใฏ๏ผไปŠๆ—ฅใฏใ„ใ‹ใŒใŠ้Žใ”ใ—ใงใ™ใ‹๏ผŸ"
        ),
        "", # output
    )
], return_tensors = "pt").to("cuda")

from transformers import TextStreamer
text_streamer = TextStreamer(tokenizer)
# repetition_penalty=1.1, temperature=0.7ใใ‚‰ใ„ใŒใŸใถใ‚“่‰ฏใ„
model.generate(**inputs, streamer = text_streamer, max_new_tokens = 1024)
```

ไปฅไธ‹ใฎใ‚ˆใ†ใชๅ‡บๅŠ›ใŒๅพ—ใ‚‰ใ‚Œใพใ™ใ€‚
```
<|im_start|>assistant

<Thought>
ใ“ใ‚“ใซใกใฏใจใ„ใ†ๆŒจๆ‹ถใŒไธŽใˆใ‚‰ใ‚Œใพใ—ใŸใ€‚
ใ“ใ‚Œใฏไผš่ฉฑใฎๅง‹ใพใ‚Šใ‚’็คบใ—ใฆใ„ใพใ™ใ€‚
่ฟ”็ญ”ใŒๅฟ…่ฆใงใ™ใ€‚
ใ€Œใ“ใ‚“ใซใกใฏใ€ใจใ„ใ†ๆŒจๆ‹ถใ‚’ใใฎใพใพ่ฟ”ใ™ใฎใŒ่‡ช็„ถใงใ—ใ‚‡ใ†ใ€‚
ใ—ใ‹ใ—ใ€ๅˆฉ็”จ่€…ใŒๅ…ทไฝ“็š„ใช่ณชๅ•ใ‚„่ฉฑ้กŒใ‚’ๆ่ตทใ—ใฆใ„ใชใ„ใ‚ˆใ†ใงใ™ใ€‚
ใใ“ใงใ€ๅˆฉ็”จ่€…ใฎๆ„ๅ›ณใ‚’็†่งฃใ™ใ‚‹ใŸใ‚ใซใ€ๅฐ‘ใ—ๆŽ˜ใ‚Šไธ‹ใ’ใฆใฟใ‚‹ใฎใ‚‚่‰ฏใ„ใ‹ใ‚‚ใ—ใ‚Œใพใ›ใ‚“ใ€‚

ใกใ‚‡ใฃใจๅพ…ใฃใฆใใ ใ•ใ„ใ€‚้–“้•ใˆใŸใ‹ใ‚‚ใ—ใ‚Œใพใ›ใ‚“ใ€‚่ฆ‹็›ดใ—ใ‚’่กŒใ„ใพใ™ใ€‚
ๅˆฉ็”จ่€…ใŒไฝ•ใ‹ๅ…ทไฝ“็š„ใช่ณชๅ•ใ‚„่ฉฑ้กŒใ‚’ๆ่ตทใ—ใฆใ„ใชใ„ใ“ใจใ‚’็ขบ่ชใ—ใพใ—ใŸใ€‚
ใใฎๅ ดๅˆใ€ๅˆฉ็”จ่€…ใซๅฏพใ—ใฆๅ…ทไฝ“็š„ใช่ณชๅ•ใ‚’ๆŠ•ใ’ใ‹ใ‘ใ‚‹ใ“ใจใงใ€ไผš่ฉฑใ‚’้€ฒใ‚ใ‚‹ๆ–นใŒ่‰ฏใ„ใ‹ใ‚‚ใ—ใ‚Œใพใ›ใ‚“ใ€‚
ไพ‹ใˆใฐใ€ใ€ŒไปŠๆ—ฅใฏใฉใฎใ‚ˆใ†ใชไธ€ๆ—ฅใ‚’ใŠ้Žใ”ใ—ใงใ™ใ‹๏ผŸใ€ใจใ„ใ†ใ‚ˆใ†ใช่ณชๅ•ใ‚’ๆŠ•ใ’ใ‹ใ‘ใ‚‹ใจ่‰ฏใ„ใงใ—ใ‚‡ใ†ใ€‚

ๅ†ๅบฆ่€ƒใˆ็›ดใ—ใพใ™ใ€‚
ๅˆฉ็”จ่€…ใŒๅ…ทไฝ“็š„ใช่ณชๅ•ใ‚„่ฉฑ้กŒใ‚’ๆ่ตทใ—ใฆใ„ใชใ„ใ“ใจใ‚’ๅ†็ขบ่ชใ—ใพใ—ใŸใ€‚
ใใฎๅ ดๅˆใ€ๅˆฉ็”จ่€…ใซๅฏพใ—ใฆๅ…ทไฝ“็š„ใช่ณชๅ•ใ‚’ๆŠ•ใ’ใ‹ใ‘ใ‚‹ใ“ใจใงใ€ไผš่ฉฑใ‚’้€ฒใ‚ใ‚‹ๆ–นใŒ่‰ฏใ„ใ‹ใ‚‚ใ—ใ‚Œใพใ›ใ‚“ใ€‚
ใ—ใ‹ใ—ใ€ๆœ€ๅˆใฎ่ฟ”็ญ”ใงใฏใ‚ทใƒณใƒ—ใƒซใซใ€Œใ“ใ‚“ใซใกใฏใ€ใจ่ฟ”็ญ”ใ™ใ‚‹ใฎใŒๆœ€ใ‚‚้ฉๅˆ‡ใ‹ใ‚‚ใ—ใ‚Œใพใ›ใ‚“ใ€‚
ใใฎใŸใ‚ใ€ๆœ€ๅˆใฎ่ฟ”็ญ”ใ‚’่ธ่ฅฒใ—ใ€ใ€Œใ“ใ‚“ใซใกใฏใ€ใจ่ฟ”็ญ”ใ™ใ‚‹ใฎใŒๆญฃ่งฃใงใ—ใ‚‡ใ†ใ€‚

ใ€Œใ“ใ‚“ใซใกใฏใ€ใจใ„ใ†ๆŒจๆ‹ถใ‚’่ฟ”็ญ”ใ™ใ‚‹ใ“ใจใงใ€ไผš่ฉฑใ‚’ๅง‹ใ‚ใ‚‹ใ“ใจใŒๅ‡บๆฅใพใ™ใ€‚
ใพใŸใ€ๅˆฉ็”จ่€…ใŒๅ…ทไฝ“็š„ใช่ณชๅ•ใ‚„่ฉฑ้กŒใ‚’ๆ่ตทใ—ใฆใ„ใชใ„ๅ ดๅˆใงใ‚‚ใ€ใ‚ทใƒณใƒ—ใƒซใชๆŒจๆ‹ถใ‚’่ฟ”ใ™ใ“ใจใงใ€ๅˆฉ็”จ่€…ใฎๆ„ๅ›ณใ‚’็†่งฃใ—ใ‚„ใ™ใใชใ‚Šใพใ™ใ€‚
ใ—ใŸใŒใฃใฆใ€ใ€Œใ“ใ‚“ใซใกใฏใ€ใจ่ฟ”็ญ”ใ™ใ‚‹ใ“ใจใŒๆœ€ใ‚‚้ฉๅˆ‡ใช้ธๆŠž่‚ขใงใ‚ใ‚‹ใจ่จ€ใˆใ‚‹ใงใ—ใ‚‡ใ†ใ€‚
</Thought>
<|im_end|>
```