ValueFX9507
commited on
Update README.md
Browse files
README.md
CHANGED
@@ -31,16 +31,15 @@ license: apache-2.0
|
|
31 |
|
32 |
## 模型亮点
|
33 |
🔥 **四阶段进化架构**:
|
34 |
-
1. **增量预训练**:注入0.4T
|
35 |
2. **Tifa-SFT**:融合全球Top4角色扮演模型Tifa的10万条高质量数据
|
36 |
3. **CoT恢复训练**:采用Deepseek-32B/685B数据重建推理能力
|
37 |
4. **RL强化**:保留发散性思维标签的同时优化生成质量
|
38 |
|
39 |
💡 **工程创新**:
|
40 |
-
- 16k
|
41 |
- 随机截断训练增强鲁棒性
|
42 |
- 8×H20 GPU全量微调
|
43 |
-
- 全面GGUF格式支持
|
44 |
|
45 |
## 模型详情
|
46 |
| 属性 | 规格 |
|
|
|
31 |
|
32 |
## 模型亮点
|
33 |
🔥 **四阶段进化架构**:
|
34 |
+
1. **增量预训练**:注入0.4T Token 小说,使用16k上下文训练,增强文本连贯性(70%爱情动作小说)
|
35 |
2. **Tifa-SFT**:融合全球Top4角色扮演模型Tifa的10万条高质量数据
|
36 |
3. **CoT恢复训练**:采用Deepseek-32B/685B数据重建推理能力
|
37 |
4. **RL强化**:保留发散性思维标签的同时优化生成质量
|
38 |
|
39 |
💡 **工程创新**:
|
40 |
+
- 16k超长上下文训练
|
41 |
- 随机截断训练增强鲁棒性
|
42 |
- 8×H20 GPU全量微调
|
|
|
43 |
|
44 |
## 模型详情
|
45 |
| 属性 | 规格 |
|