ValueFX9507 commited on
Commit
4b7c3f7
·
verified ·
1 Parent(s): 77debd3

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +2 -3
README.md CHANGED
@@ -31,16 +31,15 @@ license: apache-2.0
31
 
32
  ## 模型亮点
33
  🔥 **四阶段进化架构**:
34
- 1. **增量预训练**:注入0.4T小说token增强文本连贯性(70%爱情动作小说)
35
  2. **Tifa-SFT**:融合全球Top4角色扮演模型Tifa的10万条高质量数据
36
  3. **CoT恢复训练**:采用Deepseek-32B/685B数据重建推理能力
37
  4. **RL强化**:保留发散性思维标签的同时优化生成质量
38
 
39
  💡 **工程创新**:
40
- - 16k超长上下文支持
41
  - 随机截断训练增强鲁棒性
42
  - 8×H20 GPU全量微调
43
- - 全面GGUF格式支持
44
 
45
  ## 模型详情
46
  | 属性 | 规格 |
 
31
 
32
  ## 模型亮点
33
  🔥 **四阶段进化架构**:
34
+ 1. **增量预训练**:注入0.4T Token 小说,使用16k上下文训练,增强文本连贯性(70%爱情动作小说)
35
  2. **Tifa-SFT**:融合全球Top4角色扮演模型Tifa的10万条高质量数据
36
  3. **CoT恢复训练**:采用Deepseek-32B/685B数据重建推理能力
37
  4. **RL强化**:保留发散性思维标签的同时优化生成质量
38
 
39
  💡 **工程创新**:
40
+ - 16k超长上下文训练
41
  - 随机截断训练增强鲁棒性
42
  - 8×H20 GPU全量微调
 
43
 
44
  ## 模型详情
45
  | 属性 | 规格 |