Update README.md
Browse files
README.md
CHANGED
@@ -58,12 +58,14 @@ python3 preprocess.py --corpus_path corpora/couplet.txt \
|
|
58 |
python3 pretrain.py --dataset_path couplet_dataset.pt \
|
59 |
--vocab_path models/google_zh_vocab.txt \
|
60 |
--output_model_path models/couplet_gpt2_base_model.bin \
|
61 |
-
--config_path models/bert_base_config.json
|
62 |
--tie_weight --world_size 8 --gpu_ranks 0 1 2 3 4 5 6 7 \
|
|
|
|
|
63 |
--embedding word_pos --remove_embedding_layernorm \
|
64 |
-
--encoder transformer --mask causal --
|
65 |
-
--
|
66 |
-
|
67 |
|
68 |
```
|
69 |
|
|
|
58 |
python3 pretrain.py --dataset_path couplet_dataset.pt \
|
59 |
--vocab_path models/google_zh_vocab.txt \
|
60 |
--output_model_path models/couplet_gpt2_base_model.bin \
|
61 |
+
--config_path models/bert_base_config.json \
|
62 |
--tie_weight --world_size 8 --gpu_ranks 0 1 2 3 4 5 6 7 \
|
63 |
+
--total_steps 25000 --save_checkpoint_steps 5000 --report_steps 1000 \
|
64 |
+
--learning_rate 5e-4 --batch_size 64 \
|
65 |
--embedding word_pos --remove_embedding_layernorm \
|
66 |
+
--encoder transformer --mask causal --layernorm_positioning pre \
|
67 |
+
--target lm --tie_weight
|
68 |
+
|
69 |
|
70 |
```
|
71 |
|