Update README.md
Browse files
README.md
CHANGED
@@ -5,7 +5,7 @@ language:
|
|
5 |
pipeline_tag: text-generation
|
6 |
---
|
7 |
|
8 |
-
## Llama-3-8B-Omnibus-1-PL-v01
|
9 |
|
10 |
Repozytorium zawiera model Meta Llama-3-8B-Omnibus-1-PL-v01 w wersji polskoj臋zycznej. Jest to model INSTRUCT (instrukcyjny). Model posta艂 na podstawie finetuningu modelu bazowego Llama-3-8B. Wykorzystano do tego dataset instrukcji Omnibus-1-PL (stworzy艂em go na w艂asne potrzeby przeprowadzania eksperymen贸w finetuningu modeli w j臋zyku polskim). Szczeg贸艂y parametr贸w treningu w sekcji Trening. Celem tego eksperymentu by艂o sprawdzenie czy mo偶na nam贸wi膰 Llama-3-8B do p艂ynnego rozmawiania w j臋zyku polskim (oryginalny model instrukcyjny 8B ma z tym problem - woli zdecydowanie bardziej rozmawia膰 po angielsku).
|
11 |
|
@@ -25,7 +25,7 @@ Uwaga!
|
|
25 |
### Dataset
|
26 |
Omnibus-1 to zbi贸r polskich instrukcji (100% kontekstu Polskiego - fakty, osoby, miejsca osadzone w Polsce), kt贸ry zosta艂 w 100% syntetycznie wygenerowany. Zawiera on instrukcje z kategorii - matematyka, umiej臋tno艣膰 pisania, dialogi, tematy medyczne, zagadki logiczne, t艂umaczenia itd. Powsta艂 on w ramach moich prac zwi膮zanych z badaniem jako艣ci modeli w kontek艣cie j臋zyka polskiego. Pozwala on na finetuning modelu i sprawdzenie podatno艣ci modelu do m贸wienia w naszym rodzimym j臋zyku. Dataset zawiera obecnie 75.000 instrukcji. B臋dzie ca艂y czas udoskonalony i by膰 mo偶e w przysz艂o艣ci udost臋pniony (jak uznam, 偶e ju偶 jest wtstarczaj膮co pe艂en i obejmuje szerokie spektrum tematyki i umiej臋tno艣ci). Dataset jest w 100% generowany za pomoc膮 innych LLM (GPT3.5, GPT4, Mixtral itd.)
|
27 |
|
28 |
-
### U偶ycie Llama-3-8B-Omnibus-1-PL-v01 z bibliotek膮 Transformers
|
29 |
|
30 |
Poni偶szy kod u偶ywa bibliotek臋 Transformers:
|
31 |
|
@@ -33,7 +33,7 @@ Poni偶szy kod u偶ywa bibliotek臋 Transformers:
|
|
33 |
import transformers
|
34 |
import torch
|
35 |
|
36 |
-
model_id = "Remek/Llama-3-8B-Omnibus-1-PL-v01"
|
37 |
|
38 |
pipeline = transformers.pipeline(
|
39 |
"text-generation",
|
@@ -94,7 +94,7 @@ Wersje poddane quantyzacji s膮 dost臋pne w repozytorium:
|
|
94 |
*
|
95 |
| Version | Model card |
|
96 |
| ------- | -------------------------------------------------------------------- |
|
97 |
-
| GGUF | [馃 HuggingFace](https://huggingface.co/Remek/Llama-3-8B-Omnibus-1-PL-v01-GGUF) |
|
98 |
|
99 |
|
100 |
### Trening
|
|
|
5 |
pipeline_tag: text-generation
|
6 |
---
|
7 |
|
8 |
+
## Llama-3-8B-Omnibus-1-PL-v01-INSTRUCT
|
9 |
|
10 |
Repozytorium zawiera model Meta Llama-3-8B-Omnibus-1-PL-v01 w wersji polskoj臋zycznej. Jest to model INSTRUCT (instrukcyjny). Model posta艂 na podstawie finetuningu modelu bazowego Llama-3-8B. Wykorzystano do tego dataset instrukcji Omnibus-1-PL (stworzy艂em go na w艂asne potrzeby przeprowadzania eksperymen贸w finetuningu modeli w j臋zyku polskim). Szczeg贸艂y parametr贸w treningu w sekcji Trening. Celem tego eksperymentu by艂o sprawdzenie czy mo偶na nam贸wi膰 Llama-3-8B do p艂ynnego rozmawiania w j臋zyku polskim (oryginalny model instrukcyjny 8B ma z tym problem - woli zdecydowanie bardziej rozmawia膰 po angielsku).
|
11 |
|
|
|
25 |
### Dataset
|
26 |
Omnibus-1 to zbi贸r polskich instrukcji (100% kontekstu Polskiego - fakty, osoby, miejsca osadzone w Polsce), kt贸ry zosta艂 w 100% syntetycznie wygenerowany. Zawiera on instrukcje z kategorii - matematyka, umiej臋tno艣膰 pisania, dialogi, tematy medyczne, zagadki logiczne, t艂umaczenia itd. Powsta艂 on w ramach moich prac zwi膮zanych z badaniem jako艣ci modeli w kontek艣cie j臋zyka polskiego. Pozwala on na finetuning modelu i sprawdzenie podatno艣ci modelu do m贸wienia w naszym rodzimym j臋zyku. Dataset zawiera obecnie 75.000 instrukcji. B臋dzie ca艂y czas udoskonalony i by膰 mo偶e w przysz艂o艣ci udost臋pniony (jak uznam, 偶e ju偶 jest wtstarczaj膮co pe艂en i obejmuje szerokie spektrum tematyki i umiej臋tno艣ci). Dataset jest w 100% generowany za pomoc膮 innych LLM (GPT3.5, GPT4, Mixtral itd.)
|
27 |
|
28 |
+
### U偶ycie Llama-3-8B-Omnibus-1-PL-v01-INSTRUCT z bibliotek膮 Transformers
|
29 |
|
30 |
Poni偶szy kod u偶ywa bibliotek臋 Transformers:
|
31 |
|
|
|
33 |
import transformers
|
34 |
import torch
|
35 |
|
36 |
+
model_id = "Remek/Llama-3-8B-Omnibus-1-PL-v01-INSTRUCT"
|
37 |
|
38 |
pipeline = transformers.pipeline(
|
39 |
"text-generation",
|
|
|
94 |
*
|
95 |
| Version | Model card |
|
96 |
| ------- | -------------------------------------------------------------------- |
|
97 |
+
| GGUF | [馃 HuggingFace](https://huggingface.co/Remek/Llama-3-8B-Omnibus-1-PL-v01-INSTRUCT-GGUF) |
|
98 |
|
99 |
|
100 |
### Trening
|