RichardErkhov
/

wang7776_-_vicuna-7b-v1.3-attention-sparsity-20-gguf

Inference Endpoints

Model card Files Files and versions Community

wang7776_-_vicuna-7b-v1.3-attention-sparsity-20-gguf

1 contributor

History: 11 commits

RichardErkhov's picture

uploaded model

94a7251 verified 7 months ago

.gitattributes

2.36 kB

uploaded model 7 months ago
vicuna-7b-v1.3-attention-sparsity-20.IQ3_M.gguf

3.11 GB
LFS

uploaded model 7 months ago
vicuna-7b-v1.3-attention-sparsity-20.IQ3_S.gguf

2.95 GB
LFS

uploaded model 7 months ago
vicuna-7b-v1.3-attention-sparsity-20.IQ3_XS.gguf

2.8 GB
LFS

uploaded model 7 months ago
vicuna-7b-v1.3-attention-sparsity-20.IQ4_XS.gguf

3.65 GB
LFS

uploaded model 7 months ago
vicuna-7b-v1.3-attention-sparsity-20.Q2_K.gguf

2.53 GB
LFS

uploaded model 7 months ago
vicuna-7b-v1.3-attention-sparsity-20.Q3_K.gguf

3.3 GB
LFS

uploaded model 7 months ago
vicuna-7b-v1.3-attention-sparsity-20.Q3_K_L.gguf

3.6 GB
LFS

uploaded model 7 months ago
vicuna-7b-v1.3-attention-sparsity-20.Q3_K_M.gguf

3.3 GB
LFS

uploaded model 7 months ago
vicuna-7b-v1.3-attention-sparsity-20.Q3_K_S.gguf

2.95 GB
LFS

uploaded model 7 months ago
vicuna-7b-v1.3-attention-sparsity-20.Q4_0.gguf

3.83 GB
LFS

uploaded model 7 months ago