Michael Goin's picture

Michael Goin PRO

mgoin

·

mgoin_
mgoin

AI & ML interests

LLM inference optimization, compression, quantization, pruning, distillation

Recent Activity

new activity about 17 hours ago

neuralmagic/gemma-2-9b-it-FP8:AttributeError: 'Gemma2Config' object has no attribute 'interleaved_sliding_window' Traceback (most recent call last):

new activity 2 days ago

neuralmagic/granite-3.1-8b-instruct-FP8-dynamic:compressed-tensors MLA support requires fp8 activations and weights in group 'group_0',

published a model 3 days ago

nm-testing/Yi-6B-Llama-50-quant-ds-768

View all activity

Organizations

Collections 1

Papers 4

arxiv:2409.00492

arxiv:2405.03594

arxiv:2310.06927

arxiv:2203.07259

spaces 4

Convert Fp8

Hermes Mistral 7b Vllm

Sparse Llama Gsm8k

TinyStories DeepSparse

models 94

mgoin/pixtral-12b

Image-Text-to-Text • Updated 28 days ago • 221 • 1

mgoin/Llama-3.2-1B-Instruct-FP8-ATTN

Updated Dec 23, 2024 • 8

mgoin/Llama-3.2-1B-Instruct-FP8-dynamic-ATTN

Updated Dec 23, 2024 • 5

mgoin/Pixtral-Large-Instruct-2411

Updated Nov 19, 2024

mgoin/Qwen2.5-Coder-32B-Instruct-fp8

Updated Nov 13, 2024

mgoin/nemotron-3-8b-chat-4k-sft-hf

Text Generation • Updated Nov 13, 2024 • 16

mgoin/llava-onevision-qwen2-7b-ov-hf-bnb-full-4bit

Image-Text-to-Text • Updated Nov 5, 2024 • 66

mgoin/MiniCPM-Llama3-V-2_5-int4

Visual Question Answering • Updated Oct 31, 2024 • 12

mgoin/DeepSeek-Coder-V2-Lite-Instruct-FP8

Updated Sep 20, 2024 • 3.74k

mgoin/Mixtral-8x7B-Instruct-v0.1-FP8

Updated Sep 20, 2024 • 6

datasets 1

mgoin/ultrachat_2k

Viewer • Updated May 24, 2024 • 2.05k • 529