tomg-group-umd
/

huginn-0125

Text Generation

Model card Files Files and versions Community

Parallelization support

#5

by yigitbekir - opened 6 days ago

base: refs/heads/main

←

from: refs/pr/5

Discussion Files changed

Files changed (1) hide show

raven_modeling_minimal.py +1 -1

raven_modeling_minimal.py CHANGED Viewed

@@ -492,7 +492,7 @@ class RavenForCausalLM(RavenPreTrainedModel, GenerationMixin):
         attn_maps: dict = {},
         return_attn: bool = False,
     ):
-        x = self.transformer.adapter(torch.cat([x, input_embeds], dim=-1))
         for idx, block in enumerate(self.transformer.core_block, start=1):
             x, attn_map = block(x, freqs_cis, block_idx + idx, mask, past_key_values, return_attn=return_attn)
             attn_maps[block_idx + idx] = attn_map

         attn_maps: dict = {},
         return_attn: bool = False,
     ):
+        x = self.transformer.adapter(torch.cat([x, input_embeds.to(x.device)], dim=-1))
         for idx, block in enumerate(self.transformer.core_block, start=1):
             x, attn_map = block(x, freqs_cis, block_idx + idx, mask, past_key_values, return_attn=return_attn)
             attn_maps[block_idx + idx] = attn_map