Update model.py

Enabling mixed precision training to reduce memory usage and potentially speed up training.
2025-07-05 16:01:35 -04:00 · 2025-01-27 08:58:59 -03:00 · 2025-01-27 08:58:59 -03:00 · 2bf4595d13
commit 2bf4595d13
parent b5d872ead0
1 changed files with 1 additions and 0 deletions
--- a/inference/model.py
+++ b/inference/model.py
@ -777,6 +777,7 @@ class Transformer(nn.Module):
        Returns:
            torch.Tensor: Logits tensor of shape (batch_size, vocab_size).
        """
+        with autocast():
        seqlen = tokens.size(1)
        h = self.embed(tokens)
        freqs_cis = self.freqs_cis[start_pos:start_pos+seqlen]