mirror of
https://github.com/deepseek-ai/DeepSeek-V3.git
synced 2025-04-19 10:08:59 -04:00
a.size(-1) : K是a的列数 a.numel//K : M是a的行数 b.size(0) 是行数, b.size(-1)才是b的列数。 这里是求a@b。结果应该是a的行数 X b的列数。N的值应该是b.size(-1) |
||
---|---|---|
.. | ||
configs | ||
convert.py | ||
fp8_cast_bf16.py | ||
generate.py | ||
kernel.py | ||
model.py | ||
requirements.txt |