讓我們一起量化一個真實的例子。 🧮 從權重開始:[0.1, -0.5, 2.3, -1.8] 在 float32 中 → 16 字節。 目標:縮小到 int8(僅 4 字節)。 怎麼做?兩個魔法數字:scale 和 zero_point。 🔑 一步一步 👇
358