量子化(Quantization)とは、AIモデルのパラメータの精度を下げてモデルサイズを圧縮する技術。32bit浮動小数点を8bitや4bitに変換することで、メモリ使用量と推論速度を大幅に改善する。
AI用語辞典
量子化(Quantization)とは、AIモデルのパラメータの精度を下げてモデルサイズを圧縮する技術。32bit浮動小数点を8bitや4bitに変換することで、メモリ使用量と推論速度を大幅に改善する。
For Business
戦略策定から技術選定・導入支援まで、
AI産業の最新知見をもとに、貴社の事業成長を支援します。