Principle:Ggml org Llama cpp Quantization

Knowledge Sources	Domains	Last Updated
ggml-org/llama.cpp	Model Quantization, Compression	2026-02-15

Overview

Quantization is a design principle in the llama.cpp project covering model quantization and compression.

See linked implementation pages for concrete usage details.

Double-click a node to navigate. Hold to expand connections.

Principle

Implementation

Heuristic

Environment