Question 1

Which needs less VRAM, GPT OSS 20B RichardErkhov Heresy or GPT OSS 120B?

Accepted Answer

At Q4_K_M, GPT OSS 20B RichardErkhov Heresy needs 13.3 GB and GPT OSS 120B needs 72.7 GB, so GPT OSS 20B RichardErkhov Heresy is the lighter option to run locally.

Question 2

Which has a longer context window, GPT OSS 20B RichardErkhov Heresy or GPT OSS 120B?

Accepted Answer

GPT OSS 20B RichardErkhov Heresy supports 131,072 tokens and GPT OSS 120B supports 131,072 tokens.

Question 3

What is the difference between GPT OSS 20B RichardErkhov Heresy and GPT OSS 120B?

Accepted Answer

GPT OSS 20B RichardErkhov Heresy is a 21.5B model from MuXodious (GPT-OSS family), while GPT OSS 120B is a 120.4B model from OpenAI (GPT-OSS family). Compare their VRAM requirements above to see which fits your GPU or Mac.

	GPT OSS 20B RichardErkhov Heresy	GPT OSS 120B
Parameters	21.5B	120.4B
Context	131K	131K
Architecture	GptOssForCausalLM	GptOssForCausalLM
License	Apache 2.0	Apache 2.0
Downloads	181	4.5M
Released	Feb 2026	Aug 2025

Quantization	Bits	GPT OSS 20B RichardErkhov Heresy VRAM	GPT OSS 120B VRAM
Q2_K	3.40	9.5 GB	51.6 GB
Q3_K_M	3.90	10.9 GB	59.1 GB
Q3_K_S	3.50	9.8 GB	53.1 GB
Q4_0	4.00	11.1 GB	60.6 GB
Q4_K_M	4.80	13.3 GB	72.7 GB
Q5_K_M	5.70	15.7 GB	86.2 GB
Q6_K	6.60	18.1 GB	99.8 GB
Q8_0	8.00	21.9 GB	120.8 GB

GPT OSS 20B RichardErkhov Heresy vs GPT OSS 120B

Specifications

VRAM by Quantization: GPT OSS 20B RichardErkhov Heresy vs GPT OSS 120B

Verdict

Frequently Asked Questions