Question 1

Which needs less VRAM, Qwen3.5 9B Gemini 3.1 Pro Reasoning Distill or CodeQwen1.5 7B?

Accepted Answer

At Q4_K_M, Qwen3.5 9B Gemini 3.1 Pro Reasoning Distill needs 6.4 GB and CodeQwen1.5 7B needs 4.8 GB, so CodeQwen1.5 7B is the lighter option to run locally.

Question 2

Which has a longer context window, Qwen3.5 9B Gemini 3.1 Pro Reasoning Distill or CodeQwen1.5 7B?

Accepted Answer

Qwen3.5 9B Gemini 3.1 Pro Reasoning Distill supports 262,144 tokens and CodeQwen1.5 7B supports 65,536 tokens.

Question 3

What is the difference between Qwen3.5 9B Gemini 3.1 Pro Reasoning Distill and CodeQwen1.5 7B?

Accepted Answer

Qwen3.5 9B Gemini 3.1 Pro Reasoning Distill is a 9.7B model from Jackrong (Qwen family), while CodeQwen1.5 7B is a 7.3B model from Alibaba (Qwen family). Compare their VRAM requirements above to see which fits your GPU or Mac.

	Qwen3.5 9B Gemini 3.1 Pro Reasoning Distill	CodeQwen1.5 7B
Parameters	9.7B	7.3B
Context	262K	66K
Architecture	Qwen3_5ForConditionalGeneration	Qwen2ForCausalLM
License	Apache 2.0	Other
Downloads	499	1.6K
Released	Mar 2026	—

Quantization	Bits	Qwen3.5 9B Gemini 3.1 Pro Reasoning Distill VRAM	CodeQwen1.5 7B VRAM
Q2_K	3.40	4.7 GB	3.5 GB
Q3_K_M	3.90	5.3 GB	4.0 GB
Q3_K_S	3.50	4.8 GB	3.6 GB
Q4_0	4.00	—	4.1 GB
Q4_K_M	4.80	6.4 GB	4.8 GB
Q5_K_M	5.70	7.5 GB	5.6 GB
Q6_K	6.60	8.5 GB	6.4 GB
Q8_0	8.00	10.2 GB	7.7 GB

Qwen3.5 9B Gemini 3.1 Pro Reasoning Distill vs CodeQwen1.5 7B

Specifications

VRAM by Quantization: Qwen3.5 9B Gemini 3.1 Pro Reasoning Distill vs CodeQwen1.5 7B

Verdict

Frequently Asked Questions