GPUs with 12–undefined GB VRAM

Browse 79 GPUs with 12–undefined GB VRAM compatible with running LLM models locally. Compare VRAM, memory bandwidth, and AI performance.

← Show all GPUs

Which GPU Do You Need for AI?

The amount of VRAM is the most important specification for running LLMs locally. Most 7B parameter models require 4–8 GB of VRAM at common quantization levels, while 70B models need 24–48 GB. Memory bandwidth determines how fast the model generates tokens — faster bandwidth means faster responses.

NVIDIA B200

NVIDIA · Blackwell

8000.0 GB/s1000W TDP

NVIDIA B300

NVIDIA · Blackwell Ultra

8000.0 GB/s20,480 CUDA1400W TDP

NVIDIA GH200 Grace Hopper Superchip

NVIDIA · Hopper (Grace Hopper)

4900.0 GB/s16,896 CUDA1000W TDP

NVIDIA GeForce RTX 3060 12GB

NVIDIA · Ampere

360.0 GB/s3,584 CUDA170W TDP$329

NVIDIA GeForce RTX 3080 Ti

NVIDIA · Ampere

912.4 GB/s10,240 CUDA350W TDP$1,199

NVIDIA GeForce RTX 3090

NVIDIA · Ampere

936.2 GB/s10,496 CUDA350W TDP$1,499

NVIDIA GeForce RTX 3090 Ti

NVIDIA · Ampere

1008.0 GB/s10,752 CUDA450W TDP$1,999

NVIDIA GeForce RTX 4060 Ti 16GB

NVIDIA · Ada Lovelace

288.0 GB/s4,352 CUDA165W TDP$499

NVIDIA GeForce RTX 4070

NVIDIA · Ada Lovelace

504.0 GB/s5,888 CUDA200W TDP$599

NVIDIA GeForce RTX 4070 SUPER

NVIDIA · Ada Lovelace

504.0 GB/s7,168 CUDA220W TDP$599

NVIDIA GeForce RTX 4070 Ti

NVIDIA · Ada Lovelace

504.0 GB/s7,680 CUDA285W TDP$799

NVIDIA GeForce RTX 4070 Ti SUPER

NVIDIA · Ada Lovelace

672.0 GB/s8,448 CUDA285W TDP$799

NVIDIA GeForce RTX 4080

NVIDIA · Ada Lovelace

716.8 GB/s9,728 CUDA320W TDP$1,199

NVIDIA GeForce RTX 4080 SUPER

NVIDIA · Ada Lovelace

736.0 GB/s10,240 CUDA320W TDP$999

NVIDIA GeForce RTX 4090

NVIDIA · Ada Lovelace

1008.0 GB/s16,384 CUDA450W TDP$1,599

NVIDIA GeForce RTX 4090 Laptop GPU

NVIDIA · Ada Lovelace

576.0 GB/s9,728 CUDA150W TDP

NVIDIA GeForce RTX 5060 Ti 16GB

NVIDIA · Blackwell

448.0 GB/s4,608 CUDA180W TDP$429

NVIDIA GeForce RTX 5070

NVIDIA · Blackwell

672.0 GB/s6,144 CUDA250W TDP$549

NVIDIA GeForce RTX 5070 Ti

NVIDIA · Blackwell

896.0 GB/s8,960 CUDA300W TDP$749

NVIDIA GeForce RTX 5080

NVIDIA · Blackwell

960.0 GB/s10,752 CUDA360W TDP$999

NVIDIA GeForce RTX 5090

NVIDIA · Blackwell

1792.0 GB/s21,760 CUDA575W TDP$1,999

NVIDIA GeForce RTX 5090 Laptop GPU

NVIDIA · Blackwell

896.0 GB/s10,496 CUDA150W TDP

NVIDIA H100 PCIe

NVIDIA · Hopper

2039.0 GB/s14,592 CUDA350W TDP

NVIDIA H100 SXM

NVIDIA · Hopper

3352.0 GB/s16,896 CUDA700W TDP

NVIDIA H200 NVL

NVIDIA · Hopper

4800.0 GB/s16,896 CUDA600W TDP

NVIDIA H200 SXM

NVIDIA · Hopper

4800.0 GB/s16,896 CUDA700W TDP

NVIDIA L4

NVIDIA · Ada Lovelace

300.0 GB/s7,424 CUDA72W TDP

NVIDIA L40

NVIDIA · Ada Lovelace

864.0 GB/s18,176 CUDA300W TDP

NVIDIA L40S

NVIDIA · Ada Lovelace

864.0 GB/s18,176 CUDA350W TDP

NVIDIA Quadro RTX 8000

NVIDIA · Turing

672.0 GB/s4,608 CUDA260W TDP$9,999