| ▲ | p1esk 5 hours ago | |||||||||||||||||||||||||
A100 FP32 throughput “at its limit”: 19.5 TFLOP/s. AMD EPYC 9965 FP32 throughput “at its limit”: 41.2 TFLOP/s (192 cores x 64 FP32 FLOP/cycle/core x 3.35GHz). | ||||||||||||||||||||||||||
| ▲ | zzzoom 14 minutes ago | parent | next [-] | |||||||||||||||||||||||||
EPYC 9965: 614GBps of 12-channel DDR5-6400 A100: 1935GBps of HBM2e Most of those FLOPS are constrained by memory bandwidth. | ||||||||||||||||||||||||||
| ▲ | an hour ago | parent | prev | next [-] | |||||||||||||||||||||||||
| [deleted] | ||||||||||||||||||||||||||
| ▲ | tosh 5 hours ago | parent | prev [-] | |||||||||||||||||||||||||
A100: 312 TFLOP/s for FP16 but it is very impressive how far modern CPUs get as well (also in smart phones!) | ||||||||||||||||||||||||||
| ||||||||||||||||||||||||||