| ▲ | zozbot234 5 hours ago | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
The llama4 series was one of the earliest large MoE's to be made publically available. People just ignored it because they were focused on running smaller and denser models at the time, we should know better these days. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ▲ | dilap 4 hours ago | parent | next [-] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
Deepseek R1 was a publically-available, MoE model that was getting a ton of attention before llama4. Llama4 didn't get much attention because it wasn't good. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ▲ | prodigycorp 4 hours ago | parent | prev [-] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
the models were objectively horrible | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||