▲ | edude03 10 hours ago | ||||||||||||||||||||||||||||||||||||||||||||||||||||
The qwen thinker/speaker architecture is really fascinating and is more in line with how I imagine human multi modality works - IE, a picture of an apple, the text a p p l e and the sound all map to the same concept without going to text first. | |||||||||||||||||||||||||||||||||||||||||||||||||||||
▲ | adastra22 10 hours ago | parent [-] | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Isn’t that how all LLMs work? | |||||||||||||||||||||||||||||||||||||||||||||||||||||
|