Remix clone Hacker News

new | show | ask | jobs Github

	▲	buildbot 3 days ago
		This paper's claim holds - for 4 layer models. Models improve on out of context examples dramatically at larger scales.