| ▲ | OsrsNeedsf2P 7 hours ago | |||||||||||||||||||||||||||||||||||||
So it's trained on the SWE Bench Pro evalset | ||||||||||||||||||||||||||||||||||||||
| ▲ | topsycatt 5 hours ago | parent | next [-] | |||||||||||||||||||||||||||||||||||||
That's not accurate. Take a look at the paper to see what it is trained on! And specifically decontamination is called out in A.4 https://microsoft.ai/wp-content/uploads/2026/06/main_2026060... | ||||||||||||||||||||||||||||||||||||||
| ▲ | lemonish97 7 hours ago | parent | prev [-] | |||||||||||||||||||||||||||||||||||||
What is your evidence for this claim? | ||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||