▲ | Real-time AI hallucination detection with timeplus: A chess example(timeplus.com) | |||||||||||||||||||||||||||||||||||||
21 points by gangtao 6 days ago | 13 comments | ||||||||||||||||||||||||||||||||||||||
▲ | joegibbs 2 days ago | parent | next [-] | |||||||||||||||||||||||||||||||||||||
But what exactly does this product do that you can’t from just parsing the stream? Besides, the problem with hallucinations is the unknown unknowns: if what you’re doing is easily verifiable (like parsing JSON or checking valid chess moves) it’s trivial. But what if you don’t know the answer yourself? Then it’s basically impossible to solve. | ||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||
▲ | tines 2 days ago | parent | prev | next [-] | |||||||||||||||||||||||||||||||||||||
So you have to be able to identify a priori what is and isn't an hallucination right? | ||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||
▲ | uncomputation 2 days ago | parent | prev | next [-] | |||||||||||||||||||||||||||||||||||||
There’s a more generalizable work on this recently for those expecting more. https://github.com/leochlon/hallbayes | ||||||||||||||||||||||||||||||||||||||
▲ | Zeik 2 days ago | parent | prev | next [-] | |||||||||||||||||||||||||||||||||||||
I didn’t understand quite the point of the claims from end of the page. Surely automatic cars or health/banking services don’t use language models for anything important. Everyone knows those hallucinate. ML is lot better alternative. | ||||||||||||||||||||||||||||||||||||||
▲ | tingfirst a day ago | parent | prev | next [-] | |||||||||||||||||||||||||||||||||||||
AI can be hallucination but real-time detection is key | ||||||||||||||||||||||||||||||||||||||
▲ | yunwal 2 days ago | parent | prev | next [-] | |||||||||||||||||||||||||||||||||||||
is this satire? | ||||||||||||||||||||||||||||||||||||||
▲ | curtisszmania 2 days ago | parent | prev [-] | |||||||||||||||||||||||||||||||||||||
[dead] |