| ▲ | chrisweekly 2 days ago | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
Disclaimer: I'm an AI novice relative to many here. FWIW last wknd I spent a couple hours setting up self-hosted n8n with ollama and gemma3:4b [EDIT: not Qwen-3.5], using PDF content extraction for my PoC. 100% local workflow, no runtime dependency on cloud providers. I doubt it'd scale very well (macbook air m4, measly 16GB RAM), but it works as intended. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ▲ | patrickk a day ago | parent | next [-] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
For those who wish to do OCR on photos, like receipts, or PDFs or anything really, Paperless-NGX works amazingly well and runs on a potato. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ▲ | polishdude20 2 days ago | parent | prev [-] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
How do you extract the content? OCR? Pdf to text then feed into qwen? I tried something similar where I needed a bunch of tables extracted from the pdf over like 40 pages. It was crazy slow on my MacBook and innacurate | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||