Papermerge Core
Reference
👉 https://github.com/papermerge/papermerge-core


Papermerge คืออะไร?
Papermerge คือ Open-source Document Management System (DMS)
สำหรับ
- 📂 เก็บเอกสาร
- 🔍 OCR แปลงไฟล์สแกนเป็นข้อความ
- 🔎 ค้นหาเอกสารแบบ Full-text
“อยากมี Google Drive + Search เก่ง ๆ + อ่าน PDF สแกนได้”
→ Papermerge คือสิ่งนั้น
🧩 มันแก้ปัญหาอะไร?
ตัวอย่างชีวิตจริง
- ใบเสร็จ 500 ใบ
- สแกนเก็บเป็น PDF
- อยากค้นคำว่า
"VAT"หรือ"บริษัท A"
ปัญหา
- PDF สแกน = รูปภาพ
- → ค้นหา text ไม่ได้
สิ่งที่ Papermerge ทำ
- OCR → แปลงรูปเป็น text
- Indexing → Full-text search
- Organization → folder, metadata, tag
✨ สรุปสั้น ๆ
เปลี่ยน กองไฟล์มั่ว ๆ
→ เป็น ระบบเอกสารที่ search ได้เหมือน Google
🏗️ Tech Stack
Backend
- Python
- Django
- REST API (OpenAPI)
- Async workers (OCR / Indexing)
Frontend
- React
- SPA
- เรียก API จาก backend ทั้งหมด
Infrastructure
- Docker-friendly
- Redis (Queue)
- Search Engine
- Elasticsearch
- Xapian
- Whoosh
- Solr
- Tesseract OCR
🤯 Feature ที่ Dev จะว้าว
📁 Document System
- Folder tree
- Drag & drop
- Versioning
- Page reorder / delete / extract
🔍 OCR + Full-text Search
- สแกนแล้วค้นหาได้
- Search ได้ทุกคำในไฟล์
🏷️ Metadata / Tags
- Custom fields
- Document types
- เหมาะกับ Invoice / Contract / Receipt
👥 Multi-user
- Users / Groups / Permissions
- Share เอกสารได้
🔌 API First
- ทุกอย่างผ่าน REST
- Integrate กับระบบอื่นได้ง่าย
🧠 TL;DR
Papermerge =
Google Drive + OCR + Full-text Search + Self-hosted
Tech =
Django + React + Worker + Search Engine
เหมาะมากสำหรับเรียนรู้ architecture ของระบบเอกสารจริง







