Papermerge Core

Reference
👉 https://github.com/papermerge/papermerge-core

chronotype image
chronotype image


Papermerge คืออะไร?

Papermerge คือ Open-source Document Management System (DMS)
สำหรับ

  • 📂 เก็บเอกสาร
  • 🔍 OCR แปลงไฟล์สแกนเป็นข้อความ
  • 🔎 ค้นหาเอกสารแบบ Full-text

“อยากมี Google Drive + Search เก่ง ๆ + อ่าน PDF สแกนได้”
→ Papermerge คือสิ่งนั้น


🧩 มันแก้ปัญหาอะไร?

ตัวอย่างชีวิตจริง

  • ใบเสร็จ 500 ใบ
  • สแกนเก็บเป็น PDF
  • อยากค้นคำว่า "VAT" หรือ "บริษัท A"

ปัญหา

  • PDF สแกน = รูปภาพ
  • → ค้นหา text ไม่ได้

สิ่งที่ Papermerge ทำ

  1. OCR → แปลงรูปเป็น text
  2. Indexing → Full-text search
  3. Organization → folder, metadata, tag

✨ สรุปสั้น ๆ

เปลี่ยน กองไฟล์มั่ว ๆ
→ เป็น ระบบเอกสารที่ search ได้เหมือน Google


🏗️ Tech Stack

Backend

  • Python
  • Django
  • REST API (OpenAPI)
  • Async workers (OCR / Indexing)

Frontend

  • React
  • SPA
  • เรียก API จาก backend ทั้งหมด

Infrastructure

  • Docker-friendly
  • Redis (Queue)
  • Search Engine
    • Elasticsearch
    • Xapian
    • Whoosh
    • Solr
  • Tesseract OCR

🤯 Feature ที่ Dev จะว้าว

📁 Document System

  • Folder tree
  • Drag & drop
  • Versioning
  • Page reorder / delete / extract

🔍 OCR + Full-text Search

  • สแกนแล้วค้นหาได้
  • Search ได้ทุกคำในไฟล์

🏷️ Metadata / Tags

  • Custom fields
  • Document types
  • เหมาะกับ Invoice / Contract / Receipt

👥 Multi-user

  • Users / Groups / Permissions
  • Share เอกสารได้

🔌 API First

  • ทุกอย่างผ่าน REST
  • Integrate กับระบบอื่นได้ง่าย

🧠 TL;DR

Papermerge =
Google Drive + OCR + Full-text Search + Self-hosted

Tech =
Django + React + Worker + Search Engine

เหมาะมากสำหรับเรียนรู้ architecture ของระบบเอกสารจริง

ทำไมการนอน 7–8 ชั่วโมง ถึงสำคัญกว่าที่คิด

ทำไมการนอน 7–8 ชั่วโมง ถึงสำคัญกว่าที่คิด

การนอน 7-8 ชั่วโมงไม่ได้เป็นแค่การพักผ่อน แต่ช่วยซ่อมแซมร่างกาย ฟื้นฟูสมอง และยกระดับประสิทธิภาพการทำงานของคุณให้ดีขึ้นในทุก ๆ วัน

conscious competence learning model

conscious competence learning model

เวลาที่เราเริ่มเรียนทักษะใหม่ ไม่ว่าจะเป็นการเขียนโปรแกรม เล่นดนตรี ขับรถ หรือเรียนภาษา หลายคนมักมีช่วงเวลาที่รู้สึกว่า **ตัวเองโง่ลง** หรือ **ทำไมมันยากขนาดนี้** ความจริงแล้ว ความรู้สึกแบบนี้เป็นส่วนหนึ่งของกระบวนการเรียนรู้ตามโมเดลที่เรียกว่า **Conscious Competence Learning Model**

ปรากฏการณ์ Enshitification: ทำไมแพลตฟอร์มออนไลน์ถึงค่อย ๆ แย่ลง?

ปรากฏการณ์ Enshitification: ทำไมแพลตฟอร์มออนไลน์ถึงค่อย ๆ แย่ลง?

ทำไม Facebook, YouTube หรือ Amazon ถึงรู้สึกแย่กว่าเมื่อก่อน? ทำความรู้จักกับ Enshitification วงจรที่แพลตฟอร์มออนไลน์ค่อย ๆ ลดคุณภาพลงเพื่อเพิ่มกำไรสูงสุด

ทำไม 90 วันถึงเพียงพอกับการเรียนรู้ Skill ใหม่?

ทำไม 90 วันถึงเพียงพอกับการเรียนรู้ Skill ใหม่?

ทำไม 90 วันถึงเพียงพอกับการเรียนรู้ Skill ใหม่? สรุปเหตุผลที่ 3 เดือนคือช่วงเวลาที่ทรงพลังที่สุดในการเริ่มต้นทักษะใหม่ให้ใช้งานได้จริง

Anthropic Distillation Attack 2026

Anthropic Distillation Attack 2026

Anthropic ระบุว่า AI จีนเหล่านี้มีการโจมตีแบบ Distillation Attack รวม ๆ แล้วกว่า 16 ล้านบทสนทนา มีหลักการทำงานคล้าย ๆ กันคือ สร้างบัญชีออกมาเยอะ ๆ แล้วดูดเอาข้อมูลจาก Claude ให้ได้มากที่สุดก่อนจะโดนแบน

อินทผาลัม (Dates) ทำไมถึงถูกเรียกว่า “Super Food”?

อินทผาลัม (Dates) ทำไมถึงถูกเรียกว่า “Super Food”?

ทำไมอินทผาลัมถึงเป็น Super Food? สรุป 5 คุณประโยชน์จากผลไม้ทะเลทรายที่อัดแน่นด้วยพลังงานและแร่ธาตุ พร้อมข้อควรแนะนำในการทาน

Portabase

Portabase

Portabase เป็น แพลตฟอร์มสำรองข้อมูล (backup) และกู้คืน (restore) สำหรับฐานข้อมูลที่ให้คุณ

Sleep Hygiene & Blue Light: แสงสีฟ้าไม่ได้เลวร้ายเสมอไป?

Sleep Hygiene & Blue Light: แสงสีฟ้าไม่ได้เลวร้ายเสมอไป?

แสงสีฟ้าทำให้นอนไม่หลับจริงหรือ? บทความนี้อธิบายผลของ Blue Light ต่อ Circadian Rhythm และ Melatonin พร้อมวิธีปรับ Sleep Hygiene เพื่อการนอนที่มีคุณภาพมากขึ้น