OCR คืออะไร? แปลง pdf เป็น doc ภาษาไทยได้อย่างไร

OCR ย่อมาจาก Optical Character Recognition คือเทคโนโลยีที่ทำให้คอมพิวเตอร์สามารถ "อ่าน" ตัวอักษรจากรูปภาพหรือเอกสารที่ scan มาได้ แล้วแปลงให้เป็นข้อความดิจิทัลที่แก้ไข คัดลอก และค้นหาได้ ซึ่งเป็นประโยชน์อย่างมากในการทำงานกับเอกสารจำนวนมาก

OCR ทำงานอย่างไร?

กระบวนการ OCR แบ่งออกเป็นหลายขั้นตอน ได้แก่

Pre-processing — ปรับความสว่าง คอนทราสต์ และแก้ความเอียงของภาพ
Segmentation — แบ่งพื้นที่ภาพออกเป็นบรรทัด คำ และตัวอักษร
Recognition — เปรียบเทียบรูปทรงของแต่ละตัวอักษรกับฐานข้อมูลภาษา
Post-processing — ตรวจสอบคำที่ได้ว่าอยู่ในพจนานุกรมและมีความสมเหตุสมผล

Tesseract.js ทำทุกขั้นตอนนี้ในเบราว์เซอร์ของคุณ ไม่ต้องส่งข้อมูลออกไปไหน

ทำไม pdf บางไฟล์ถึงคัดลอกข้อความไม่ได้?

pdf มี 2 ประเภทหลัก

Text-based pdf — สร้างจากโปรแกรมอย่าง Microsoft Word, Google Docs หรือ Adobe Acrobat มีข้อมูลตัวอักษรฝังอยู่ในไฟล์ คัดลอกได้ทันที ไม่จำเป็นต้องใช้ OCR
Image-based pdf — ได้จากการ scan เอกสารกระดาษหรือถ่ายรูปแล้วบันทึกเป็น pdf จริงๆ แล้วเป็นแค่รูปภาพที่ห่อไว้ใน pdf ไม่มีข้อความดิจิทัล ต้องใช้ OCR ถึงจะดึงข้อความออกมาได้

วิธีตรวจสอบว่า pdf ของคุณเป็นแบบไหน ลองเลือกข้อความในไฟล์ด้วยเมาส์ ถ้าเลือกได้คือ Text-based ถ้าเลือกไม่ได้คือ Image-based และต้องใช้ OCR

pdf Plaster ใช้ Tesseract.js

Tesseract เป็น OCR engine ที่ HP พัฒนาตั้งแต่ปี 1985 และ Google เข้ามาพัฒนาต่อตั้งแต่ปี 2006 ปัจจุบันเป็น open source ที่คนทั่วโลกใช้งาน pdf Plaster ใช้ Tesseract.js ซึ่งเป็นเวอร์ชัน JavaScript ที่คอมไพล์ด้วย WebAssembly ทำงานในเบราว์เซอร์ได้โดยตรงโดยไม่ต้องพึ่งเซิร์ฟเวอร์ใดๆ

ภาษาที่รองรับ

🇹🇭 ไทย + อังกฤษ (แนะนำ)

🇨🇳 จีนตัวย่อ + อังกฤษ

🇯🇵 ญี่ปุ่น + อังกฤษ

🇰🇷 เกาหลี + อังกฤษ

🇫🇷 ฝรั่งเศส + อังกฤษ

🇬🇧 อังกฤษเท่านั้น

วิธีใช้งานทีละขั้นตอน

เปิด pdf Plaster แล้วเลือกเครื่องมือ pdf ↔ doc
กดแท็บ pdf → doc (OCR)
ลากวางหรือกด เลือกไฟล์ pdf
รอให้ระบบโหลด pdf และแสดงจำนวนหน้า
เลือกความละเอียด OCR — แนะนำ 220 DPI สำหรับงานทั่วไป
เลือกภาษาหลักของเอกสาร เช่น "ไทย + อังกฤษ" สำหรับเอกสารภาษาไทยที่มีคำศัพท์ภาษาอังกฤษปน
ตั้งชื่อไฟล์ doc ที่ต้องการ
กด แปลง pdf → doc ด้วย OCR
ดูความคืบหน้าทีละหน้าในแถบสถานะ
ดาวน์โหลดไฟล์ docx เมื่อประมวลผลเสร็จ

เลือกความละเอียด DPI อย่างไร?

DPI ที่สูงขึ้นทำให้รูปภาพที่ระบบแปลงเพื่อ OCR มีความละเอียดสูงขึ้น ส่งผลให้แม่นยำขึ้นแต่ใช้เวลานานขึ้น

150 DPI — เร็วที่สุด เหมาะสำหรับเอกสารที่ตัวหนังสือใหญ่ชัดเจน เช่น หนังสือหรือใบปลิว
220 DPI — แนะนำสำหรับการใช้งานทั่วไป สมดุลระหว่างความเร็วและความแม่นยำ เหมาะกับเอกสารสำนักงานส่วนใหญ่
300 DPI — แม่นยำสูงสุด เหมาะสำหรับเอกสารที่ตัวหนังสือเล็ก ตารางซับซ้อน หรือภาพ scan คุณภาพสูง ใช้เวลานานขึ้นสองเท่า

ลองแปลง pdf เป็น doc ฟรีเลย →

ข้อควรทราบเพื่อผลลัพธ์ที่ดีที่สุด

ความแม่นยำขึ้นอยู่กับ คุณภาพของ pdf ต้นฉบับ เป็นอย่างมาก ยิ่งภาพชัดยิ่งได้ผลดี
เอกสารที่ scan เอียงมากกว่า 5 องศาอาจทำให้บรรทัดข้อความปนกัน
ตัวอักษรมือเขียนยังไม่รองรับ OCR ใช้ได้กับตัวพิมพ์เท่านั้น
เอกสารที่มีพื้นหลังสีหรือลายน้ำอาจลดความแม่นยำลงได้
สำหรับเอกสารที่มีทั้งภาษาไทยและอังกฤษ เลือก "ไทย + อังกฤษ" เสมอ ไม่ใช่แค่ภาษาใดภาษาหนึ่ง

กรณีใช้งานที่พบบ่อย

สแกนสัญญาเก่า — แปลงเป็น doc เพื่อค้นหาข้อความหรือแก้ไขเงื่อนไข
เอกสารราชการที่ได้จากการ scan — แปลงเพื่อนำข้อความไปใส่ในฟอร์มอื่น
ตำราเรียนเก่า — แปลงเพื่อทำ e-book หรือค้นหาเนื้อหาได้ง่ายขึ้น
ใบเสนอราคาหรือใบแจ้งหนี้ — ดึงตัวเลขและข้อมูลมาใส่ spreadsheet
บทความหรืองานวิจัย — แปลงเพื่อ quote หรือนำไปอ้างอิงต่อ

เปรียบเทียบกับโปรแกรมอื่น

Adobe Acrobat Pro — OCR แม่นยำมาก แต่ค่าสมัครสมาชิกแพง ต้องติดตั้งโปรแกรม

ABBYY FineReader — เกรดมืออาชีพ แม่นยำสูง แต่ราคาสูง

Google Drive OCR — ฟรี ต้องอัปโหลดไฟล์ขึ้น Google Cloud

pdf Plaster — ฟรี 100% ไม่อัปโหลดไฟล์ รองรับภาษาไทย ทำงานในเบราว์เซอร์

คำถามที่พบบ่อย

ข้อมูลในเอกสารของฉันปลอดภัยไหม?
ปลอดภัย 100% กระบวนการ OCR ทั้งหมดทำงานในเบราว์เซอร์ ไฟล์ไม่ออกจากเครื่องของคุณ

ผลลัพธ์ที่ได้จะเหมือนต้นฉบับทุกอย่างไหม?
ไฟล์ docx ที่ได้จะมีข้อความที่อ่านออกมาได้ แต่รูปแบบการจัดหน้า ตาราง หัวข้อ และกราฟิกซับซ้อนอาจต้องปรับเพิ่มเติมด้วยตัวเอง

OCR ใช้เวลานานไหม?
ขึ้นอยู่กับจำนวนหน้าและ DPI ที่เลือก โดยเฉลี่ย 5–15 วินาทีต่อหน้า ที่ 220 DPI pdf 10 หน้าใช้เวลาประมาณ 1–2 นาที

ทำไมข้อความที่ได้ผิดพลาด?
สาเหตุหลักคือต้นฉบับไม่ชัด ตัวหนังสือเล็กเกินไป หรือ scan เอียง ลองเพิ่ม DPI เป็น 300 หรือหากเป็นไปได้ให้ scan ต้นฉบับใหม่ที่ความละเอียดสูงกว่า

รองรับ pdf กี่หน้า?
ไม่มีขีดจำกัด แต่แนะนำไม่เกิน 30–50 หน้าต่อครั้งเพื่อประสิทธิภาพที่ดีและหลีกเลี่ยงเบราว์เซอร์ค้าง

ไฟล์ docx ที่ได้เปิดด้วยโปรแกรมอะไรได้บ้าง?
เปิดได้ด้วย Microsoft Word, Google Docs, LibreOffice Writer, Pages บน Mac และแอปอื่นๆ ที่รองรับรูปแบบ docx