การบีบอัดไฟล์ PDF
ไฟล์ PDF มักมีขนาดใหญ่เมื่อประกอบด้วยภาพที่สแกนมา รูปภาพที่ฝังอยู่ หรือตัวอักษรขนาดใหญ่ เครื่องอัดข้อมูลนี้จะทำการเข้ารหัสภาพภายในไฟล์ PDF (ซึ่งมักเป็นสาเหตุหลักของขนาดไฟล์ที่ใหญ่) ใหม่โดยใช้รูปแบบ JPEG หรือ JPEG2000 ที่ระดับคุณภาพที่กำหนด แยกส่วนของตัวอักษรที่ฝังไว้เพื่อให้เก็บเฉพาะอักขระที่ใช้งานจริง และลบทรัพยากรที่ซ้ำกันออกไป ผลการประหยัดโดยทั่วไปอยู่ที่ 40–80% สำหรับไฟล์ที่มีภาพมาก และ 20–40% สำหรับไฟล์ที่มีข้อความมาก
กลไกการทำงานของระบบการบีบอัด
-
1
อัปโหลดไฟล์ PDF
เอกสารใดๆ ก็ตามที่ไม่เกินขีดจำกัดขนาดมาตรฐานสำหรับการใช้งานออนไลน์
-
2
เลือกระดับคุณภาพ
สูง (การบีบอัดต่ำ ใกล้เคียงกับสภาพเดิม) ปานกลาง (สมดุล) ต่ำ (การบีบอัดสูงสุด)
-
3
การเข้ารหัสภาพใหม่
ภาพที่ฝังไว้จะถูกบีบอัดใหม่ในคุณภาพที่เลือก
-
4
การแบ่งกลุ่มตัวอักษร
ฟอนต์แบบฝังจะเก็บเฉพาะไกล์ฟที่ใช้จริงในเอกสารเท่านั้น
-
5
การกำจัดข้อมูลซ้ำในทรัพยากร
ภาพที่ปรากฏซ้ำๆ (เช่น โลโก้บนทุกหน้า) จะถูกจัดเก็บเพียงครั้งเดียวและใช้เป็นอ้างอิงในภายหลัง
-
6
ดาวน์โหลดไฟล์ที่ถูกบีบอัด
เปรียบเทียบขนาดก่อนและหลังในหน้าผลลัพธ์
อัตราส่วนการอัดโดยทั่วไป
| รูปแบบไฟล์ PDF | ก่อน | หลัง (ขนาดกลาง) | การประหยัด |
|---|---|---|---|
| สัญญาที่ถูกสแกน (ความละเอียด 300 dpi) | ขนาดไฟล์ 25 เมกะไบต์ | ขนาดไฟล์ 4 เมกะไบต์ | อัตราการแปลงข้อมูล 84% |
| แคตตาล็อกที่มีรูปภาพจำนวนมาก | 40 เมกะไบต์ | 12 เมกะไบต์ | 70% |
| รายงานแบบผสมผสาน (ข้อความ + แผนภูมิ) | 8 เมกะไบต์ | 3.5 เมกะไบต์ | 56% |
| หนังสือแบบข้อความเท่านั้น | 2 เมกะไบต์ | 1.6 เมกะไบต์ | 20% |
| ใบแจ้งหนี้แบบดิจิทัล | 200 KB | 180 KB | 10% |
ไฟล์ PDF ที่สร้างขึ้นในรูปแบบดิจิทัล (ส่งออกโดยตรงจาก Word, InDesign หรือผ่านเครื่องมือแปลงเว็บเป็น PDF) มีประสิทธิภาพค่อนข้างสูงอยู่แล้ว ในขณะที่ไฟล์ PDF ที่สแกนมาใหม่ยังมีโอกาสในการปรับปรุงประสิทธิภาพได้อีกมาก
การตั้งค่าคุณภาพ – อธิบาย
- ระดับสูง (การบีบอัดต่ำสุด): คุณภาพ JPEG ระดับ 85–95 โดยไม่มีการลดขนาดภาพ รูปลักษณ์เหมือนภาพต้นฉบับอย่างสมบูรณ์ และโดยทั่วไปสามารถประหยัดค่าใช้จ่ายได้ประมาณ 10–30%
- ระดับปานกลาง (สมดุล): คุณภาพ JPEG ระดับ 70–80 และการลดความละเอียดของภาพที่ 200 dpi ภาพยังคงแสดงผลได้อย่างคมชัดบนหน้าจอ แต่อาจมีร่องรอยบกพร่องเล็กน้อยเมื่อซูมเข้าใกล้
- ระดับต่ำ (การบีบอัดสูงสุด): คุณภาพ JPEG ระดับ 50–65 และการลดความละเอียดลง 150 dpi จะทำให้คุณภาพของภาพลดลงอย่างเห็นได้ชัด แต่ข้อความยังสามารถอ่านได้ โดยช่วยประหยัดไฟล์ PDF ที่มีภาพจำนวนมากได้ถึง 60–85%
สิ่งใดที่ถูกบีบอัด
- ภาพถ่ายสี — การเข้ารหัสใหม่ในรูปแบบ JPEG โดยมีการปรับคุณภาพ
- ภาพวาดแบบเส้นและภาพสแกน: ใช้ JBIG2 หรือ CCITT Group 4 สำหรับภาพสแกนแบบบิตอนัล (ใกล้เคียงกับคุณภาพแบบไม่สูญเสียข้อมูลสำหรับภาพสแกนข้อความขาวดำ)
- ฟอนต์ที่ฝังอยู่ — จำกัดเฉพาะอักขระที่ใช้งานจริง
- ความโปร่งใสและระดับความเข้มข้น – ทำให้โครงสร้างเรียบหรือเรียบง่ายลงในกรณีที่เหมาะสม
- ภาพที่ซ้ำกัน — จัดเก็บเพียงครั้งเดียว แต่ถูกอ้างอิงหลายครั้ง
สิ่งที่ไม่สามารถบีบอัดได้
- กราฟิกแบบเวกเตอร์: มีขนาดกะทัดรัดอยู่แล้ว จึงไม่สามารถเพิ่มประสิทธิภาพได้อย่างมีนัยสำคัญ
- เนื้อหาข้อความ: มีขนาดเล็กมากเมื่อเทียบกับสตรีมข้อความที่ถูกจัดเก็บไว้แล้ว
- ฟิลด์แบบโครงสร้าง บุ๊กมาร์ก และเมตาดาต้า – ยังไม่มีการเปลี่ยนแปลงใดๆ
คำแนะนำเกี่ยวกับขีดจำกัดการส่งอีเมลและการอัปโหลดไฟล์
| เป้าหมาย | ขีดจำกัดของไฟล์ PDF โดยทั่วไป |
|---|---|
| ไฟล์แนบในจีเมล | ขนาด 25 เมกะไบต์ |
| ไฟล์แนบจาก Outlook | ขนาด 20 เมกะไบต์ |
| ไฟล์จาก WhatsApp | ขนาด 100 เมกะไบต์ |
| ข้อความจาก LinkedIn | ขนาด 20 เมกะไบต์ |
| แบบฟอร์มอัปโหลดผ่านเว็บส่วนใหญ่ | 10 เมกะไบต์ (อาจแตกต่างกัน) |
การบีบอัดไฟล์ให้เหลือขนาดไม่เกิน 5 เมกะไบต์จะช่วยให้มีพื้นที่ว่างเพียงพอสำหรับอีเมลและไฟล์ส่วนใหญ่ที่ต้องอัปโหลด
กรณีที่ไม่ควรบีบอัด
- สำเนาสำหรับเก็บรักษา: จัดเก็บต้นฉบับที่ไม่ได้บีบอัด; ให้บีบอัดเฉพาะเพื่อการแจกจ่ายเท่านั้น
- ไฟล์ PDF ที่พร้อมพิมพ์: ไม่ควรบีบอัดไฟล์เพิ่มเติม ให้คงคุณภาพเดิมไว้
- เอกสารที่มีความสำคัญทางกฎหมาย: การบีบอัดอาจทำให้รูปลักษณ์ของเอกสารเปลี่ยนไป ดังนั้นควรเก็บสำเนาของเอกสารไว้ในรูปแบบเดิมโดยไม่ผ่านการบีบอัด
คำถามที่พบบ่อย
ข้อความในไฟล์ PDF มักถูกจัดเก็บในรูปแบบของตัวอักษรจริง (glyphs) ไม่ใช่ภาพ ดังนั้นคุณภาพของข้อความจึงไม่ได้รับผลกระทบจากการบีบอัดภาพ เฉพาะเมื่อไฟล์ PDF เป็นภาพสแกนที่แต่ละหน้าเป็นภาพเท่านั้น ความสามารถในการอ่านข้อความจึงขึ้นอยู่กับระดับการบีบอัด
คุณภาพระดับปานกลางมักเป็นตัวเลือกที่เหมาะสมที่สุด โดยสามารถลดขนาดได้อย่างมาก (40–70%) พร้อมทั้งรักษาระดับคุณภาพไว้ให้น้อยที่สุด การเปลี่ยนไปใช้คุณภาพต่ำควรทำเฉพาะในกรณีที่ขนาดของผลิตภัณฑ์ระดับปานกลางไม่เพียงพอเท่านั้น
การบีบอัดสามารถเปลี่ยนแปลงข้อมูลภาพในระดับพิกเซลได้ ซึ่งมีความสำคัญเฉพาะในกรณีจำนวนน้อยมากเท่านั้น เช่น หลักฐานทางนิติวิทยาศาสตร์หรือการจำลองผลงานศิลปะ ส่วนสำหรับสัญญา รายงาน และเอกสารทั่วไป การบีบอัดจะไม่ส่งผลกระทบต่อเนื้อหาหรือความถูกต้องของการลงนาม
ใช่ แต่ควรคาดการณ์ว่าผลลัพธ์จะลดลงเรื่อยๆ การบีบอัดภาพ JPEG สองครั้งจะทำให้คุณภาพของภาพเสื่อมลงมากยิ่งขึ้นในทุกครั้ง ดังนั้นควรเริ่มต้นจากไฟล์ต้นทางที่ไม่ได้ถูกบีบอัดหากเป็นไปได้