OCRเป็นตัวย่อสำหรับOptical Character ยอมรับ, การแสดงออกในภาษาอังกฤษที่สามารถแปลว่าOptical Character ยอมรับ ความคิดที่จะใช้ในวิทยาการคอมพิวเตอร์เพื่อชื่อขั้นตอนที่ช่วยให้ข้อความเพื่อแปลงเป็นข้อมูลดิจิทัลผ่านเป็นสแกนเนอร์
อะไร OCR ทำให้เป็นไปได้ก็คือว่าเมื่อผ่านข้อความผ่านอุปกรณ์บางอย่างระบบตระหนักถึงตัวอักษรที่เป็นส่วนหนึ่งของตัวอักษรด้วยวิธีนี้เอกสารที่สแกนสามารถแก้ไขได้ด้วยโปรแกรมประมวลผลคำเนื่องจากไม่ได้จัดเก็บเป็นรูปภาพ
ด้วยวิธีนี้OCRอำนวยความสะดวกในการทำงานที่หลาย ๆคนต้องทำ หากมีคนสแกนหนังสือด้วยความตั้งใจที่จะทำสรุปด้วยOCR พวกเขาจะสามารถโต้ตอบกับข้อความที่สแกนผ่านโปรแกรมเช่นMicrosoft Wordการตัดการคัดลอกและการวางคำใด ๆ สิ่งที่เป็นไปไม่ได้หากไม่ดำเนินการตามขั้นตอนการจดจำดังกล่าว เนื่องจากคอมพิวเตอร์ไม่สามารถเข้าใจข้อความที่อยู่ในรูปภาพได้
นอกเหนือจากข้อได้เปรียบที่ชัดเจนของการจัดเก็บข้อความเช่นนี้และไม่ใช่ภาพแล้วยังมีน้ำหนักที่แตกต่างกันอย่างมาก: รูปภาพสามารถใช้พื้นที่ดิสก์ได้มากกว่าข้อความและสิ่งนี้จะต้องนำมาพิจารณาหากคุณต้องการมีหนังสือ สแกนจำนวนเต็ม แน่นอนว่าไม่แนะนำให้คอมพิวเตอร์ทำการ OCR ในทุกกรณีโดยเฉพาะอย่างยิ่งหากไม่มีเจตนาในการแก้ไขเนื้อหา
เป็นที่น่าสงสัยว่ามีเพียงแอปพลิเคชั่นเดียวเท่านั้นที่สามารถเปลี่ยนความจุของคอมพิวเตอร์เครื่องเดียวกันได้อย่างมาก แต่มันก็เป็นสิ่งที่เกิดขึ้นในทุกกรณีแม้ว่าโปรเซสเซอร์สมัยใหม่จะมีประสิทธิภาพมากโดยเฉพาะเมื่อรวมกับความทรงจำและดิสก์ที่ล้ำสมัย มันไร้ประโยชน์หากไม่มีโปรแกรมที่เหมาะสมซึ่งเป็นสาเหตุที่ทำให้เครื่องเดียวกันนี้สามารถเปลี่ยนจากการไร้ประโยชน์ไปสู่ขั้นสูงได้เพียงเพราะซอฟต์แวร์ที่มี
แม้จะมีความก้าวหน้าของเทคโนโลยีแต่OCRก็ยังประสบปัญหาต่างๆ ตัวอย่างเช่นการทำให้ระบบดิจิทัลจดจำข้อความที่เขียนด้วยลายมือนั้นค่อนข้างยาก กระบวนการนี้มักไม่สะดวกในการแบ่งส่วนหน่วยข้อความต่างๆ สิ่งเดียวกันนี้จะเกิดขึ้นเมื่อคำปรากฏใกล้กัน
ข้อบกพร่องอื่น ๆ ของOCRอาจปรากฏขึ้นเมื่อมีความคมชัดระหว่างคำกับพื้นหลังไม่เพียงพอ สมมติว่าข้อความที่เขียนด้วยตัวอักษรสีดำถูกพิมพ์ลงบนแผ่นสีเทากระบวนการOCRอาจไม่สามารถแยกความแตกต่างระหว่างตัวอักษรและคำได้
อย่าลืมว่าการกระทำที่ดูเรียบง่ายเหมือนกับการเดินไปตามถนนนั้นจำเป็นต้องมีการดำเนินการเสริมเพื่อหลีกเลี่ยงอุปสรรคและปกป้องความสมบูรณ์ของเราการอ่านข้อความที่พิมพ์ออกมานั้นเป็นผลมาจากงานการจดจำหลายอย่างพร้อมกันซึ่งเราดำเนินการ ดำเนินการโดยไม่รู้ตัว แต่เราทำงาน
เมื่อต้องเผชิญกับข้อความระบบ OCR ของเรามีหน้าที่ในการค้นหาและจดจำชื่อเรื่องการระบุย่อหน้าเครื่องหมายวรรคตอนช่องว่างระหว่างคำและตัวย่อรวมถึงองค์ประกอบอื่น ๆ นอกเหนือจากการพยายามทำความเข้าใจแหล่งที่มา หรูหราเกินไปหรือไม่เป็นระเบียบและเพื่อกรอกข้อมูลในพื้นที่ที่ประสบปัญหาการสึกหรอทุกประเภทเช่นคราบหมึกหรือเศษกระดาษหายไป