מהו זיהוי תווים אופטי (OCR)?

זיהוי תווים אופטי (OCR) מתייחס לתוכנה שיוצרת גירסה דיגיטלית של מסמך מודפס, מודפס או בכתב יד שהמחשבים יכולים לקרוא ללא צורך להזין את הטקסט באופן ידני או להזין אותו. OCR משמש בדרך כלל במסמכים סרוקים בפורמט PDF , אך ניתן גם ליצור גרסת טקסט הניתנת לקריאה במחשב בתוך קובץ תמונה.

מהו OCR?

OCR, המכונה גם זיהוי טקסט, היא טכנולוגיית תוכנה אשר הופכת תווים כגון מספרים, אותיות וסימני פיסוק (הנקראים גם גליפים) ממסמכים מודפסים או כתובים לצורה אלקטרונית המוכרת בקלות רבה יותר וקוראת על ידי מחשבים ותוכנות אחרות. כמה תוכניות OCR לעשות את זה כמו מסמך נסרק או צולם עם מצלמה דיגיטלית ואחרים יכולים להחיל את התהליך על מסמכים אשר כבר סרקו בעבר או צולם ללא OCR. OCR מאפשר למשתמשים לחפש בתוך מסמכי PDF, לערוך טקסט ולעצב מחדש מסמכים.

מה זה OCR משמש?

עבור מהיר, כל יום סריקה הצרכים, OCR לא יכול להיות עניין גדול. אם אתה עושה כמות גדולה של סריקה, היכולת לחפש בתוך מסמכי PDF כדי למצוא את אחד בדיוק שאתה צריך יכול לחסוך לא מעט זמן עושה OCR פונקציונליות בתוכנית הסורק שלך חשוב יותר. הנה כמה דברים אחרים OCR עוזר עם:

מדוע להשתמש ב- OCR?

למה לא פשוט לצלם, נכון? כי אתה לא תוכל לערוך שום דבר או לחפש את הטקסט כי זה יהיה רק ​​תמונה. סריקת המסמך והפעלת תוכנת OCR יכולה להפוך את הקובץ למשהו שניתן לערוך ולהיות מסוגל לבצע חיפוש.

היסטוריה של OCR

למרות השימוש המוקדם ביותר של זיהוי טקסט התאריכים 1914, פיתוח רחב של השימוש והשימוש בטכנולוגיות הקשורות OCR החלה ברצינות בשנות החמישים, במיוחד עם יצירת גופנים פשוט מאוד, כי היה קל יותר להמיר טקסט קריא דיגיטלית. הראשון של גופנים אלה פשוט נוצר על ידי דוד שפרד הידוע בכינויו OCR-7B. OCR-7B עדיין בשימוש כיום בתעשייה הפיננסית עבור הגופן הסטנדרטי המשמש בכרטיסי אשראי וכרטיסי חיוב. בשנות ה -60 החלו שירותי הדואר במספר מדינות להשתמש בטכנולוגיית OCR כדי להאיץ את מיון הדואר, כולל ארצות הברית, בריטניה, קנדה וגרמניה. OCR היא עדיין הטכנולוגיה הליבה המשמש למיון דואר עבור שירותי הדואר ברחבי העולם. בשנת 2000, ידע מפתח של גבולות ויכולות של טכנולוגיית OCR שימש לפיתוח תוכניות CAPTCHA המשמשים כדי לעצור בוטים ו שולחי דואר זבל.

במהלך עשרות שנים, OCR גדל מדויק יותר מתוחכם יותר בשל התקדמות בתחומים טכנולוגיים קשורים כגון בינה מלאכותית , למידה מכונה , ראיית מחשב. כיום, תוכנת OCR משתמשת בזיהוי תבניות, זיהוי תכונות וכריית טקסט כדי להפוך מסמכים במהירות ובדייקנות רבה יותר מבעבר.