فناوری OCR چیست و چه کاربردهایی دارد؟
گاهی اوقات ممکن است به یک دست نوشته و یا سند تایپی بر بخورید که بخواهید یک نسخه دیجیتالی از آن را در اختیار داشته باشید، اولین راهی که به ذهنتان میرسد تایپ آن توسط اپراتور است که این خود کار زمانبری است، اما فناوری OCR به شما این امکان را میدهد که صفحات حاوی متنی که اسکن کردهاید را از فرمت عکس به متن تبدیل کنید. در اینجا شما را بیشتر با این فناوری آشنا می کنیم، با ما همراه باشید:
OCR چیست؟
بعد از آنکه تصویر حاوی متن را اسکن میکنیم، رایانه پردازشی را بر روی تصویر انجام میدهد. ابتدا تصویر را به قسمتها یا پارتیشنهای مجزا تقسیم میکند. فناوری OCR بعد با استفاده از الگوریتمهای پردازش تصویر و هوش مصنوعی حروف کاراکترهایی را از درون متن استخراج میکند. اما ممکن است متن شما هنگام عکسبرداری چرخیده باشد. در نتیجه کامپیوتر عکس را چند درجه میچرخاند و باز عمل قبل را بر روی آن انجام میدهد و نتیجه را به دست میآورد.
برخی مطالب مرتبط:
روش تحلیل و اولویت بندی MOSCOW چیست و چه کاربردی دارد؟
سامانه آموزش مجازی ابری چه مزایایی دارد؟
حافظه ssd چیست ؛ چه انواع و کاربردی دارد؟
ویندوز سرور چیست و با ویندوز عادی چه تفاوتی دارد؟؛ پادکست
هارد nvme چیست ، چه انواع و مزایا و معایبی دارد؟
OCR چگونه کار میکند؟
اگر روند کار OCR را به صورت یک جعبه سیاه در نظر بگیریم، تصویر اسناد مورد نظر ورودی آن و خروجی آن فایل متنی دیجیتالی (مثلاً به فرمت MS- Word) از متن سند است.
تصویر زیر روند کار OCR را با به طور دقیقتر نشان می دهد.
با دریافت تصویر یک سند، ابتدا فرآیند، تحلیل محتوا فناوری OCR میشود و نواحی مختلف اطلاعاتی در تصویر شناسایی میشوند. شکل زیر نمونهای از تصویر یک سند را نشان میدهد که شامل ۳ نوع ناحیه مختلف است: ناحیه متنی، ناحیه تصویری و ناحیه جدول.