مقدمه
سیستم پلاک خوان یکی از مهترین سیستم ها در کنترل ترافیک است که با استفاده از میتوان رانندگان متخلف و نوع خلاف را ثبت کرد.
عملکرد این سیستم به گونه ای است که با استفاده از دوربین های مخصوصی که در سطح شهر و اتوبان ها قرار داده شده اند و برنامه تشخیص تخلف از لحظاتی که در آنها تخلفی صورت گرفته عکس برداری شده و سیستم تشخیص محل پلاک خودرو محل پلاک را بدست آورده و در اختیار سیستم پلاک خوان که موضوع این پروژه میباشد قرار میدهد و این سیستم اعداد و حروف پلاک را استخراج کرده و برای فرد متخلف جریمه ثبت شود.هدف اصلی این پروژه مکانیزه کردن که علاوه بر کاهش نیروی انسانی و کاهش هزینه ها افزایش دقت و سرعت در تصمیم گیری و انجام کارها است.
علاوه بر هدف اصلی که ذکر شد از این سیستم میتوان در سیستم های دیگر مانند پارکینگ های عمومی و یا خصوصی استفاده کرد.در پارکینگ های عمومی میتوان با تشخیص شماره پلاک ساعت ورود را در سیستم ذخیره کرده و در هنگام خروج مدت زمان حضور در پارکینگ معلوم گردد و دیگر نیازی به ثبت توسط نیروی انسانی نیست.همچنین میتوان با ذخیره کردن پلاک ماشین ها برای مدت خاصی یک پایگاه داده ایجاد کرد و در مسایل امنیتی از آن استفاده نمود.در پارکینگ های خصوصی نیز میتوان از این جهت در این سیستم استفاده کرد که پلاک خودرو های افراد ساختمان در سیستم ذخیره شود و هنگامی که خودرویی با یکی از پلاک های ذخیره شده در مقابل دوربین قرار گرفت درب پارکینگ باز شده و دیگر نیازی به استفاده از دستگاه کنترل از راه نباشد.
الگوریتم مورد استفاده در این پروژه از دو قسمت تشکیل شده است.
- تفکیک اعداد و حروف
- تشخیص اعداد و حروف
جهت تفکیک اعداد از تصویر که به صورت باینری تبدیل شده برای تشخیص هر عدد ابتدا از پایین سمت چپ شروع کرده و به سمت راست حرکت میکنیم.هرگاه به مقداری برابر با مقدا شروع رسیدیم پهنای باند طی شده را محاسبه میکنیم.اگر از مقدار از پیش تعیین شده بیشتر باشد مقدار اولیه جهت شروع عملیات را افزایش داده و عملیات را تکرار میکنیم.حال حال اگر از مقدار اولیه کمتر یا مساوی بود این دو نقطه مرز ابتدایی و انتهایی عدد اول از سمت چپ را مشخص میکند.سپس همین روش را برای بقیه تصویر انجام میدهیم تا در نهایت هشت عدد بدست بیاوریم. اگر تمام مراحل انجام شده ولی کمتر از هشت عدد بدست آمد آنگاه پهنای باند را کمتر در نظر میگیریم و مراحل قبل را دوباره تکرار میکنیم. از نقاط ضعف این الگوریتم میتوان به این اشاره کرد که در بعضی موارد یه عدد نصف شده و یا دو عدد به عنوان یک عدد نمایش داده میشوند. در تشخیص اعداد که ورودی آن اعداد جدا شده از قسمت قبل است,توسط الگوریتمی ورودی ها به شبکه عصبی داده شده و آنگاه شبکه عصبی تصویر داده شده را با تصاویر داخل پایگاه داده خود که هنگام آموزش آنها را دریافت و دسته بندی کرده است تطبیق داده و پس از الگوریتم های درونیابی,تقریب و تصمیم,بیشترین احتمال اینکه به کدام عدد نزدیک تر است را به عنوان خروجی قرار خواهد داد. برای آنکه از اشتباهات احتمالی جلوگیری شود,در قسمت آموزش میبایست از بانک اطلاعاتی کاملی استفاده کرد. از عوامل ایجاد خطا در این سیستم میتوان به این اشاره کرد که در بعضی موارد عکس ها تار هستند و یا در پلاک نویز وجود دارد که احتمال تشخیص صحیح را کاهش میدهند.
کارهای مرتبط
همانطور که در مقدمه ذکر شد،مرحله اول خواندن پلاک خودرو تفکیک حروف و اعداد پلاک میباشد.برای تفکیک ابتدا لازم است که پلاک در شرایط مناسبی قرار گیرد.برای مثال ممکن است به دلایل مختلفی مانند اتصال نامناسب روی خودرو،پلاک نسبت به افق دارای زاویه باشد و در نتیجه حروف و اعداد دارای زاویه باشند و تشخیص آنها مشکل باشد و از احتمال درست تشخیص دادن کاسته شود.از مشکلات دیگر میتوان به وجود نویز در پلاک اشاره کرد که در تشخیص حروف اخلال ایجاد میکند. برای برطرف کردن این مشکلات از الگوریتم های GaussianBlur و threshold استفاده میکنیم. با استفاده از الگوریتم اول نویز های احتمالی پلاک تا کاهش داده و با استفاده از الگوریتم threshold عکس را به صورت باینری تبدیل میکنیم.باینری کردن تصاویر انواع مختلفی دارد که عبارتند از :- Threshold Binary
- Inverted Threshold Binary
- Truncate
- Threshold to Zero
- Inverted Threshold to Zero
- OTSU Threshold
به دلیل اینکه تصاویر به صورت خودکار گرفته شده و خودرو ها در حال حرکت هستند،در بسیاری از موارد تصاویر شرایط مناسبی جمله نور مناسب را نخواهند داشت.به همین دلیل در این پروژه از نوع otsu_thresholding استفاده شده است،زیرا این الگوریتم تصویر را به صورت محلی به صورت باینری تبدیل میکند و از مشکلاتی مانند سیاه شدن کامل قسمتی از تصویر به دلیل نا مناسب بودن نور جلوگیری میکند.
تصویر اولیه همراه با نویز |
تصویر نتیجه با الگوریتم Blur |
تصویر نتیجه با الگوریتم Otsu Threshold |
با توجه به نتیجه تصویری که با استفاده از الگوریتم otsu threshold بدست آمده است،مشاهده میشود که نویز ها و علامت های اضافی که در پلاک بیشتر کشور ها وجود دارد،کمتر شده و یا از بین رفته اند. برای تفکیک حروف و اعداد از یکدیگر راه های مختلفی وجود.در روند این پروژه از سه الگوریتم مختلف استفاده شده است:
۱.با استفاده از کتابخانه pytesser
این کتابخانه که با استفاده با استفاده از opencv و OCR نوشته شده است و قابل استفاده میباشد،با استفاده از نمونه های بسیار آموزش دیده و قادر به تشخیص متون در تصاویر در زبان های تعریف شده با دقت بالایی میباشد.
تصویر ورودی |
نتیجه با استفاده از pytesser |
۲.با استفاده از کتابخانه CvBlob
این کتابخانه که توسط مایکروسافت در سال ۲۰۰۵ پیاده سازی شده و هماهنگ با opencv میباشد،در تصویر داده شده،تمامی لکه ها را پیدا کرده و آنها را با خط کشیدن نمایش میدهد.از مشکلات آن میتوان به این اشاره کرد که نویز های کوچک را نیز به عنوان لکه تشخیص داده و برای تشخیص حروف و اعداد میبایست تمامی آنها را امتحان نمود و پردازش این قسمت کمی بیشتر میشود.
تصویر ورودی |
نتیجه با استفاده از cvblob |
۳.تفکیک با استفاده از تراکم
الگوریتم مورد استفاده در این قسمت به این صورت است که از سمت چپ تصویر شروع کرده و به سمت راست حرکت میکنیم.برای تشخیص هر حرف یا عدد به این صورت عمل میکنیم که هنگامی که رنگی مخالف با رنگ پس زمینه نمایان شد،آن مکان را نقطه شروع حرف در نظر گرفته و هنگامی که تراکم رنگ مخالف به صفر رسید،به عنوان نقطه پایان آن حرف علامت گذاری میکنیم.با توجه به تعداد حرف و عدد خاص در هر کشور،با توجه به پلاک مورد نظر این الگوریتم را تکرار میکنیم تا تمامی حروف جدا شوند و از جدا شدن تکه های اضافی جلوگیری شود.
تصویر ورودی |
حروف و اعداد به صورت تفکیک شده |
۴.استفاده از خوطوط تصویر
در این روش تمامی خطوط داخل تصویر را در نظر گرفته،سپس مستطیل هایی که محاط بر این خطوط هستن جمع آوری میکنیم.برای کاهش مستطیل های اضافی که در اطراف نویز ها قرار دارند،شرطی مانند حداقل طول و عرض قابل قبول قرار داده و تعدادی از آنها را حذف میکنیم.
تصویر ورودی |
پیدا کردن محل حروف و اعداد |
تشخیص اعداد
پس از تفکیک کردن اعداد با استفاده از الگوریتم های مختلف،در مرحله دوم و پایانی می بایست به تشخیص اعداد و حروف تفکیک شده بپردازیم.همانند مرحله اول این مرحله نیز را میتوان با استفاده از روش های مختلفی انجام داد که در زیر به دو روش اصلی آن میپردازیم. در روش اول با استفاده از دیتابیس های آماده که شامل تعداد بسیاری از تصویر اعداد و حروف هستند و پردازش تصویر،فایل ها را به هش کد تبدیل کرده و در یک Dictionary ذخیره میکنیم و با استفاده از حرف و عدد مورد نظر قابل دسترسی هستن.از مشکلات این روش این است که اگرچه حالت هایی که به هش کد تبدیل میشود،اما با کوچکترین تغییر هش کد بدست آمده تغییر میکند و در حالت های آموزش داده شده یافت نشود. در روش دوم که در این پروژه نیز از این روش استفاده شده،به این صورت است که همه اعداد تفکیک شده از پلاک های نمونه جدا کرده و ذخیره میکنیم.سپس در حالت آموزش به کاربر نمایش داده و عدد و حرف متناظر را بدست می آوریم.برای ذخیره آموزش به این صورت عمل میکنیم که تصاویر را به سایز خاصی (مانند ۱۰x۱۰ ) تبدیل کرده و با این دید که این تصویر تبدیل شده همانند یک ماتریس ۱۰x۱۰ میباشد،برای ذخیره راحت تر،آن را به ماتریس ۱x۱۰۰ تبدیل کرده و مانند روش اول در ساختما داده Dictionary ذخیره کرده.به دلیل آنکه در این روش تصویر به هش کد تبدیل نشده،میتوان ماتریس بدست آمده در حالت استفاده را با درصد خطایی مشخص با ماتریس های بدست آمده در آموزش تطبیق داد.
ارزیابی
در ارزیابی انجام شده در با استفاده از نمونه های بدست آماده،بیش از ۷۵٪ نمونه ها را به صورت کامل و درست تشخیص داده میشود.در بیشتر نمونه های تشخیص غلط نیز مشکل در تعداد کم یا زیاد تعداد حروف است دلیل این مشکل این است که سعی شده است در این پروژه هرگونه پلاک با حروف لاتین تشخیص داده شود و محدود به کشور و یا استاندارد خاصی نباشد.به همین دلیل نمیتوان با تعداد اعداد تشخیص داده شده،کد به این نتیجه برسد که در تشخیص مشکل داشته و اقدام به تغییر پارامتر ها کند. لینک پروژه در گیت هاب در پایان مطلب موجود میباشد.در زیر نیز قسمتی از نتیجه و نمونه ها آورده شده است
تعدادی از نمونه های استفاده شده |
نمونه ای از خروجی برنامه |
مراجع
- Pishchulin, L. (2010). Matching Algorithms for Image Recognition.
- Of, F., & Technology, I. (2007). BRNO UNIVERSITY OF TECHNOLOGY PRINCIPLES OF AUTOMATIC NUMBER PLATE.
</ul>
</p>