مقدمه

سیستم پلاک خوان یکی از مهترین سیستم ها در کنترل ترافیک است که با استفاده از میتوان رانندگان متخلف و نوع خلاف را ثبت کرد. عملکرد این سیستم به گونه ای است که با استفاده از دوربین های مخصوصی که در سطح شهر و اتوبان ها قرار داده شده اند و برنامه تشخیص تخلف از لحظاتی که در آنها تخلفی صورت گرفته عکس برداری شده و سیستم تشخیص محل پلاک خودرو محل پلاک را بدست آورده و در اختیار سیستم پلاک خوان که موضوع این پروژه میباشد قرار میدهد و این سیستم اعداد و حروف پلاک را استخراج کرده و برای فرد متخلف جریمه ثبت شود.هدف اصلی این پروژه مکانیزه کردن که علاوه بر کاهش نیروی انسانی و کاهش هزینه ها افزایش دقت و سرعت در تصمیم گیری و انجام کارها است.
علاوه بر هدف اصلی که ذکر شد از این سیستم میتوان در سیستم های دیگر مانند پارکینگ های عمومی و یا خصوصی استفاده کرد.در پارکینگ های عمومی میتوان با تشخیص شماره پلاک ساعت ورود را در سیستم ذخیره کرده و در هنگام خروج مدت زمان حضور در پارکینگ معلوم گردد و دیگر نیازی به ثبت توسط نیروی انسانی نیست.همچنین میتوان با ذخیره کردن پلاک ماشین ها برای مدت خاصی یک پایگاه داده ایجاد کرد و در مسایل امنیتی از آن استفاده نمود.در پارکینگ های خصوصی نیز میتوان از این جهت در این سیستم استفاده کرد که پلاک خودرو های افراد ساختمان در سیستم ذخیره شود و هنگامی که خودرویی با یکی از پلاک های ذخیره شده در مقابل دوربین قرار گرفت درب پارکینگ باز شده و دیگر نیازی به استفاده از دستگاه کنترل از راه نباشد.

الگوریتم مورد استفاده در این پروژه از دو قسمت تشکیل شده است.

  • تفکیک اعداد و حروف
  • تشخیص اعداد و حروف

جهت تفکیک اعداد از تصویر که به صورت باینری تبدیل شده برای تشخیص هر عدد ابتدا از پایین سمت چپ شروع کرده و به سمت راست حرکت میکنیم.هرگاه به مقداری برابر با مقدا شروع رسیدیم پهنای باند طی شده را محاسبه میکنیم.اگر از مقدار از پیش تعیین شده بیشتر باشد مقدار اولیه جهت شروع عملیات را افزایش داده و عملیات را تکرار میکنیم.حال حال اگر از مقدار اولیه کمتر یا مساوی بود این دو نقطه مرز ابتدایی و انتهایی عدد اول از سمت چپ را مشخص میکند.سپس همین روش را برای بقیه تصویر انجام میدهیم تا در نهایت هشت عدد بدست بیاوریم. اگر تمام مراحل انجام شده ولی کمتر از هشت عدد بدست آمد آنگاه پهنای باند را کمتر در نظر میگیریم و مراحل قبل را دوباره تکرار میکنیم. از نقاط ضعف این الگوریتم میتوان به این اشاره کرد که در بعضی موارد یه عدد نصف شده و یا دو عدد به عنوان یک عدد نمایش داده میشوند. در تشخیص اعداد که ورودی آن اعداد جدا شده از قسمت قبل است,توسط الگوریتمی ورودی ها به شبکه عصبی داده شده و آنگاه شبکه عصبی تصویر داده شده را با تصاویر داخل پایگاه داده خود که هنگام آموزش آنها را دریافت و دسته بندی کرده است تطبیق داده و پس از الگوریتم های درونیابی,تقریب و تصمیم,بیشترین احتمال اینکه به کدام عدد نزدیک تر است را به عنوان خروجی قرار خواهد داد. برای آنکه از اشتباهات احتمالی جلوگیری شود,در قسمت آموزش میبایست از بانک اطلاعاتی کاملی استفاده کرد. از عوامل ایجاد خطا در این سیستم میتوان به این اشاره کرد که در بعضی موارد عکس ها تار هستند و یا در پلاک نویز وجود دارد که احتمال تشخیص صحیح را کاهش میدهند.

کارهای مرتبط

همانطور که در مقدمه ذکر شد،مرحله اول خواندن پلاک خودرو تفکیک حروف و اعداد پلاک میباشد.برای تفکیک ابتدا لازم است که پلاک در شرایط مناسبی قرار گیرد.برای مثال ممکن است به دلایل مختلفی مانند اتصال نامناسب روی خودرو،پلاک نسبت به افق دارای زاویه باشد و در نتیجه حروف و اعداد دارای زاویه باشند و تشخیص آنها مشکل باشد و از احتمال درست تشخیص دادن کاسته شود.از مشکلات دیگر میتوان به وجود نویز در پلاک اشاره کرد که در تشخیص حروف اخلال ایجاد میکند. برای برطرف کردن این مشکلات از الگوریتم های GaussianBlur و threshold استفاده میکنیم. با استفاده از الگوریتم اول نویز های احتمالی پلاک تا کاهش داده و با استفاده از الگوریتم threshold عکس را به صورت باینری تبدیل میکنیم.باینری کردن تصاویر انواع مختلفی دارد که عبارتند از :

  • Threshold Binary
  • Inverted Threshold Binary
  • Truncate
  • Threshold to Zero
  • Inverted Threshold to Zero
  • OTSU Threshold

به دلیل اینکه تصاویر به صورت خودکار گرفته شده و خودرو ها در حال حرکت هستند،در بسیاری از موارد تصاویر شرایط مناسبی جمله نور مناسب را نخواهند داشت.به همین دلیل در این پروژه از نوع otsu_thresholding استفاده شده است،زیرا این الگوریتم تصویر را به صورت محلی به صورت باینری تبدیل میکند و از مشکلاتی مانند سیاه شدن کامل قسمتی از تصویر به دلیل نا مناسب بودن نور جلوگیری میکند.

تصویر اولیه همراه با نویز

تصویر نتیجه با الگوریتم Blur

تصویر نتیجه با الگوریتم Otsu Threshold

با توجه به نتیجه تصویری که با استفاده از الگوریتم otsu threshold بدست آمده است،مشاهده میشود که نویز ها و علامت های اضافی که در پلاک بیشتر کشور ها وجود دارد،کمتر شده و یا از بین رفته اند. برای تفکیک حروف و اعداد از یکدیگر راه های مختلفی وجود.در روند این پروژه از سه الگوریتم مختلف استفاده شده است:

۱.با استفاده از کتابخانه pytesser

این کتابخانه که با استفاده با استفاده از opencv و OCR نوشته شده است و قابل استفاده میباشد،با استفاده از نمونه های بسیار آموزش دیده و قادر به تشخیص متون در تصاویر در زبان های تعریف شده با دقت بالایی میباشد.

تصویر ورودی

نتیجه با استفاده از pytesser

۲.با استفاده از کتابخانه CvBlob

این کتابخانه که توسط مایکروسافت در سال ۲۰۰۵ پیاده سازی شده و هماهنگ با opencv میباشد،در تصویر داده شده،تمامی لکه ها را پیدا کرده و آنها را با خط کشیدن نمایش میدهد.از مشکلات آن میتوان به این اشاره کرد که نویز های کوچک را نیز به عنوان لکه تشخیص داده و برای تشخیص حروف و اعداد میبایست تمامی آنها را امتحان نمود و پردازش این قسمت کمی بیشتر میشود.

تصویر ورودی

نتیجه با استفاده از cvblob

۳.تفکیک با استفاده از تراکم

الگوریتم مورد استفاده در این قسمت به این صورت است که از سمت چپ تصویر شروع کرده و به سمت راست حرکت میکنیم.برای تشخیص هر حرف یا عدد به این صورت عمل میکنیم که هنگامی که رنگی مخالف با رنگ پس زمینه نمایان شد،آن مکان را نقطه شروع حرف در نظر گرفته و هنگامی که تراکم رنگ مخالف به صفر رسید،به عنوان نقطه پایان آن حرف علامت گذاری میکنیم.با توجه به تعداد حرف و عدد خاص در هر کشور،با توجه به پلاک مورد نظر این الگوریتم را تکرار میکنیم تا تمامی حروف جدا شوند و از جدا شدن تکه های اضافی جلوگیری شود.

تصویر ورودی

حروف و اعداد به صورت تفکیک شده

۴.استفاده از خوطوط تصویر

در این روش تمامی خطوط داخل تصویر را در نظر گرفته،سپس مستطیل هایی که محاط بر این خطوط هستن جمع آوری میکنیم.برای کاهش مستطیل های اضافی که در اطراف نویز ها قرار دارند،شرطی مانند حداقل طول و عرض قابل قبول قرار داده و تعدادی از آنها را حذف میکنیم.

تصویر ورودی

پیدا کردن محل حروف و اعداد

اگرچه این در این الگوریتم ها سعی شده تشخیص به بهترین صورت انجام شود،اما ممکن هست به دلیل کیفیت کم عکس ها و یا وجود نویز هایی که قادر به حذف آنها نبودیم،یک حرف به دو حرف تشخیص داده شود(مانند 11 به جای 0 ) و یا l بجای I تشخیص داده شود.با استفاده از قوانین پلاک گذاری(مانند عدم استفاده از حروف کوچک به دلیل تشابه بعضی از حروف و عدم استفاده از عدد صفر به دلیل تشابه با پرچ پلاک)،میتوان از این نوع مشکلات جلوگیری کرد و تشخیص دقیق تری داشته باشیم.

تشخیص اعداد

پس از تفکیک کردن اعداد با استفاده از الگوریتم های مختلف،در مرحله دوم و پایانی می بایست به تشخیص اعداد و حروف تفکیک شده بپردازیم.همانند مرحله اول این مرحله نیز را میتوان با استفاده از روش های مختلفی انجام داد که در زیر به دو روش اصلی آن میپردازیم. در روش اول با استفاده از دیتابیس های آماده که شامل تعداد بسیاری از تصویر اعداد و حروف هستند و پردازش تصویر،فایل ها را به هش کد تبدیل کرده و در یک Dictionary ذخیره میکنیم و با استفاده از حرف و عدد مورد نظر قابل دسترسی هستن.از مشکلات این روش این است که اگرچه حالت هایی که به هش کد تبدیل میشود،اما با کوچکترین تغییر هش کد بدست آمده تغییر میکند و در حالت های آموزش داده شده یافت نشود. در روش دوم که در این پروژه نیز از این روش استفاده شده،به این صورت است که همه اعداد تفکیک شده از پلاک های نمونه جدا کرده و ذخیره میکنیم.سپس در حالت آموزش به کاربر نمایش داده و عدد و حرف متناظر را بدست می آوریم.برای ذخیره آموزش به این صورت عمل میکنیم که تصاویر را به سایز خاصی (مانند ۱۰x۱۰ ) تبدیل کرده و با این دید که این تصویر تبدیل شده همانند یک ماتریس ۱۰x۱۰ میباشد،برای ذخیره راحت تر،آن را به ماتریس ‌۱x۱۰۰ تبدیل کرده و مانند روش اول در ساختما داده Dictionary ذخیره کرده.به دلیل آنکه در این روش تصویر به هش کد تبدیل نشده،میتوان ماتریس بدست آمده در حالت استفاده را با درصد خطایی مشخص با ماتریس های بدست آمده در آموزش تطبیق داد.

ارزیابی

در ارزیابی انجام شده در با استفاده از نمونه های بدست آماده،بیش از ۷۵٪ نمونه ها را به صورت کامل و درست تشخیص داده میشود.در بیشتر نمونه های تشخیص غلط نیز مشکل در تعداد کم یا زیاد تعداد حروف است دلیل این مشکل این است که سعی شده است در این پروژه هرگونه پلاک با حروف لاتین تشخیص داده شود و محدود به کشور و یا استاندارد خاصی نباشد.به همین دلیل نمیتوان با تعداد اعداد تشخیص داده شده،کد به این نتیجه برسد که در تشخیص مشکل داشته و اقدام به تغییر پارامتر ها کند. لینک پروژه در گیت هاب در پایان مطلب موجود میباشد.در زیر نیز قسمتی از نتیجه و نمونه ها آورده شده است

تعدادی از نمونه های استفاده شده

نمونه ای از خروجی برنامه

مراجع

رد شده

در قسمت کارهای مرتبط توضیحات با جزئیات کمتری بیان شده که می توانست بهتر باشد

رد شده

شرح موضوع و مسائل موجود در پروژه را به خوبی بیان کرده اید ، متن ساده(عدم استفاده از اصطلاحات پیچیده) و در عین حال شفاف، نمایش مرحله به مرحله عکس هایی که تحت تبدیل یا فیلتر های threshold ، blur ،... تغییر کرده اند و همچنین قسمتی از نتایج پیاده سازی ، از نقاط قوت پروژه ی شماست .
معمولا در مقالات ، قسمت ارزیابی و آزمایش را به صورت جدولی نمایش می دهند که در آن بیان می کند به ازای چه داده هایی الگوریتم چند درصد درست کار کرده است ، بهتر بود نشان میدادید دقیقا برای چه عکس هایی الگوریتم صحیح عمل نکرده است.
احتمالا از مراجع بیشتری استفاده کردید دراین صورت بهتر است لینک مقالات خوانده شده ارجاع داده شود.

تایید شده

از مراجع کمی استفاده کردید و یا اگر مراجع بیشتری مطالعه کردید در مراجع ذکر نکردید و همین چند مقاله استفاده شده نیز در متن ارجاع نداده اید
در قسمت ازمایش ها بهتر بود ورودی ها و نتایج را یکی یکی و جداگانه بررسی کنید تا نتایج واضح تر شوند
بین هر قسمت متن و عکس ها فاصله های زیادی ایجاد شده که بهتر بود برطرف شوند
در کارهای مرتبط توضیحات pytesser و cvblob با اینکه کم هستند ولی به دلیل استفاده از عکس به خوبی مفهوم مشخص شده است:)
اگر در ارزیابی دلایل بیشتری درباره عدم موفقیت بعضی از پلاک ها ذکر میکردید به صورت حدودی کار شما برای مرحله، بهبود نتایج معلوم میشد
اگر در کد ، قسمت readme کمی درباره بخشهای مختلف پروژه مثل generalresponses.data یا train در گیت توضیح میدادید برای کسانی که با عملکرد پروژه اشنایی کمتری دارند ، کار با کد شما اسان تر میشد
ولی با خواندن و اجرا کردن train و کد شما بر روی مثال های مختلف ، عملکرد خوب شما در این پروژه مشخص میشود
امیدوارم در فاز بعدی به نتایج 100%درست برسید :)
موفق باشید:)

محمد غضنفری

در این فاز قرار بود پیاده سازی از کارتان داشته باشید و نتایج اولیه را گزارش کنید.
شما به خوبی این کار را انجام نداده اید. در توضیح روش های تشخیص اعداد به صورت کلی بحث کرده اید و روش دقیق را بیان نکرده اید.
نتایج را خیلی ضعیف ارائه داده اید و از هیچ شکل، نمودار یا جدولی استفاده نکرده اید.
نوشتارتان هم اوضاع خوبی ندارد. یک بار بعد از نوشتن متن خودتان آن را مطالعه نکرده اید و پر است از غلط های نگارشی و جملات نادرست.