مقدمه

سیستم پلاک خوان یکی از مهترین سیستم ها در کنترل ترافیک است که با استفاده از میتوان رانندگان متخلف و نوع خلاف را ثبت کرد. عملکرد این سیستم به گونه ای است که با استفاده از دوربین های مخصوصی که در سطح شهر و اتوبان ها قرار داده شده اند و برنامه تشخیص تخلف از لحظاتی که در آنها تخلفی صورت گرفته عکس برداری شده و سیستم تشخیص محل پلاک خودرو محل پلاک را بدست آورده و در اختیار سیستم پلاک خوان که موضوع این پروژه میباشد قرار میدهد و این سیستم اعداد و حروف پلاک را استخراج کرده و برای فرد متخلف جریمه ثبت شود.هدف اصلی این پروژه مکانیزه کردن که علاوه بر کاهش نیروی انسانی و کاهش هزینه ها افزایش دقت و سرعت در تصمیم گیری و انجام کارها است.
علاوه بر هدف اصلی که ذکر شد از این سیستم میتوان در سیستم های دیگر مانند پارکینگ های عمومی و یا خصوصی استفاده کرد.در پارکینگ های عمومی میتوان با تشخیص شماره پلاک ساعت ورود را در سیستم ذخیره کرده و در هنگام خروج مدت زمان حضور در پارکینگ معلوم گردد و دیگر نیازی به ثبت توسط نیروی انسانی نیست.همچنین میتوان با ذخیره کردن پلاک ماشین ها برای مدت خاصی یک پایگاه داده ایجاد کرد و در مسایل امنیتی از آن استفاده نمود.در پارکینگ های خصوصی نیز میتوان از این جهت در این سیستم استفاده کرد که پلاک خودرو های افراد ساختمان در سیستم ذخیره شود و هنگامی که خودرویی با یکی از پلاک های ذخیره شده در مقابل دوربین قرار گرفت درب پارکینگ باز شده و دیگر نیازی به استفاده از دستگاه کنترل از راه نباشد.

الگوریتم مورد استفاده در این پروژه از دو قسمت تشکیل شده است.

  • تفکیک اعداد و حروف
  • تشخیص اعداد و حروف

جهت تفکیک اعداد از تصویر که به صورت باینری تبدیل شده برای تشخیص هر عدد ابتدا از پایین سمت چپ شروع کرده و به سمت راست حرکت میکنیم.هرگاه به مقداری برابر با مقدا شروع رسیدیم پهنای باند طی شده را محاسبه میکنیم.اگر از مقدار از پیش تعیین شده بیشتر باشد مقدار اولیه جهت شروع عملیات را افزایش داده و عملیات را تکرار میکنیم.حال حال اگر از مقدار اولیه کمتر یا مساوی بود این دو نقطه مرز ابتدایی و انتهایی عدد اول از سمت چپ را مشخص میکند.سپس همین روش را برای بقیه تصویر انجام میدهیم تا در نهایت هشت عدد بدست بیاوریم. اگر تمام مراحل انجام شده ولی کمتر از هشت عدد بدست آمد آنگاه پهنای باند را کمتر در نظر میگیریم و مراحل قبل را دوباره تکرار میکنیم. از نقاط ضعف این الگوریتم میتوان به این اشاره کرد که در بعضی موارد یه عدد نصف شده و یا دو عدد به عنوان یک عدد نمایش داده میشوند. در تشخیص اعداد که ورودی آن اعداد جدا شده از قسمت قبل است,توسط الگوریتمی ورودی ها به شبکه عصبی داده شده و آنگاه شبکه عصبی تصویر داده شده را با تصاویر داخل پایگاه داده خود که هنگام آموزش آنها را دریافت و دسته بندی کرده است تطبیق داده و پس از الگوریتم های درونیابی,تقریب و تصمیم,بیشترین احتمال اینکه به کدام عدد نزدیک تر است را به عنوان خروجی قرار خواهد داد. برای آنکه از اشتباهات احتمالی جلوگیری شود,در قسمت آموزش میبایست از بانک اطلاعاتی کاملی استفاده کرد. از عوامل ایجاد خطا در این سیستم میتوان به این اشاره کرد که در بعضی موارد عکس ها تار هستند و یا در پلاک نویز وجود دارد که احتمال تشخیص صحیح را کاهش میدهند.

کارهای مرتبط

همانطور که در مقدمه ذکر شد،مرحله اول خواندن پلاک خودرو تفکیک حروف و اعداد پلاک میباشد.برای تفکیک ابتدا لازم است که پلاک در شرایط مناسبی قرار گیرد.برای مثال ممکن است به دلایل مختلفی مانند اتصال نامناسب روی خودرو،پلاک نسبت به افق دارای زاویه باشد و در نتیجه حروف و اعداد دارای زاویه باشند و تشخیص آنها مشکل باشد و از احتمال درست تشخیص دادن کاسته شود.از مشکلات دیگر میتوان به وجود نویز در پلاک اشاره کرد که در تشخیص حروف اخلال ایجاد میکند. برای برطرف کردن این مشکلات از الگوریتم های GaussianBlur و threshold استفاده میکنیم. با استفاده از الگوریتم اول نویز های احتمالی پلاک تا کاهش داده و با استفاده از الگوریتم threshold عکس را به صورت باینری تبدیل میکنیم.باینری کردن تصاویر انواع مختلفی دارد که عبارتند از :

  • Threshold Binary
  • Inverted Threshold Binary
  • Truncate
  • Threshold to Zero
  • Inverted Threshold to Zero
  • OTSU Threshold

به دلیل اینکه تصاویر به صورت خودکار گرفته شده و خودرو ها در حال حرکت هستند،در بسیاری از موارد تصاویر شرایط مناسبی جمله نور مناسب را نخواهند داشت.به همین دلیل در این پروژه از نوع otsu_thresholding استفاده شده است،زیرا این الگوریتم تصویر را به صورت محلی به صورت باینری تبدیل میکند و از مشکلاتی مانند سیاه شدن کامل قسمتی از تصویر به دلیل نا مناسب بودن نور جلوگیری میکند.

تصویر اولیه همراه با نویز

تصویر نتیجه با الگوریتم Blur

تصویر نتیجه با الگوریتم Otsu Threshold

با توجه به نتیجه تصویری که با استفاده از الگوریتم otsu threshold بدست آمده است،مشاهده میشود که نویز ها و علامت های اضافی که در پلاک بیشتر کشور ها وجود دارد،کمتر شده و یا از بین رفته اند. برای تفکیک حروف و اعداد از یکدیگر راه های مختلفی وجود.در روند این پروژه از سه الگوریتم مختلف استفاده شده است:

۱.با استفاده از کتابخانه pytesser

این کتابخانه که با استفاده با استفاده از opencv و OCR نوشته شده است و قابل استفاده میباشد،با استفاده از نمونه های بسیار آموزش دیده و قادر به تشخیص متون در تصاویر در زبان های تعریف شده با دقت بالایی میباشد.

تصویر ورودی

نتیجه با استفاده از pytesser

۲.با استفاده از کتابخانه CvBlob

این کتابخانه که توسط مایکروسافت در سال ۲۰۰۵ پیاده سازی شده و هماهنگ با opencv میباشد،در تصویر داده شده،تمامی لکه ها را پیدا کرده و آنها را با خط کشیدن نمایش میدهد.از مشکلات آن میتوان به این اشاره کرد که نویز های کوچک را نیز به عنوان لکه تشخیص داده و برای تشخیص حروف و اعداد میبایست تمامی آنها را امتحان نمود و پردازش این قسمت کمی بیشتر میشود.

تصویر ورودی

نتیجه با استفاده از cvblob

۳.تفکیک با استفاده از تراکم

الگوریتم مورد استفاده در این قسمت به این صورت است که از سمت چپ تصویر شروع کرده و به سمت راست حرکت میکنیم.برای تشخیص هر حرف یا عدد به این صورت عمل میکنیم که هنگامی که رنگی مخالف با رنگ پس زمینه نمایان شد،آن مکان را نقطه شروع حرف در نظر گرفته و هنگامی که تراکم رنگ مخالف به صفر رسید،به عنوان نقطه پایان آن حرف علامت گذاری میکنیم.با توجه به تعداد حرف و عدد خاص در هر کشور،با توجه به پلاک مورد نظر این الگوریتم را تکرار میکنیم تا تمامی حروف جدا شوند و از جدا شدن تکه های اضافی جلوگیری شود.

تصویر ورودی

حروف و اعداد به صورت تفکیک شده

۴.استفاده از خوطوط تصویر

در این روش تمامی خطوط داخل تصویر را در نظر گرفته،سپس مستطیل هایی که محاط بر این خطوط هستن جمع آوری میکنیم.برای کاهش مستطیل های اضافی که در اطراف نویز ها قرار دارند،شرطی مانند حداقل طول و عرض قابل قبول قرار داده و تعدادی از آنها را حذف میکنیم.

تصویر ورودی

پیدا کردن محل حروف و اعداد

اگرچه این در این الگوریتم ها سعی شده تشخیص به بهترین صورت انجام شود،اما ممکن هست به دلیل کیفیت کم عکس ها و یا وجود نویز هایی که قادر به حذف آنها نبودیم،یک حرف به دو حرف تشخیص داده شود(مانند 11 به جای 0 ) و یا l بجای I تشخیص داده شود.با استفاده از قوانین پلاک گذاری(مانند عدم استفاده از حروف کوچک به دلیل تشابه بعضی از حروف و عدم استفاده از عدد صفر به دلیل تشابه با پرچ پلاک)،میتوان از این نوع مشکلات جلوگیری کرد و تشخیص دقیق تری داشته باشیم.

تشخیص اعداد

پس از تفکیک کردن اعداد با استفاده از الگوریتم های مختلف،در مرحله دوم و پایانی می بایست به تشخیص اعداد و حروف تفکیک شده بپردازیم.همانند مرحله اول این مرحله نیز را میتوان با استفاده از روش های مختلفی انجام داد که در زیر به دو روش اصلی آن میپردازیم. در روش اول با استفاده از دیتابیس های آماده که شامل تعداد بسیاری از تصویر اعداد و حروف هستند و پردازش تصویر،فایل ها را به هش کد تبدیل کرده و در یک Dictionary ذخیره میکنیم و با استفاده از حرف و عدد مورد نظر قابل دسترسی هستن.از مشکلات این روش این است که اگرچه حالت هایی که به هش کد تبدیل میشود،اما با کوچکترین تغییر هش کد بدست آمده تغییر میکند و در حالت های آموزش داده شده یافت نشود. در روش دوم که در این پروژه نیز از این روش استفاده شده،به این صورت است که همه اعداد تفکیک شده از پلاک های نمونه جدا کرده و ذخیره میکنیم.سپس در حالت آموزش به کاربر نمایش داده و عدد و حرف متناظر را بدست می آوریم.برای ذخیره آموزش به این صورت عمل میکنیم که تصاویر را به سایز خاصی (مانند ۱۰x۱۰ ) تبدیل کرده و با این دید که این تصویر تبدیل شده همانند یک ماتریس ۱۰x۱۰ میباشد،برای ذخیره راحت تر،آن را به ماتریس ‌۱x۱۰۰ تبدیل کرده و مانند روش اول در ساختما داده Dictionary ذخیره کرده.به دلیل آنکه در این روش تصویر به هش کد تبدیل نشده،میتوان ماتریس بدست آمده در حالت استفاده را با درصد خطایی مشخص با ماتریس های بدست آمده در آموزش تطبیق داد.

ارزیابی

در ارزیابی انجام شده در با استفاده از نمونه های بدست آماده،بیش از ۷۵٪ نمونه ها را به صورت کامل و درست تشخیص داده میشود.در بیشتر نمونه های تشخیص غلط نیز مشکل در تعداد کم یا زیاد تعداد حروف است دلیل این مشکل این است که سعی شده است در این پروژه هرگونه پلاک با حروف لاتین تشخیص داده شود و محدود به کشور و یا استاندارد خاصی نباشد.به همین دلیل نمیتوان با تعداد اعداد تشخیص داده شده،کد به این نتیجه برسد که در تشخیص مشکل داشته و اقدام به تغییر پارامتر ها کند. لینک پروژه در گیت هاب در پایان مطلب موجود میباشد.در زیر نیز قسمتی از نتیجه و نمونه ها آورده شده است

تعدادی از نمونه های استفاده شده

نمونه ای از خروجی برنامه

بهبود عملکرد

در قسمت های پیشین ذکر شد که می توان از قوانین شماره گذاری پلاک برای بهبود عملکرد خواندن پلاک استفاده کرد.قوانینی در هر منطقه متفاوت است.برای مثال با اینکه پلاک های اروپا از لحاظ ظاهری بسیار شبیه هم هستند،اما هر پلاک هر کشور در استفاده از حروف و عدد و ترکیب این دو متفاوت هستند.همین قوانین برای آمریکا و آسیا نیز بر قرار است.در ایران نیز شماره گذاری پلاک ها قوانین خاص خود را دارند.از این قوانین میتوان به این اشاره کرد که به دلیل شباهت صفر و پرچ پلاک،از عدد صفر استفاده نشده است.میتوان از قوانین هر کشور استفاده کرد و دوربین های ثبت تخلف مخصوص به آن کشور ایجاد کرد و بدین صورت میتوان مقدار زیادی از خطا هایی که فقط توسط دستگاه ایجاد میشود را رفع کرد.اما به دلیل آنکه در این پروژه سعی شده است پلاک ها صرف نظر از منطقه انتخاب و خوانده شوند،استفاده از این قوانین نشدنی است. با توجه به اینکه مراحل خواندن پلاک به این صورت است که پس از باینری کردن تصویر ابتدا اقدام به پیدا کردن تمام رنگ مخالف پس زمینه میکنیم.از آنجا که در پلاک علایم و یا حتی زایده هایی وجود دارد و یا اعدادی مانند 8 چند بار شناسایی میشوند، قسمتای شناسایی شده میبایست از چندین صافی عبور کرده تا اعداد درست را تشخیص دهد.اولین صافی تعیین حداقل طول و عرض مستطیل های محاط بر قسمت های انتخاب شده است.این صافی مشکلاتی مانند تشخیص یکه عدد 8 و یا تشخیص تمامی پلاک به عنوان یک لکه را رفع می‌نماید. دومین صافی مربوط به فاصله تقسیم بندی هاست.برای مثال میتوان فاصله حروف و اعداد در پلاک مورد بررسی را تشخیص داد.سپس میتوان در مورد احتمال های شبیه هم مطمئن تر نظر داد.برای مثال عدد ‌11 و H شبیه به هم میباشند.میتوان به این صورت عمل کرد که اگر فاصله دو خط کمتر از فاصله بین حروف دیگر میباشد،پس در نتیجه قسمت انتخاب شده برابر با H میباشد. اگرچه در فونت های استفاده شده در پلاک ها بسیار متنوع نیست،اما به دلیل زاویه های مختلف عکس برداری از پلاک،برای آموزش دقیق تر،بهتر است از نمونه های حروف و اعداد در شرایط و فونت های مختلف استفاده کرد و آموزش را تقویت کرد.در پروسه آموزش،علاوه بر استفاده از تعداد زیادی نمونه های دسته بندی شده،میتوان از این روش استفاده کرد که حروف و اعداد پلاک ها توسط برنامه جدا شوند،سپس از کاربر حرف یا عدد متناسب را به برنامه بفرستد تا مرحله آموزش تکمیل شود. در قسمت تشخیص خودکار اعداد و حروف نیز میتوان بهبود هایی بخشید.به عنوان مثال اگرچه سعی شد که کمترین زایده و مشکلی به این مرحله برسد،اما نمیتوان از عدم وجود مشکلات مطمئن شد.برای همین در این مرحله که ما از مپ کردن ماتریس های اعداد و حروف به ماتریس های ۱x۱۰۰ میکنیم،میتوان بجای تطبیق ۱۰۰٪ ای،درصدی خطا قائل شد و بدین ترتیب حروفی که دارای ناخالصی هستند نیز با تقریب خوبی درست تشخیص داده میشوند. با توجه به این الگوریتم ها،درصد تشخیص صحیح این پروژه از ۷۵٪ به درصدی نزدیک به ۸۳٪ رسیده است.در زیر نمونه هایی که خروجی برنامه وجود دارد که به درک بیشتر این موارد کمک میکند.

تشخیص صحیح

تشخیص غلط

مراجع

با عرض سلام و خسته نباشید خدمت شما دوست عزیز.
بهتر می بود که در مورد الگوریتم های Threshold Binary-Inverted Threshold Binary-Truncate-Threshold to Zero-Inverted Threshold to Zero-OTSU Threshold توضیح می دادید.

رد شده

با سلام.استفاده از تصاویر کمک فراوانی به گویایی مطالب کرده اند.بهتر می بود در مورد مزایا و معایب روش های آستانه سازی که ذکر کردید توضیح کوتاهی می دادید همچنین در مورد نحوه ارزیابی نتایج،جزئیات را ذکر می کردید.

تایید شده

این پروژه بسیار قوی و اصولی نوشته شده است.پس از باز بینی کدها و کامنت های آن به راحتی بر پربار بودن پروژه پی بردم.
البته نقایصاتی که می توان از آنها نام برد عدم ارزیابی و مقایسه درست و یکجای تمامی روش هاست!
در طول نوشته هم کامل همه چیز نوشته شده است و به راحتی می توان در جریان آن قرار گرفت.
خوب بود. موفق باشید

در روش های بهبود و مشکلات پیش روی پروژه، عملکرد پروژه به خوبی بیان شده است.استفاده از تصاویر ورودی نمونه و نتیجه پروژه نیز به درک بهتر مشکلات کمک میکند.بهتر بود از نمودار برای اعلام دقیق تر نتایج استفاده میشد.همچنین بهتر بود نمونه هایی که در قسمت های بالاتر به صورت گروهی نمایش داده شده است،به صورت تک به تک مورد بررسی قرار میگرفت

پروژه ی جامع و کاملی بود و مشخص است که روی پیاده سازی آن وقت زیادی گذاشته شده
فقط مساله ای که هست اینه که روش کار الگوریتم های ذکر شده یا لایبرری های استفاده شده توضیح داده نشده بود و به نظر میاید که فقط از آنها در برنامه نویسی استفاده شده
اگر نتایج هم به صورت گروهی و توسط جدول مطرح میشد مطلب راحتتر به مخاطب منتقل میشد.
در مجموع خوب بود , موفق باشید

محمد غضنفری

شما در قسمت بهبود نتایج که کار اصلی این فاز محسوب می شد صرفا به بیان چند پیشنهاد پرداخته اید و آن ها را پیاده سازی نکرده اید

رد شده

با سلام و خسته نباشید،
شما مطالب بسیار واضح و شفاف بیان کرده اید. شما در پروژه اتون از کتابخانه هایی استفاده کردید و در قسمت پروژه اتون اورده اید که این کار بسیار خوبی است چون کسی که می خواهد کد شما را اجرا کند دچار مشکل نمی شود. در مورد ازمایش و بهینه کردن کد از نظر من شما بسیار خوب کار کرده اید.