۱. مقدمه

تشخیص اشیا در تصویر یک عمل پر چالش است که بسیاری از محققین در حال حاضر به آن می پردازند. تشخیص و نام گذاری¹ اشیا در عکس بسیار پر چالش است، زیرا تصاویری که داریم می تواند در شرایط بسیار متونعی باشد. به عنوان مثال برای تشخیص خودرو در تصویر چالش هایی که در پیش رو هستند عبارتند از :

تصاویر بسیار متونع از زوایای متفاوت از خودرو
گوناگونی در خودروها به عنوان مثال خودرو سواری ، اتوبوس و …
رنگ ها و طرح های متفاوت خودرو ها
تصاویر در شب یا روز
تصاویر در شرایط جوی متفاوت مانند برفی، بارانی یا آفتابی یا ابری

فایق آمدن بر چنین مشکلاتی در حالت کلی بسیار مفید خواهد بود و در زمینه هایی مانند ایمنی خودروها²، فهرست گذاری ویدو³، دنبال کردن اشیا در تصویر⁴ ، روباتیک و … بسیار سودمند خواهد بود.

اما تشخیص خودرو در تصویر چه سودمندی خواهد داشت؟

برای پاسخ به این سوال بد نیست به چند نمونه از کاربرد هایی که هم اکنون شاهد آن هستیم اشاره کنیم. به عنوان مثال دوربین های کنترل سرعت راهنمایی و رانندگی که در سطح شهر هستند با تشخیص جسم با سرعت بالاتر از حد مجاز عکسی میگیرند که ابتدا در آن عکس خودرو را تشخیص می دهند و سپس پلاک آن.

۲. کارهای مرتبط

تشخیص خودرو در بسیار از موارد کاربرد دارد که در اینجا به بخشی از آن اشاره میکنیم و روش های گوناگون تشخیص خودرو در تصویر و یا به طور کلی اشیا در تصویر را بررسی می کنیم.
برای تشخیص این که خودرو ای در محدوده ای ممنوعه پارک کرده است یا نه، تشخیص مدل خودرو، تشخیص خودرو در تصاویر هوایی وحذف آن از تصویر( همانند کاری که گوگل در گوگل مپ برای حذف انسان از تصاویر هوایی به علت حفظ حریم خصوصیشان انجام می دهد) می توان از این پروژه استفاده کرد. زیرا در تمامی موارد ذکر شده ابتدا باید محل خودرو در تصویر تشخیص داده شود سپس مراحل بعدی طی شود.
البته لازم به ذکر است که بعضی از تکنیک های مورد استفاده برای یافتن تصویر خودرو می توانند برای تشخیص اشیا دیگری در تصویر بکار روند مانند: تشخیص چهره و یا دوچرخه و ... زیرا در این زمینه ها چالش های تقریبا یکسانی وجود دارد.

رویکردهایی برای تشخیص اشیا در تصویر وجود دارد مانند: شناسایی با اجزا⁵ ، شناسایی بر اساس ظاهر⁶ و شناسایی بر اساس ویژگی ها⁷.

۲.۰.۱. شناسایی بر اساس ویژگی ها

درخت ترجمه⁸

نظریه و اثبات⁹

ثبات وضعیت ¹⁰

خوشه بندی وضعیت ¹¹

با توجه به افزایش داده ها و میل روز افزون به دستیابی به اطلاعات موجود ، کاهش بعد ها به وسیله ی انتخاب ویژگی ها¹² مهم شدند. روش های زیر بخشی از روش هایی هستند که به این منظور به کار گرفته شدند.

روش شاخه و حد توسط Narendra و Fukunaga برای دوری از جست و جو های کامل همه زیر مجموعه های ویژگی ها استفاده شد. Liu et al. هم روشی برای دوری از جست و جوی کامل توسعه داده است.

در سال ۲۰۱۱ Pedrycz و Ahmad از روش انتخاب ویژگی ها با رویکرد تصادفی ، الگوریتم ژنتیک و بهینه سازی اجتماع ذرات استفاده کردند.

در سال ۱۹۹۶ Bala et al. از الگوریتم ژنتیک و درخت های تصمیم گیری برای انتخاب ویژگی های مفاهیم بصری استفاده کرد. Dollar et al. ابعاد مجموعه تصادفی آغازین را با استفاده از روش Ada Boost کاهش داد.

۲.۰.۲. شناسایی بر اساس ظاهر

روش تقسیم و حل

تطابق لبه

هیستوگرام

۳. روش استفاده شده

در این بخش به توضیح روش استفاده شده در فاز دوم می پردازیم. برای دریافت فایل ها می توانید به GitHub مراجعه کنید.

در این فاز از روش Haar-like features استفاده کردیم. این روش از ویژگی های عکس های دیجیتال استفاده میکند. در توضیح این روش به اختصار می توان گفت که ویژگی های تصویر بر اساس تفاضل مجموع پیکسل های یک ناحیه ی مستطیل تعریف می گردند.

sum = I(C) + I(A) - I(B) - I(D)

در این فاز از کتابخانه ی OpenCV نسخه ی ۲.۴ استفاده شده است. با استفاده از Cascade Classifier Training که امکان تمرین¹³ بر اساس Haar-like features را به ما می دهد و تعداد زیادی داده ی آموزشی مشتمل بر دو دسته، دسته ای حاوی عکس های بدون خودرو و دسته ای شامل عکس های خودرو، و دو فایل توصیف گر، یکی برای عکس های بدون خودرو یا به اصطلاح پس زمینه و دیگری توصیف گر عکس های حاوی خودرو و محل خودرو یا خودرو های موجود در تصویر، فایل هایی به دست می آیند که نتیجه یادگیری بر روی داده های تست بوده. سپس این فایل ها به برنامه ای که به زبان سی پلاس پلاس نوشته شده داده می شوند تا آن برنامه با استفاده از آن ها بتواند در صورت وجود خودرو در تصویر محل آن را مشخص کند.

در ادامه به توضیح چگونگی استفاده از فایل های موجود در Github خواهیم پرداخت البته لازم به ذکر است که این توضیحات در ReadMe پروژه نیز موجود است و این توضیحات برای سیستم عامل لینوکس ارایه گردیده است.

ابتدا کد را کامپایل میکنیم، البته باید دقت شود که کتابخانه های مربوطه را نیز به کامپایلر معرفی کنیم.

سپس فایل اجرایی را با پارامتر های زیر اجرا میکنیم:

آدرس عکس
فایل یا فایل های مربوط به ما حصل Cascade Classifier

به عنوان مثال:

./output image.bmp cascade1.xml cascade2.xml cascade3.xml cascade4.xml cascade.xml

البته به دلیل حجم زیاد فقط فایل های حاصل شده از تمرین های مختلف را در GitHub قرار داده ام و پس از کامپایل با استفاده از دستور بالا آن را اجرا کنید.

۳.۱. ارزیابی

برای اطمینان از کارایی روش استفاده شده، از یک مجموعه داده ای مشتمل بر ۱۰۷ عکس برای ارزیابی برنامه ارایه شده، استفاده گردید. مشخصات این مجموعه به قرار زیر است:

۲۷ عکس ،شامل چند خودرو
۵۷ عکس، شامل یک خودرو
۲۳ عکس، بدون خودرو

پس از اجرا برنامه برای تمام این عکس ها نتایج اولیه زیر حاصل گردید:

نوع	شامل چند خودرو	شامل یک خودرو	بدون خودرو
عکس های مورد بررسی	۲۷	۵۷	۲۳
تشخیص درست	۱۳	۳۳	۲۱
تشخیص نادرست	۱۷	۱۹	۴

همان طور که از نتایج بالا مشخص است، از بین ۱۰۷ عکس مورد بررسی ۲۵ عکس (مجموع ستون عکس های بدون خودرو، در دو ردیف تشخیص درست و نادرست) به عنوان عکس بدون خودرو تشخیص داده شده که ۲۱ عکس به درستی و ۴ عکس به غلط تشخیص داده شده است. برای عکس های شامل یک خودرو، ۵۲ عکس تشخیص داده شده که از این میان ۱۹ عکس به نادرستی و ۳۳ عکس به درستی تشخیص داده می شوند. برای عکس هایی که شامل چند خودرو بودند در مجموع ۳۰ عکس تشخیص داده شده که از میان آن ها ۱۳ عکس به درستی و ۱۷ عکس به نادرستی تشخیص داده شده اند.

با استفاده از نتایج بالا درصد درستی برای مجموعه مورد بررسی به قرار زیر است:

بدون خودرو	شامل یک خودرو	شامل چند خودرو	در کل
۸۴٪	۶۳.۴۶٪	۴۳.۳۳٪	۶۲.۶۱٪

لازم به ذکر است درصد های بالا به این شکل محاسبه گشتند که، تعداد تشخیص ها ، به عنوان مثال تعداد تشخیص های عکس بدون خودرو درست را بر تعداد کل تشخیص های عکس بدون خودرو تقسیم کردیم، اما برای محاسبه کل تعداد عکس های تشخیص داده شده درست را بر تعداد کل عکس ها تقسیم کردیم.

این نتایج نشان می دهد که برنامه در تشخیص عکس هایی که شامل چند خودرو هستند بسیار ضعیف تر عمل می کند، یکی از دلایل این است که در مرحله آموزش و تمرین عکس های شامل چند خودرو کمتر از عکس های شامل یک خودرو استفاده شده بودند.

۴. روش های نوین

روش پیشنهادی برای تشخیص خودرو در تصویر، روش الگوریتم ژنتیک است. زیرا این روش بدون نیاز به دانش اولیه و مداخله انسان قابل پیاده سازی است. همچنین در زمینه هایی مانند شناسایی خودرو، شناسایی صورت و شناسایی هواپیما در تصویر این روش به دقت ۱۰۰٪ رسیده است.

نوین ترین الگوریتم مطرح شده برای تشخیص اشیا به طور عمومی¹⁴، الگوریتم ECO feature می باشد. اساس کار این روش الگوریتم ژنتیک است. از آن جا که توضیح این روش بسیار بسیط و مفصل است برای مشاهده مقاله مربوط به این روش می توانید به مقاله ی A feature construction method for general object recognition مراجعه فرمایید.

۵. مراجع

A feature construction method for general object recognition

Wikipedia, Outline of object recognition

Computational method of feature selection, Edited by Huan Liu & Hiroshi Motoda

Labeling
Automotive Safety
Video Indexing
Tracking
Recognition by part
Appearance-based method
Feature-based method
Interpretation trees
Hypothesize and test
Pose consistency
Pose clustering
Feature Selection
Training
General object recognition

تایید شده

مشکلات پیش روی پروژه به خوبی اشاره شده است (زاویه خودرو،تنوع خودرو و ...).روش انجام پروژه توضیح داده شده اما اگر با جزییات بیشتری ارائه میشد به خواننده کمک بیشتری میکرد.لینک کد در گیت هاب نیز در پروژه قرار داده شده است. ارزیابی با دقت و جزئیات کافی و خوب به ثبت رسیده.استفاده از نمودار هم برای ارزیابی کمک خوبی برای درک بهتر کرده است.بهتر بود تست پروژه روی بیشتر از یک عکس اجرا و نتیجه آن نمایش داده میشد.

بسيار خوب هم از نظر مرتب نويسي هم از نظر مطالب علمي.
اگر توضيحات مختصر نميشدشاهد يك پروژه بسيار كاملتر مي بوديم!
در كل خوب بود. موفق باشيد

محمد غضنفری

در برخی قسمت های اصلی و مفهومی توضیحات کمی ارائه شده و سریعا از مطلب عبور کرده اید ولی در خیلی از بخش های ساده و واضح متن توضیحات بیش از حد است. مثلا بعد از نموداری که از نتایج کارتان ارائه داده اید تمام ستون های نمودار را توضیح داده اید که لزومی نداشت و از نمودار کاملا قابل برداشت بود ولی در عوض در قسمتهای مربوط به توضیح الگوریتم توضیحات کافی ارائه نشده است.
هیچکدام از عکس ها، جدول ها، نمودارها و ... شماره و caption ندارند.
مراجع تان شماره گذاری نشده اند و فرمت ieee نیز در آن ها رعایت نشده است. بعد از درست کردن آن ها حتما در متن جایی که از مرجع خاصی استفاده شده است، شماره آن مرجع را ذکر کنید.

تشخیص ماشین‌ها در تصویر