GitHub

۱. مقدمه

تشخیص اشیا در تصویر یک عمل پر چالش است که بسیاری از محققین در حال حاضر به آن می پردازند. تشخیص و نام گذاری1 اشیا در عکس بسیار پر چالش است، زیرا تصاویری که داریم می تواند در شرایط بسیار متونعی باشد. به عنوان مثال برای تشخیص خودرو در تصویر چالش هایی که در پیش رو هستند عبارتند از :

  • تصاویر بسیار متونع از زوایای متفاوت از خودرو

  • گوناگونی در خودروها به عنوان مثال خودرو سواری ، اتوبوس و …

  • رنگ ها و طرح های متفاوت خودرو ها

  • تصاویر در شب یا روز

  • تصاویر در شرایط جوی متفاوت مانند برفی، بارانی یا آفتابی یا ابری

فایق آمدن بر چنین مشکلاتی در حالت کلی بسیار مفید خواهد بود و در زمینه هایی مانند ایمنی خودروها2، فهرست گذاری ویدو3، دنبال کردن اشیا در تصویر4 ، روباتیک و … بسیار سودمند خواهد بود.

اما تشخیص خودرو در تصویر چه سودمندی خواهد داشت؟

برای پاسخ به این سوال بد نیست به چند نمونه از کاربرد هایی که هم اکنون شاهد آن هستیم اشاره کنیم. به عنوان مثال دوربین های کنترل سرعت راهنمایی و رانندگی که در سطح شهر هستند با تشخیص جسم با سرعت بالاتر از حد مجاز عکسی میگیرند که ابتدا در آن عکس خودرو را تشخیص می دهند و سپس پلاک آن.

۲. کارهای مرتبط

تشخیص خودرو در بسیار از موارد کاربرد دارد که در اینجا به بخشی از آن اشاره میکنیم و روش های گوناگون تشخیص خودرو در تصویر و یا به طور کلی اشیا در تصویر را بررسی می کنیم.
برای تشخیص این که خودرو ای در محدوده ای ممنوعه پارک کرده است یا نه، تشخیص مدل خودرو، تشخیص خودرو در تصاویر هوایی وحذف آن از تصویر( همانند کاری که گوگل در گوگل مپ برای حذف انسان از تصاویر هوایی به علت حفظ حریم خصوصیشان انجام می دهد) می توان از این پروژه استفاده کرد. زیرا در تمامی موارد ذکر شده ابتدا باید محل خودرو در تصویر تشخیص داده شود سپس مراحل بعدی طی شود.
البته لازم به ذکر است که بعضی از تکنیک های مورد استفاده برای یافتن تصویر خودرو می توانند برای تشخیص اشیا دیگری در تصویر بکار روند مانند: تشخیص چهره و یا دوچرخه و ... زیرا در این زمینه ها چالش های تقریبا یکسانی وجود دارد.

رویکردهایی برای تشخیص اشیا در تصویر وجود دارد مانند: شناسایی با اجزا5 ، شناسایی بر اساس ظاهر6 و شناسایی بر اساس ویژگی ها7.

۲.۰.۱. شناسایی بر اساس ویژگی ها

  • درخت ترجمه8

  • نظریه و اثبات9

  • ثبات وضعیت 10

  • خوشه بندی وضعیت 11

با توجه به افزایش داده ها و میل روز افزون به دستیابی به اطلاعات موجود ، کاهش بعد ها به وسیله ی انتخاب ویژگی ها (Feature Selection) مهم شدند. روش های زیر بخشی از روش هایی هستند که به این منظور به کار گرفته شدند.

  • روش شاخه و حد توسط Narendra و Fukunaga برای دوری از جست و جو های کامل همه زیر مجموعه های ویژگی ها استفاده شد. Liu et al. هم روشی برای دوری از جست و جوی کامل توسعه داده است.

  • در سال ۲۰۱۱ Pedrycz و Ahmad از روش انتخاب ویژگی (Feature Selection) با رویکرد تصادفی ، الگوریتم ژنتیک و بهینه سازی اجتماع ذرات استفاده کردند.

  • در سال ۱۹۹۶ Bala et al. از الگوریتم ژنتیک و درخت های تصمیم گیری برای انتخاب ویژگی های مفاهیم بصری استفاده کرد. Dollar et al. ابعاد مجموعه تصادفی آغازین را با استفاده از روش Ada Boost کاهش داد.

۲.۰.۲. شناسایی بر اساس ظاهر

  • روش تقسیم و حل

  • تطابق لبه

  • هیستوگرام

۳. روش استفاده شده

در این بخش به توضیح روش استفاده شده در فاز دوم می پردازیم. برای دریافت فایل ها می توانید به GitHub مراجعه کنید.

در این فاز از روش Haar-like features استفاده کردیم. این روش از digital image features استفاده میکند. در توضیح این روش به اختصار می توان گفت که ویژگی های تصویر بر اساس تفاضل مجموع پیکسل های یک ناحیه ی مستطیل تعریف می گردند.

sum = I(C) + I(A) - I(B) - I(D)

در این فاز از کتابخانه ی OpenCV نسخه ی ۲.۴ استفاده شده است. با استفاده از Cascade Classifier Training که امکان Training بر اساس Haar-like features را به ما می دهد و تعداد زیادی داده ی آموزشی مشتمل بر دو دسته، دسته ای حاوی عکس های بدون خودرو و دسته ای شامل عکس های خودرو، و دو فایل توصیف گر، یکی برای عکس های بدون خودرو یا به اصطلاح پس زمینه و دیگری توصیف گر عکس های حاوی خودرو و محل خودرو یا خودرو های موجود در تصویر، فایل هایی به دست می آیند که نتیجه یادگیری بر روی داده های تست بوده. سپس این فایل ها به برنامه ای که به زبان سی پلاس پلاس نوشته شده داده می شوند تا آن برنامه با استفاده از آن ها بتواند در صورت وجود خودرو در تصویر محل آن را مشخص کند.

در ادامه به توضیح چگونگی استفاده از فایل های موجود در Github خواهیم پرداخت البته لازم به ذکر است که این توضیحات در ReadMe پروژه نیز موجود است و این توضیحات برای سیستم عامل لینوکس ارایه گردیده است.

ابتدا کد را کامپایل میکنیم، البته باید دقت شود که کتابخانه های مربوطه را نیز به کامپایلر معرفی کنیم.

سپس فایل اجرایی را با پارامتر های زیر اجرا میکنیم:

  • آدرس عکس

  • فایل یا فایل های مربوط به ما حصل Cascade Classifier

به عنوان مثال:

./output image.bmp cascade1.xml cascade2.xml cascade3.xml cascade4.xml cascade.xml

البته به دلیل حجم زیاد فقط فایل های حاصل شده از Train های مختلف را در GitHub قرار داده ام و پس از کامپایل با استفاده از دستور بالا آن را اجرا کنید.

۴. روش پیشنهادی

روش پیشنهادی برای تشخیص خودرو در تصویر، روش ژنتیک الگوریتم است. زیرا این روش بدون نیاز به دانش اولیه و مداخله انسان قابل پیاده سازی است. همچنین در زمینه هایی مانند شناسایی خودرو، شناسایی صورت و شناسایی هواپیما در تصویر این روش به دقت ۱۰۰٪ رسیده است.

البته سعی خواهد شد از الگوریتم ECO feature که بر اساس الگوریتم ژنتیک است استفاده گردد. این الگوریتم بسیار قوی و جدید است به طوری که برای شناسایی اشیا به صورت عمومی در تصاور استفاده می گردد.

توضیحات تفضیلی در مورد این روش در مقاله مربوطه که در بخش مراجع آمده قابل مشاهده است.

۵. مراجع

  • Computational method of feature selection, Edited by Huan Liu & Hiroshi Motoda


  1. Labeling

  2. Automotive Safety

  3. Video Indexing

  4. Tracking

  5. Recognition by part

  6. Appearance-based method

  7. Feature-based method

  8. Interpretation trees

  9. Hypothesize and test

  10. Pose consistency

  11. Pose clustering

تایید شده

بسم الله الرحمن الرحیم

توضیحات کامل و خوب است .

بهتر بود اگر در انتهای هر روش منبعی که روش مذکور از آن برداشت شده است نیز مشخص می شد تا خواننده برای کسب اطلاعات بیشتر بتواند به آن مراجعه کند.

به نظر می رسید قرار است در قسمت کارهای مرتبط توضیحی در مورد سایر روش ها نیز وجود داشته باشد . تا جایی که بنده متوجه شدم ، توضیحات این بخش(سایر روش ها) بسیار مختصر است.

ضمنا بهتر است توضیحات به گونه ای باشد که برای شخصی بدون هیچ گونه اطلاعات اولیه در این زمینه نیز مفید واقع شود. برای مثال می توان برای مفاهیمی مانند الگوریتم ژنتیک یا ECO feature که در شرح روش پیشنهادی استفاده شده اند ، توضیحی مختصر ارائه داد .

نمره ای که بنده به این پروژه می دهم پنج است چون به نظرم ضعف هایی که در بالا ذکر شد ، با وجود تلاشی که برای کد زنی انجام شده و امتیاز مثبت برنامه نویسی در این بخش جبران می شود.

محمد غضنفری

به طور کلی کارت خوب بود برای این فاز ولی به این چندتا نکته توجه داشته باش:

  • تو متنت از کلمات و ترکیبات انگلیسی زیاد استفاد ه کردی که میتونی خیلی از اونها رو بیاری تو پاورقی

  • به نظر میاد باید متنت رو قبل از اینکه نهایی کنی یه بار بخونیدش تا مرتب تر باشه. مثلا تو دو خط پشت سر هم یکبار از "ژنتیک الگوریتم" و یک بار از "الگوریتم ژنتیک" استفاده شده که من دومی را ترجیح می دهم.

  • فرق روش استفاده شده و روش پیشنهادی چیه؟ در واقع من فرق دو تا روش را می دونم منظورم اینه که چرا به به اولی گفتی روش استفاده شده و به بعدی گفتی روش پیشنهادی؟ یعنی تو روش اول رو پیشنهاد نمی کنی؟ پس چرا پیاده سازی کردیش؟ تو انتخاب اسم برای بخش های متنت دقت کن

  • توضیح به درد بخوری در مورد کدت ندادی. به نظرم باید ساختار کدت رو شرح می دادی و بعضی از توابع اصلی رو هم بهتر بود توضیح بدی. ضمنا ننوشتی چقدر از این کد کار خودته

موفق باشی و امیدوارم برای فاز بعد این مشکلات اندک هم حل بشه