یافتن سوال‌های تکراری در کوئرا

پروژه Course object

کوئرا یک سایت پرسش و پاسخ است که تفاوت‌هایی با سایت‌های معمول پرسش و پاسخ دارد. این سایت محلی است برای به اشتراک گذاشتن دانش افراد خبره تقریبا در مورد هر چیزی! در واقع این سایت یک پلتفرم برای پرسیدن سوال و گرفتن پاسخ از کسانی است که در زمینه سوال خبره هستند و جواب‌های با کیفیتی می‌دهند.
در حال حاضر ماهانه حدود صد میلیون نفر از این سایت استفاده می‌کنند. پس پرسیدن سوال‌های تکراری امر غیرعادی نخواهد بود. سوال‌های تکراری در مورد یک مسئله کار کسانی که به دنبال سوال و جواب خاصی هستند را سخت می‌کند و همچنین پاسخ‌دهنده‌ را هم مجبور می‌کند که یک جواب را چند بار تکرار کند. همین مشکلات باعث شده که سوالات تکراری برای Quora تبدیل به یک چالش شود.
در این پروژه قصد داریم مدلی را مبتنی بر یادگیری ماشین برای تشخیص این که آیا یک جفت سوال دریافت شده تکراری هستند یا خیر آموزش داده شود. داده‌های مربوط به پرسش‌های کوئرا را می‌توانید از صفحه مربوط به این مسابقه دریافت نمایید.

۱. مقدمه

۲. کارهای مرتبط

۳. آزمایش‌ها

۴. مراجع

  • Berry, Michael W., ed. Survey of Text Mining I: Clustering, Classification, and Retrieval. Vol. 1. Springer, 2004.

۵. پیوندهای مفید