نویسنده این متن کیست؟ پروژه تشخیص خودکار نویسنده به دنبال روش‌هایی می‌گردد که به این پرسش پاسخ دهد.

در واقع این پروژه باید با استفاده از مجموعه کوچکی (کم‌تر از ۱۰ سند متنی) از یک نویسنده، به ازای هر سند متنی که نویسنده آن مجهول است، به این پرسش پاسخ دهد که آیا نویسنده سند مجهول نیز با سندهای قبل یکسان است یا خیر.

۱. مقدمه

تشخیص نویسنده ی متن در بسیاری از حوزه هایی که شامل بازیابی اطلاعات و زبان شناسی هستند یک مسئله مهم به شمار می رود، همچنین در زمینه های کاربردی مانند، تعقیب قانونی یک متن و روزنامه نگاری که پیدا کردن نویسنده ی یک متن ممکن است جان انسانی را نجات دهد (مانند یادداشتی برای باج خواهی)، از اهمیت به سزایی برخوردار است.

چارچوب کلی تمام راه حل های پیشنهادی برای حل این مسئله استفاده از طبقه بندی متن (Text Classification) است. به این ترتیب که با استفاده از تعداد محدودی سند از نویسنده های مشخص، نویسنده ی یک سند مجهول را می یابیم. مسئله ی مهم بعدی حصول اطمینان از این است که آیا سند جدید متعلق به یکی از نویسنده های شناخته شده می باشد یا خیر؟

در زندگی واقعی، زبان شناسان حرفه ای پزشکی قانونی خود برای تشخیص نویسنده ی مجهول اغدام می کنند. به منظور پر کردن شکاف میان زبان شناسی و علوم کامپوتر نیاز به بکارگیری و تلفیق تجربیات هر دو زمینه ی علمی وجود دارد.

۲. کارهای مرتبط

۳. آزمایش‌ها

۴. کارهای آینده

۵. مراجع

محمد غضنفری

شما مراجع مناسبی را معرفی نمرموده اید و تعداد آنها هم خیلی کم است. طبیعتا به همین دلیل در بخش کارهای مرتبط هم مطلبی ننوشته اید. در ضمن روش پیشنهادی خودتان را شرح نداده اید.

ضمن عرض خسته نباشید امیدوارم با رعایت این نکات در فازهای آتی پروژه تان موفق تر باشید.