نویسنده این متن کیست؟ پروژه تشخیص خودکار نویسنده به دنبال روشهایی میگردد که به این پرسش پاسخ دهد.
در واقع این پروژه باید با استفاده از مجموعه کوچکی (کمتر از ۱۰ سند متنی) از یک نویسنده، به ازای هر سند متنی که نویسنده آن مجهول است، به این پرسش پاسخ دهد که آیا نویسنده سند مجهول نیز با سندهای قبل یکسان است یا خیر.
۱. مقدمه
تشخیص نویسنده ی متن در بسیاری از حوزه هایی که شامل بازیابی اطلاعات و زبان شناسی هستند یک مسئله مهم به شمار می رود، همچنین در زمینه های کاربردی مانند، تعقیب قانونی یک متن و روزنامه نگاری که پیدا کردن نویسنده ی یک متن ممکن است جان انسانی را نجات دهد (مانند یادداشتی برای باج خواهی)، از اهمیت به سزایی برخوردار است.
چارچوب کلی تمام راه حل های پیشنهادی برای حل این مسئله استفاده از طبقه بندی متن (Text Classification) است. به این ترتیب که با استفاده از تعداد محدودی سند از نویسنده های مشخص، نویسنده ی یک سند مجهول را می یابیم. مسئله ی مهم بعدی حصول اطمینان از این است که آیا سند جدید متعلق به یکی از نویسنده های شناخته شده می باشد یا خیر؟
در زندگی واقعی، زبان شناسان حرفه ای پزشکی قانونی خود برای تشخیص نویسنده ی مجهول اغدام می کنند. به منظور پر کردن شکاف میان زبان شناسی و علوم کامپوتر نیاز به بکارگیری و تلفیق تجربیات هر دو زمینه ی علمی وجود دارد.
۲. کارهای مرتبط
۳. آزمایشها
۴. کارهای آینده
۵. مراجع
Efstathios Stamatatos. A Survey of Modern Authorship Attribution Methods. of the American Society for Information Science and Technology, Volume 60, Issue 3, pages 538-556, March 2009.
# پیوندهای مفید