تجزیه نحوی کم عمق متن

تجزیه کم‌عمق به فرآیند شناسایی و رده‌بندی بخش‌های سطحی (غیر درختی) و بدون هم‌پوشانی از یک جمله گفته می‌شود. این بخش‌ها به صورت عبارت‌های اسمی، عبارت‌های فعلی، عبارت‌های وصفی (صفت) و عبارت‌های حرف اضافه‌ای می‌توانند باشند. در واقع در تجزیه‌ی کم‌عمق ما به دنبال پیدا کردن بخش‌های اصلی نحوی در جمله هستیم، اما نمی‌خواهیم ساختار داخلی هر کدام از این بخش‌ها را نیز کشف کنیم. به این عملیات اصطلاحا Chunking یا Shallow Parsing گفته می‌شود.

در این پژوهش روش‌های مختلف تجزیه‌ی کم‌عمق را بررسی نموده و یک نمونه عملیاتی برای آن پیاده‌سازی می‌شود. مثال:

[NP Jack and Jill] [VP went] [ADVP up] [NP the hill] [VP to fetch] [NP a pail] [PP of] [NP water] .

  • این پروژه توسط یک بنگاه تجاری تعریف شده است و اگر به خوبی انجام شود، مورد حمایت قرار می‌گیرد.

مقدمه

کارهای مرتبط

آزمایش‌ها

کارهای آینده

مراجع

[1] Jurafsky, Dan, et al. Speech and language processing: An introduction to natural language processing, computational linguistics, and speech recognition. Vol. 2. Upper Saddle River: Prentice Hall, 2000. Chapter 13
[2] Zhang, Tong, Fred Damerau, and David Johnson. "Text chunking based on a generalization of winnow." The Journal of Machine Learning Research 2 (2002): 615-637.
[3] Bird, Steven, Ewan Klein, and Edward Loper. Natural language processing with Python. O'reilly, 2009. Chapter 7

پیوندهای مفید