ایجاد بی‌ناظر هستان‌شناسی

یکی از بزرگترین اهداف شاخه پردازش زبان طبیعی در هوش مصنوعی، تبدیل متن غیر ساخت‌یافته زبان طبیعی با دانش ساخت‌یافته و ماشین فهم می‌باشد. این هدف زیل مسائل مختلفی در یادگیری ماشین و پردازش زبان طبیعی از قبیل استخراج اطلاعات، مطالعه ماشینی و ... بیان شده است.
یکی از اشکال مرسوم دانش قابل فهم پردازش توسط ماشین هستان شناسی می‌باشد. هستان‌شناسی مدلی انتزاعی از جهان واقع است که مفاهیم و روابط بین آن‌ها را در حوزه موضوعی مورد بحث نمایش می‌دهد.

روش‌های انسانی و یا با ناظر ایجاد یک هستان‌شناسی، بسیار پر زحمت و پر هزینه می‌باشد و با توجه به محدودیت‌های این روش‌ها، ایجاد یک هستان‌شناسی عام که وابسته به حوزه موضوعی خاصی نباشد با استفاده از روش‌هایی که مستلزم نظارت انسانی می‌باشد بسیار دشوار است.

به همین جهت و با توجه به حجم عظیم منابع متنی غیر ساخت‌یافته تولید شده در سال‌های اخیر در قالب وب. دانشمندان حوزه یادگیری ماشین و پردازش زبان طبیعی علاقمند به روش‌هایی شده‌اند که هستان‌شناسی را با بهره‌گیری از این منابع عظیم متنی بدون نیاز به نظارت انسانی ایجاد می‌نماید. تولید هستان‌شناسی به صورت بی‌ناظر این امکان را ایجاد می‌کند که بتوان هستان‌شناسی‌های بسیار عظیم و با حوزه موضوعی عام به سرعت و با هزینه بسیار کمتری ایجاد نمود، همچنین روش‌های بی‌ناظر ایجاد هستان‌شناسی امکان گسترش همیشگی هستان‌شناسی را با کاوش در سند‌های متنی روز افزون وبی را در اختیار قرار خواهد داد.
در این پروژه هدف بررسی روش‌های تشخیص آماری الگو و یادگیری ماشین در ایجاد بی‌ناظر هستان‌شناسی و پیاده‌سازی یکی از آن‌ها می‌باشد.

  • این پروژه توسط یک بنگاه تجاری تعریف شده است و اگر به خوبی انجام شود، مورد حمایت قرار می‌گیرد.

مقدمه

کارهای مرتبط

آزمایش‌ها

کارهای آینده

مراجع

[1] Wong, Wilson, Wei Liu, and Mohammed Bennamoun. "Ontology learning from text: A look back and into the future." ACM Computing Surveys (CSUR) 44.4 (2012): 20.‏
[2] Poon, Hoifung, and Pedro Domingos. "Unsupervised ontology induction from text." Proceedings of the 48th annual meeting of the Association for Computational Linguistics. Association for Computational Linguistics, 2010.‏
[3] Mousavi, Hamid, et al. Ontoharvester: An unsupervised ontology generator from free text. CSD Technical Report# 130003), UCLA, 2013.‏
[4] Nakashole, Ndapandula T. "Automatic extraction of facts, relations, and entities for web-scale knowledge base population." (2013).‏

پیوندهای مفید