چکیده

در دنیای وب و به خصوص شبکه های اجتمایی خبر ها نقش مهمی را بین افراد دارا هستند و می توانند گروهی را تحت تاثیر قرار دهند و در این بین دسته ای از افراد هستند که بین اعضا از اعتبار بالایی برخوردار هستند و پیروان آنها نیز او را تایید می­کنند و هر خبر یا رویدادی که او به اشتراک بگذارد، آنها نیز آن را به اشتراک میگذارند و به همین ترتیب خبر در بیشتر شبکه های اجتمایی گسترش میابد.

در این پروژه قرار است جریان هایی که این افراد ایجاد میکنند را تشخیص و منشع آنها را نیز پیدا نمود.


مقدمه

امروزه رشد سریع شبکه ای اجتماعی باعث شده افراد در زندگی شخصی خود زمان بیشتر را در این شبکه ها بگذرانند و به همین علت این شبکه معیاری برای مطالعه رفتار و انگیزه­ی افراد در چرایی استفاده از شبکه های اجتمایی قرار گرفته است. همچنین مطالعات بر روی این شبکه ها نشان داده است که خبر یا هر منبعی که باعث خوشی و شادی افراد میشود (که خود یکی از فاکتور های تاثیرگذار است) از اهمیت بالای برخوردار است[1].


انگیزه برای داده کاوی در رسانه های اجتماعی

اطلاعات در دسترس از طریق رسانه های اجتماعی می تواند به ما بینش شبکه های اجتماعی و جوامعی که قبلا در هر دو فیلد مقیاس و انداره امکان پذیر نبوده را بررسی کنیم. این رسانه های دیجیتال می تواند از مرزهای دنیای فیزیکی به مطالعه روابط انسانی [2] و اندازه گیره محبوبیت اجتماعی و سیاسی افراد در یک منطقه بدون برری صریح و روشن برسانند[3، 4، 5]. رسانه های اجتماعی بزرگی مانند فیس بوک و توییتر منبع ایده آل برای مطالعه مکانیزم ها و روندهای تاثیر گذاری است. با این حال، این کاری بسیار دشوار است. برای به دست آوردن اطلاعات مفید از داده های رسانه های اجتماعی بدون استفاده از فن آوری های داده کاوی کاری بسیار سخت و طاقت فرسا است.

فرد تاثیرگذار

تعریفی که از فرد تاثیرگذار توسط یک جامعه از محققان درگیر در پروژه IARPA جمع بندی شده است شامل ویژگی های زیر است[6]:

  1. دارای اعتبار در گروه.

  2. تلاش برای متقاعد کردن دیگران حتی اگر دیگران با حرف او مخالف باشند.

  3. معرفی موضوعات یا ایده هایی که دیگران آنهارا انتخاب و یا پشتیبانی میکنند.

دارای اعتبار بودن به معنی این است که ایده و نظر های فرد تاثیرگذار توسط افراد شناخته شده و مشهور به رسمیت شناخته میشود. ممکن است در ابتدا به نظریات یا ایده های خود پافشاری نماید ولی سرانجام بتواند افکار خود را در طی دراز مدت به پیروانش اثبات نماید. این فرد لازم نیست در بحث و یا گروهی که در آن فعالیت می کنند فعال باشند تا بتوانند حمایت و پشتیبانی آنها را دریافت کنند، او حرف خود را از طریق فراهم آوری جواب های قابل قبول، آوردن بینش یا ایده ای جدید و یا با پیدا کردن موارد خاص که باعث رد یا تایید مسئله میشود نظریات دیگران به نظر خود نزدیک کند.

چالش های رو به رو

طبق دیتاستی که در سایت کگل موجود است و از توییتر گرفته شده، باید الگوریتم خودآموزی پیاده سازی شود که بر اساس مقادیر و جواب داده شده در دیتاست train بتواند بین هر دو فردی که بعد از مرحله­ی آموختن به برنامه داده میشود قضاوت کرده و فردی که تاثیر گذاری اش بیشتر است را اعلام کند. در واقع برنامه باید توانایی بدست آوردن درصد تاثیرگذاری هر فرد را داشته باشد و بین این دو عدد عمل قضاوت را انجام دهد.

پارامتر ها در دیتاست:

  1. follower_count

  2. following_count

  3. listed_count

  4. mentions_received

  5. retweets_received

  6. mentions_sent

  7. retweets_sent

  8. posts

  9. network_feature_1

  10. network_feature_2

  11. network_feature_3

نحوه ارزیابی برنامه

همان طور که گفته شد برنامه میزان تاثیرگذاری افراد را با مقادیری بیم صفر و یک مشخص میکند درنتیجه بعد از اینکه هر یک از رکورد ها خوانده شد و درصد تاثیرگذاری محاسبه شد آن را با جواب مقایسه میکند و اگر درست بود یک امتیاز مثبت تلقی شده و بالعکس. این امتیاز ها به روند پیش بینی درصد تاثیرگذاری برنامه تاثیر گذاشته و باعث بهبود آن میشود.
بعد از اتمام مرحله­ ی آموختن برنامه را با دیتاست از پیش تعیین شده اجرا کرده و میزان اختلاف جواب برنامه و جواب های پیش فرض مقایسه می­کنیم.

راه های پیدا کردن افراد تاثیرگذار

در آینده تکمیل میشود

کار های مرتبط

در آینده تکمیل میشود

آزمایش و نتایج

در آینده تکمیل میشود

کارهای آینده

پیاده سازی در سطح اولیه

منابع

[1]. Kuan-Yu Lin, Hsi-Peng Lu National Taiwan University of Science and Technology, No. 43 Keelung Road, Sec. 4, Taipei 106, Taiwan, ROC
[2]. H. Lauw, J. C. Shafer, R. Agrawal, and A. Ntoulas. Homophily in the digital
world: A livejournal case study. Internet Computing, IEEE, 14(2):15–23, march-april 2010
[3]. S. Kumar, N. Agarwal, M. Lim, and H. Liu. Mapping socio-cultural dynamics
in indonesian blogosphere. In Proceedings of the Third International
Conference on Computational Cultural Dynamics (ICCCD 2009),2009.
[4]. J. Ritterman, M. Osborne, and E. Klein. Using prediction markets and
twitter to predict swine 􀃀u pandemic. In F. M. Carrero, J. M. Gomez,
B. Monsalve, P. Puertas, and J. C. a. Cortizo, editors, Proceedings of the
1st International Workshop on Mining Social Media, pages 9–17, 2009.
[5]. B. Ulicny, M. Kokar, and C. Matheus. Metrics for monitoring a socialpolitical
blogosphere: A malaysian case study. Internet Computing,
IEEE, 14(2):34 –44, march-april 2010.
[6]. Proceedings of the 2012 Workshop on Language in Social Media (LSM 2012), pages 37–45,


اینکه چه کسانی در شبکه اجتماعی، جریان ایجاد می‌کنند و کدام‌ها بیشتر خواننده هستند برای صاحبان این شبکه‌ها مهم است.
نگاهی به داده‌های این پژوهش بیاندازید.

محمد غضنفری

«تشخیص افراد تاثیرگذار شبکه اجتماعی» مسئله جذابی است. بهتر است در بخش‌های «چکیده و مقدمه» به شکل بهتری این مسئله را معرفی کرده و به کاربردهای آن مثل بازاریابی، انتشار اخبار، عقاید و نوآوری‌ها اشاره کنید.
نکته مثبت کار شما این است که مجموعه دادگان خود را معرفی کرده‌اید، اما عنوان زیربخش آن را بهتر است «مجموعه دادگان» یا چیز مشابهی قرار دهید. «چالش‌های روبه‌رو» عنوان مناسبی برای این بخش نیست. همچنین وقتی به سایت کگل اشاره می‌کنید، پاورقی، لینک یا مرجعی به آدرس مجموعه دادگان بر روی این سایت قرار دهید. البته این کار را در انتهای صفحه انجام داده‌اید اما بهتر است در متن، پس از ذکر نام مجموعه‌ دادگان آن را قرار دهید.
ویژگی‌های معرفی شده از مجموعه دادگان را نیز شرح دهید. برای مثال منظور از network_feature_1 چیست؟ همچنین توضیحاتی نیز در رابطه با برچسب مجموعه دادگان لازم است. این طور استنباط می‌شود که در مجموعه دادگان، به ازای هر نمونه، مقدار تاثیرگذاری واقعی کاربر وجود دارد و قرار است بر اساس آن یادگیری صورت بگیرد. در صورت امکان شرح دهید که این برچسب چگونه به دست آمده است.
همچنین نیاز است روش‌ها و الگوریتم‌های یادگیری خود را شرح دهید که چگونه قرار است بر روی این مجموعه دادگان یادگیری صورت بگیرد. با توجه به این که هدف روش پیشنهادی شما پیش‌بینی مقدار تاثیرگذاری برای نمونه‌های تست مجموعه دادگان است، روش «ارزیابی» خود را نیز باید به خوبی شرح دهید که چگونه روش پیشنهادی خود را در نهایت ارزیابی خواهید نمود.
شکل‌های آورده شده طراحی شما است یا از جایی آورده شده است؟ اگر از جایی آورده شده است حتما باید مرجع آن ذکر شود و در هر دو حالت باید دارای برچسب بوده و مفاهیم داخل شکل را توضیح دهد. شکل تزئینی در مقاله علمی جایگاهی ندارد.