پایان-نامه-تشخیص-پلاگاریسم-به-کمک-گراف-در-متون-فارسی
پایان نامه تشخیص پلاگاریسم به کمک گراف در متون فارسی
فرمت فایل دانلودی: .docx
فرمت فایل اصلی: docx
تعداد صفحات: 90

پایان نامه تشخیص پلاگاریسم به کمک گراف در متون فارسی
نوع فایل: word (قابل ویرایش)
تعداد صفحات : 90 صفحه

چکیده
تمرکز این پایان نامه روی جستجوی شباهت های مبتنی بر گراف، در متون مربوط به زبان های طبیعی است. نیاز به یک روش قوی برای ارائه متون، مسئله مهمی در زمینه تشخیص پلاگاریسم است، ما در این پروژه با توجه به این نیاز، روشی قدرتمند را برای ارائه زبان طبیعی معرفی نموده و از آن در تشخیص پلاگاریسم بهره برده ایم. برای این منظور مفهوم "فاصله اصلاح گراف" را بیان نموده و از آن برای محاسبه فاصله ی بین دو گراف استفاده کرده ایم. جملات توسط گراف های وابستگی ارائه شده اند که در آن ها کلمات توسط وابستگی هایشان به هم متصل شده اند. گراف وابستگی ساختار گرامری جملات را استخراج می کند. روش شباهت مبتنی بر گراف در مسئله تشخیص پلاگاریسم به کار برده شده است. مزیت اصلی ارائه مبتنی بر گراف، مربوط به توانایی این روش در تشخیص شباهت های بین کلمات است. ارزیابی ها نشان دادند که نتایج حاصل از گراف وابستگی نسبت به روش های مقایسه مستقیم گراف ها نتایج بهتری دارند. استفاده از فاصله اصلاح گراف برای مقایسه دو گراف منجر به بهبود نتایج گراف وابستگی می شود و کارایی آن را بالا می برد.
کلیدواژه: فاصله اصلاح گراف، پردازش زبان طبیعی، گراف های وابستگی، تشخیص پلاگاریسم

فهرست مطالب
مقدمه 2
۱-۱ توضیح مسئله 5
۱-۲ راه حلها 6
۱-۳ مشکلات موجود در پیادهسازی الگوریتم 6
۱-۴ ساختار پایاننامه 7
پیشینهی تحقیق 9
۲-۱ تشخیص پلاگاریسم 9
۲-۲ ابعاد تشخیص پلاگاریسم 12
۲-۲-۱ روش مبتنی بر گرامر 12
۲-۲-۲ روشهای مبتنی بر معنا 13
۲-۲-۳ روشهای ترکیبی 14
۲-۲-۴ روش تشخیص پلاگاریسم خارجی 14
۲-۳ روشهای محاسبه میزان شباهت گرافها 15
۲-۳-۱ روش بزرگترین زیرگراف مشترک – کوچکترین سوپرگراف مشترک 15
۲-۳-۲ روش مبتنی بر جستجوی فضای حالت 17
۲-۳-۳ روشهای احتمالی 18
۳-۱ تشخیص پلاگاریسم 23
۳-۱-۱ تطبیق n گرام 23
۳-۱-۲ وزندهی عبارت 23
۳-۱-۳ تعمیم عبارت 24
۳-۲ گرافهای وابستگی 25
۳-۲-۱ وابستگیها 26
۳-۳ فاصله ویرایش گراف 26
۳-۳-۱ عملیات ویرایش 26
۳-۳-۲ مسئلهی انتساب 27
۳-۳-۳ ماتریس هزینه 28
۳-۳-۴ الگوریتمهای انتساب 29
۴-۱ معماری 32
۴-۲ پیشپردازش متن 32
۴-۲-۱ پیدا کردن جملات 33
۴-۲-۲ ریشهیابی کلمات 34
۴-۲-۳ تشکیل گراف وابستگی 40
۴-۳ استخراج کاندیدا 44
۴-۳-۱ شاخصگذاری جمله 45
۴-۳-۲ استخراج جملات کاندیدا 45
۴-۴ تحلیل جزئیات 45
۴-۴-۱ الگوریتم فاصله ویرایش دو گراف 48
۴-۴-۲ تشخیص پلاگاریسم مبتنی بر GEDارائه شده در این پروژه 49
۵-۱ تشخیص پلاگاریسم جابجایی کلمات و تغییر ساختار جملات 55
۵-۱-۱ تغییرات ساختاری ۱۰ درصدی 56
۵-۱-۲ تغییرات ساختاری ۵۰ درصدی 57
۵-۲-۲ تغییرات ساختاری ۱۰۰ درصدی 59
۵-۲ تشخیص پلاگاریسم معنایی 60
۵-۲-۱ تغییرات معنایی ۱۰ درصدی 60
نتیجه گیری و پیشنهادات 64
مراجع 67

دانلود فایل
پرداخت با کلیه کارتهای عضو شتاب امکان پذیر است.