خوشهبندی یکی از شاخه های یادگیری بدون نظارت بوده و فرآیند خودکاری است که در طی آن، نمونهها به دسته هایی که اعضای آن مشابه یکدیگر هستند، تقسیم میشوند و به این دسته ها، خوشه گفته میشود. بنابراین خوشه مجموعه ای از اشیاء است که در آن اشیاء با یکدیگر مشابه بوده و با اشیاء موجود در خوشه های دیگر، مشابهتی ندارند. برای مشابه بودن میتوان معیارهای مختلفی از قبیل معیار فاصله بین دادهها، قابلیت اطمینان داده ها (Xing Wu ., 2014)، دسترسپذیری داده ها (Tsozen Y., 2014) ...
|
کد QR محصول |
خوشه بندی یکی از شاخه های یادگیری بدون نظارت بوده و فرآیند خودکاری است که در طی آن، نمونهها به دسته هایی که اعضای آن مشابه یکدیگر هستند، تقسیم میشوند و به این دسته ها، خوشه گفته میشود. بنابراین خوشه مجموعه ای از اشیاء است که در آن اشیاء با یکدیگر مشابه بوده و با اشیاء موجود در خوشه های دیگر، مشابهتی ندارند. برای مشابه بودن میتوان معیارهای مختلفی از قبیل معیار فاصله بین دادهها، قابلیت اطمینان داده ها (Xing Wu ., 2014)، دسترسپذیری داده ها (Tsozen Y., 2014) و سایر معیارهای کیفی و کمی داده را برای خوشه بندی مورد استفاده قرار داد و دادههایی را که بر اساس این ویژگیها، مشابه هستند، بعنوان یک خوشه در نظر گرفت. هدف اصلی خوشهبندی یافتن خوشه های مشابه از اشیاء در بین نمونه های ورودی است، اما هیچ معیار مطلقی برای تعیین کیفیت خوشه بندی وجود ندارد، و این موضوع بستگی به مساله و نظر کاربر دارد که باید تصمیم بگیرد که آیا نمونه ها بدرستی خوشه بندی شده اند یا خیر. با این حال معیارهای مختلفی برای مناسب بودن یک خوشه بندی ارائه شده است که میتواند کاربر را برای رسیدن به یک خوشه بندی مناسب راهنمایی کند. یکی از مسایل مهم در خوشه بندی، انتخاب تعداد خـوشه ها است. اندازهگیری سرعت، کارایی، پیچیدگی زمانی و پیچیدگی حافظه از سایر معیارهای اندازهگیری کیفیت خوشه بندی داده هستند.در سالهای اخیر، تحقیقات بسیاری در زمینه خوشه بندی بندی داده ها انجام شده است. یکی از پرکاربردترین روشهای خوشه بندی دادهها استفاده از اتوماتای یادگیر است. اتوماتاي يادگير، يك مدل انتزاعي است كه تعداد محدودي عمل را ميتواند انجام دهد. هر عمل انتخاب شده توسط محيطي احتمالي ارزيابي ميگردد و پاسخي به اتوماتاي يادگير داده ميشود. اتوماتاي يادگير از اين پاسخ استفاده نموده و عمل خود را براي مرحله بعد انتخاب ميكند. اتوماتاهاي يادگير به دو دسته عمده اتوماتاي يادگير با ساختار ثابت و اتوماتاي يادگير با ساختار متغير تقسيم ميشوند. در اتوماتاي تصادفي با ساختار ثابت احتمال اقدامهاي اتوماتا ثابت هستند. درحاليكه در اتوماتاي تصادفي با ساختار متغير احتمالات اقدامهاي اتوماتا در هر تكرار بِروز ميشوند. در اتوماتاي يادگير با ساختار متغير، تغيير احتمالهاي اقدامها بر اساس الگوريتم يادگيري انجام ميشود. در بیشتر الگوریتمهای خوشه بندی داده، از اتوماتای یادگیر با ساختار متغییر استفاده میشود. در برخی از الگوریتمهای خوشه بندی از راهکارهای فازی، برای تکمیـل عملکرد اتوماتای یادگیر استفاده شده است. یکی از پرکاربـردترین روشها برای تصمیمگیریهای چند عامله استفاده از ساختار تحلیل سلسله مراتبی[1] فازی است. روند تحلیل سلسله مراتبی، از روش تصمیمگیری چند عامله[2]برای تصمیمگیری استفاده میکند و از بین چندین گزینه، یک گزینه را انتخاب میکند. توماس ساعتی[3]، در سال 1980، روند تحلیل سلسله مراتبی را به عنوان ابزاری قدرتمند معرفی کرده است، در شرایطی که چندین هدف در موقعیتها و شرایط مربوطه وجود داشته باشد، این روش در روند تصمیم گیری استفاده میشود. روند تحلیل سلسله مراتبی نشان دهنده رفتار طبیعی و فکر انسان است. این روش، مسائل پیچیده را تجزیه و تحلیل کرده و آنها را به صورت ساده تغییر و پس از آن شروع به حل آنها میکند (Mohammadi, Homayoun, & Zadeh, 2012). بنابراین در این پژوهش به منظور افزایش کارایی الگوریتم خوشهبندی و همچنین افزایش سرعت در خوشه بندی دادهها، از یک راهکار خوشهبندی با استفاده از اتوماتای یادگیر مبتنی بر راهکار تحلیل سلسله مراتبی فازی، استفاده میشود. با استفاده از این راهکار، میتوان به صورت همزمان از دو یا چند معیار مختلف کیفی و کمـی برای خوشه بندی دادهها، استفاده کرد. استفاده از این ساختار ضمن افزایش کارایی الگوریتم، دقت خوشه بندی دادهها را افزایش میدهد، زیرا از چند معیار مختلف برای خوشه بندی و تعیین شباهت بین دادهها استفاده میشود. همچنین روش پیشنهادی به علت استفاده از چند معیار مختلف برای خوشه بندی دادهها تعداد مناسبی از خوشه ها را تولید میکند.
[1] -AHP
[2] -MADM (Multiple Attribute Decision Making)
[3] -Tomas Sati