درخت تصمیم

Decision Tree Learning


گردآورنده: بهاره مسعودی

درخت تصمیم (Decision Tree) یکی از رویکرد های مدل سازی و پیش بینی کارآمد است که در زمینه علوم آماری، داده کاوی و Machine Learning کاربرد دارد. هدف درخت تصمیم پیش بینی ارزش یک هدف (متغیر خاص) بر حسب چندین متغیر وروردی است. Decision Tree یک نمایش ساده در عین حال موفق ترین روش برای طبقه بندی نمونه هاست.

درخت تصمیم دارای سه جزء اصلی است:

  •  ریشه (Root Nodes): به گره آغازین درخت ریشه گویند.
  • برگ (Leaf Nodes): برگ حاوی سوال ها و معیار هایی است که باید به آن ها پاسخ داده شود.
  • شاخه (Branches): شاخه ها همانند فلش هایی هستند که گره ها را به یکدیگر متصل می کنند جریان را از سوال تا پاسخ به ما نشان می دهند.

هر گره به طور معمول دو یا چند گره دیگر را گسترش می دهد. به عنوان مثال اگر سوال مطرح شده در گره اول دارای پاسخ بله یا خیر باشد، هر کدام از بله و خیر خود شامل گره های دیگر می شوند.

 

 

decision tree

 

 

انواع درخت تصمیم

  • درخت طبقه بندی (Classification Tree): این نوع درخت زمانی مورد استفاده قرار می گیرد که پیش بینی داده ها در یک سطح صورت بگیرد.
  • درخت رگرسیون (Regression Tree): از این درخت هنگامی استفاده می شود که قرار است پیش بینی روی اعداد واقعی صورت بگیرد.

به دو حالت فوق در اصطلاح (CART (Classification and Regression Tree گویند.

  • MARS: به درخت تصمیم گسترش یافته گویند. علت گسترش درخت بهبود عملکرد آن در حجم وسیعی از داده می باشد.

بعضی از متد ها هستند که به آن ها متد های گروهی گفته می شود و در آن ها از یک یا چند درخت تصمیم استفاده می شود:

  • Bagging decision trees: با استفاده از نمونه برداری یا جایگزینی مجدد داده ها، چندین درخت تصمیم بوجود می آورد و برای تصمیم گیری نهایی نیز به رای کلی آن ها توجه می کند.
  • Random Forest: استفاده از چندین درخت تصمیم در جهت بهبود ارزش طبقه بندی.
  • Boosted Trees: در جهت مرتفع نمودن مشکل درخت طبقه بندی و رگرسیون مورد استفاده قرار می گیرد.
  • Decision list: از خاص ترین متد ها در درخت تصمیم است. در این حالت درخت تصمیم یک طرفه است، به این صورت که هر گره داخلی دقیقا یک برگ دارد.

 

مزایا

  • درک راحت و استفاده آسان
  • درخت تصمیم قدرت غربالگری و انتخاب متغیر را دارد
  • برای تهیه و تولید به تلاش کم نیاز دارد
  • با پارامتر ها و روابط غیر خطی نیز سازگار است
  • از استدلال مبنی بر احتمال مشروط استفاده می کند
  • برای موقعیت های نا مشخص، پاسخ های استراتژیک مناسب دارد
  • به اطلاعات اولیه کم نیازمند است

 

محدودیت ها

درخت در بعضی مواقع غیر قابل اعتماد است به این صورت که کوچکترین تغییر قسمتی از آن ممکن است روی تمام قسمت های دیگر تغییر ایجاد کند و جواب نهایی را نیز تحت تاثیر قرار دهد. از سوی دیگر یادگیرندگان درخت تصمیم گاهی درخت های بسیار پیچیده تولید می کنند در این صورت اطلاعات به خوبی به کل درخت منتقل نمی شود.

 

Decision Tree & IOT

درخت تصمیم یک شریک پایدار در پلتفرم IOT است و به ما در قسمت های زیر کمک می کند:

  • ورود به مراکز داده و تجزیه و تحلیل داده ها
  • پشتیبانی از محصولات در شبکه های حسگر
  • عملیات از راه دور
  • وسایل هوشمند
  • بهبود کارایی
  • افزایش امنیت

 

 


مطالب مرتبط


منابع