داده کاوی

Data Mining


گردآورنده: بهاره مسعودی

داده کاوی (Data Mining) به معنی کشف الگو و روابط پنهان میان داده ها با استفاده از الگوریتم های ریاضی است. به بیان ساده تر اگر در میان حجم زیادی از داده ها به  تحلیل و بررسی بپردازیم به صورتی که با استفاده از نتیجه تحلیل بتوانیم تصمیمات آگاهانه تری بگیریم به این معنا است که داده کاوی انجام داده ایم.

اهمیت Data Mining به این دلیل است که امروزه با پیشرفت تکنولوژی و ورود به حوزه آیوتی سالیانه حجم بسیار زیادی از داده ها تولید می شوند که لزوما تمامی آن ها معنی و مفهوم مهمی دربر ندارند بنابراین نیاز است که تحلیل و بررسی بر روی آن ها صورت گیرد. با استفاده از داده کاوی می توان:

  • هرج و مرج را در داده ها از بین ببرید
  • اطلاعات را درک کرد و نتایج را پیش بینی نمود
  • سرعت تصمیم گیری اگاهانه را بالا تر برد

 

data-mining

 

 

 

الگوریتم ها

در داده کاوی، داده های کلیدی و مهم به صورت ساخت یافته در Data Base ذخیره می شوند و برای کشف ارتباط در میان آن ها از الگوریتم های متعدد و زبان های برنامه نویسی خاص (( به عنوان مثال SQL )) استفاده می شود. از مهم ترین الگوریتم ها میتوان به موارد زیر اشاره کرد :

  • K-Maens
  • KNN
  • CART
  • EM

 

 

پارامتر ها و تکنیک ها

از جمله پارامتر های مهم در حوزه Data Mining می توان به موارد زیر اشاره کرد:

  • Path Analysis: این عبارت به دنبال کشف الگویی در میان داده هاست که یک رخداد را به سمت رخدادی دیگر هدایت می کند.
  • Sequence: یک الگو متداول از قرار گرفتن داده ها در Data Base است که در آن داده ها در یک لیست پشت سر هم واقع می شوند.
  • Classification: این پارامتر به دنبال الگویی جدید و بعضاً ایجاد یک سازماندهی جدید و متفاوت برای داده ها است.
  • Clustering: این پارامتر به شناخت گروهی از واقعیت های موجود در میان داده می پردازد که تا به حال شناخته نشده اند.

 

 

data-mining

 

 

 

ابزار ها

ابزار های Data Mining در بسیاری از حوزه ها اعم از ریاضیات، علم فرمانشناسی، ژنتیک و بازاریابی مورد استفاده قرار می گیرد. از مهمترین ابزار ها میتوان به موارد زیر اشاره کرد:

  • Web Mining: یکی از روش های Data Mining است با هدف تشخیص و درک رفتار مشتری و میزان تاثیر گذاری یک وب سایت به خصوص بر روی آن.
  • Machine Learning: از ابزار های مهم در Data Mining است که الگوریتم های جدید را در راستای یادگیری و تخمین زدن طراحی میکند.
  • Data Melt: از این ابزار برای انجام محاسبات پیچیده ریاضی استفاده می کنند.

 

به طور کلی میتوان گفت که داده کاوی به دلیل آشکار سازی الگو های پنهان در میان داده ها و تخمین زدن میتواند در حوزه های متعدد به ویژه کسب و کار تحولات و پیشرفت های عظیمی را رقم بزند فقط باید این علم را کامل شناخت و از ان به درستی استفاده کرد. همچنین امروزه به دلیل ورود به دنیای آیوتی با کلان داده ها رو به رو هستیم و سازمان ها برای به دست آوردن اطلاعات دقیق از داده ها با یک چالش بزرگ رو به رو هستند به همین دلیل به تکنیک هایی برای تحلیل و بررسی آن ها نیاز دارند. به این ترتیب استفاده از تکنیک و الگوریتم های داده کاوی در حوزه آیوتی بسیار لازم و ضروری است.

 

 

 

 


مطالب مرتبط


منابع