تحلیل دادهها
From Wikipedia, the free encyclopedia
تحلیل داده (به انگلیسی: Data analysis) فرایند فهمیدن، پاکسازی، آمادهسازی و تحلیل دادههاست که به منظور استخراج اطلاعات سودمند برای تصمیمگیری انجام میشود. تحلیل دادهها امروزه در اغلب شاخههای علوم و صنعت از جمله اقتصاد، رشتههای مهندسی، بازاریابی، پزشکی و غیره کاربُرد دارد. و یا منظور از تحلیل داده به فرایند ارزیابی داده با استفاده از ابزارهای آماری و تحلیلی است. هدف از این مهارت تعیین اطلاعات مفید و همچنین کمک به فرایند گرفتن تصمیمات مهم در کسبوکار است.
داده کاوی، روش خاصی برای تحلیل دادهاست که بر مدلسازی و کشف دانش برای اهداف قابل پیشبینی و نه صرفاً توصیفی متمرکز است؛ در حالیکه هوش کسبوکار را پوشش میدهد که بهطور عمده بر تجمع اطلاعات کسبوکار متکی است.[1] در کاربردهای آماری، تجزیهوتحلیل دادهها را میتوان به آمار توصیفی، تجزیهوتحلیل دادههای اکتشافی (EDA) و تجزیهوتحلیل دادههای تأییدی (CDA) تقسیم کرد. EDA بر کشف ویژگیهای جدید در دادهها و CDA بر تأیید یا تکذیب فرضیههای موجود تمرکز دارد. علم تجزیهوتحلیل بر کاربرد مدلهای آماری برای پیشبینی یا طبقهبندی تمرکز دارد، در حالیکه تجزیهوتحلیل متن روشهای آماری، زبانی و ساختاری را برای استخراج و طبقهبندی اطلاعات از منابع متنی بهکار میبندد. تمام اینها، انواع تحلیل داده بهشمار میآیند.
یکپارچهسازی دادهها پیش زمینهای برای تحلیل دادهها است و تحلیل داده با مصورسازی داده و انتشار داده رابطۀ نزدیکی دارد. واژه تحلیل داده گاهی به عنوان مترادف برای مدلسازی داده استفاده میشود.