Даследаванне даных

From Wikipedia, the free encyclopedia

Remove ads

Даследаванне даных — пачатковы этап аналізу даных[en], у ходзе якога выяўляюцца характарыстыкі, выкіды[en] і заканамернасці ў даных з дапамогай статыстычных метадаў і візуалізацыі[en]. Можа праводзіцца як уручную, так і з дапамогай аўтаматызаваных метадаў[1]. Вынік даследавання — набор візуалізацый і метаданых[en], напрыклад максімум, мінімум і сярэдняе значэнне атрыбутаў даных[2].

Прадметы даследавання

У працэсе даследавання даных, пра кожны з іх атрыбутаў (напрыклад, слупок у табліцы[en]) збіраюцца і дакументуюцца наступныя звесткі[2]:

Акрамя гэтага, даследуецца карэляцыя паміж атрыбутамі і ствараюцца візуалізацыі.

Remove ads

Інструменты

Найбольш распаўсюджаныя мовы праграмаваня для даследавання даных — Python і R. Для візуалізацыі выкарыстоўваюцца такія інструменты, як Microsoft Power BI[en], Qlik[en], Tableau[en] і Jupyter[en][2]. Падобныя інструменты даюць магчымаць эфектыўней прэзентаваць вынікі праз інтэрактыўныя візуалізацыі[1].

Крыніцы

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads