Conjunto de dados
De Wikipedia, a enciclopédia encyclopedia
Um conjunto de dados ou "dataset" é uma coleção de dados normalmente tabulados. Por cada elemento (ou indivíduo) se indicam várias características. Cada coluna representa uma variável particular. Cada linha corresponde a um determinado membro do conjunto de dados em questão. Cada valor é conhecido como um dado. O conjunto de dados pode incluir dados para um ou mais membros, correspondente ao número de linhas.
Conjuntos de dados não tabulares podem assumir a forma de cadeias de caracteres envolvidas por marcações, como em um arquivo XML.
Quase todos os conjuntos de dados, embora eles muitas vezes possam ser escritos usando linguagens de programação de alto nível e números em base decimal, terminam escritos em código de máquina uma vez que o processamento por computador é envolvido. Assim, por toda a sua diversidade semântica e formas tabular ou não tabular, a maioria dos conjuntos de dados pode ser expressa em código binário como uma longa seqüência de zeros e uns.