MNIST (база данных)

База данных MNIST (сокращение от «Modified National Institute of Standards and Technology») — объёмная база данных образцов рукописного написания цифр. База данных является стандартом, предложенным Национальным институтом стандартов и технологий США с целью калибрации и сопоставления методов распознавания изображений с помощью машинного обучения в первую очередь на основе нейронных сетей^[1]^[2]. Данные состоят из заранее подготовленных примеров изображений, на основе которых проводится обучение и тестирование систем^[3]^[4]. База данных была создана после переработки оригинального набора чёрно-белых образцов размером 20x20 пикселей NIST. Создатели базы данных NIST, в свою очередь, использовали набор образцов из Бюро переписи населения США, к которому были добавлены ещё тестовые образцы, написанные студентами американских университетов^[5]. Образцы из набора NIST были нормализированы, прошли сглаживание и приведены к серому полутоновому изображению размером 28x28 пикселей^[5].

База данных MNIST содержит 60000 изображений для обучения и 10000 изображений для тестирования^[6]. Половина образцов для обучения и тестирования были взяты из набора NIST для обучения, а другая половина — из набора NIST для тестирования^[7].

Производились многочисленные попытки достичь минимальной ошибки после обучения по базе данных MNIST, которые обсуждались в научной литературе. Рекордные результаты указывались в публикациях, посвящённых использованию свёрточных нейронных сетей, уровень ошибки был доведён до 0,23 %^[8]. Сами создатели базы данных предусмотрели несколько методов тестирования^[5]. В оригинальной работе указывается, что использование метода опорных векторов позволяет достичь уровня ошибки 0,8 %^[9].

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

Тип	Структура	Искажения	Предварительная обработка	Ошибка (%)
Линейный классификатор	Одноуровневый перцептрон	Нет	Нет	12^[8]
Линейный классификатор	Попарный линейный классификатор	Нет	Выравнивание	7.6^[9]
Метод k ближайших соседей	K-NN с нелинейной деформацией (P2DHMDM)	Нет	Shiftable edges	0.52^[20]
Gradient boosting	Обработка остатков на базе признаков Хаара	Нет	Признаки Хаара	0.87^[21]
Нелинейный классификатор	40 PCA + квадратичный классификатор	Нет	Нет	3.3^[9]
Метод опорных векторов	Виртуальная система опорных векторов, deg-9 poly, 2-pixel jittered	Нет	Выравнивание	0.56^[22]
Нейронная сеть	2-уровневая сеть 784-800-10	Нет	Нет	1.6^[23]
Нейронная сеть	2-уровневая сеть 784-800-10	Упругие деформации	Нет	0.7^[23]
Глубокая нейронная сеть	6-уровневая сеть 784-2500-2000-1500-1000-500-10	Упругие деформации	Нет	0.35^[24]
Свёрточная нейронная сеть	6-уровневая сеть 784-40-80-500-1000-2000-10	Нет	Расширение данных для обучения	0.31^[14]
Свёрточная нейронная сеть	6-уровневая сеть 784-50-100-500-1000-10-10	Нет	Расширение данных для обучения	0.27^[15]
Свёрточная нейронная сеть	Ансамбль из 35 CNN-сетей, 1-20-P-40-P-150-10	Упругие деформации	С нормализацией	0.23^[8]
Свёрточная нейронная сеть	Ансамбль из 5 CNN-сетей, 6-уровней 784-50-100-500-1000-10-10	Нет	Расширение данных для обучения	0.21^[16]
Случайное мультимодельное глубокое обучение (RMDL)	30 моделей случайного глубокого обучения (RDL) (10 CNN, 10 RNN и 10 DNN)	Нет	Нет	0.18^[18]

MNIST (база данных)

Качество результата и развитие подходов

Сопоставление систем

См. также

Примечания

Литература

Ссылки

Wikiwand - on