Топ питань
Часова шкала
Чат
Перспективи

Список наборів даних для досліджень з машинного навчання

стаття-список у проєкті Вікімедіа З Вікіпедії, вільної енциклопедії

Remove ads

Набори даних використовуються для дослідження машинного навчання, посилання на них використовуються в наукових академічних статтях. Набори даних є невід’ємною частиною галузі машинного навчання. Значні досягнення в цій галузі можуть бути результатом прогресу в алгоритмах навчання (наприклад, deep learning), комп'ютерного обладнання та, що не так очевидно, доступності високоякісних наборів навчальних даних.[1] Високоякісні марковані навчальні набори даних для алгоритмів машинного керованого навчання і напівкероване навчання зазвичай важко та дорого створити через велику кількість часу, необхідного для позначення даних. Хоча їх не потрібно позначати, високоякісні набори даних для напівкерованого навчання також може бути складним і дорогим у створенні. Набори даних орієнтовані, здебільшого, на вирішення задач класифікації та розпізнавання і містять оцифровані зображення, відео, тексти, сигнали, звуки тощо.[2][3][4][5]

Remove ads

Данні зображення

Узагальнити
Перспектива

Ці набори даних складаються переважно із зображень або відео використовуються для таких завдань, як виявляння об'єктів, розпізнавання обличчя та класифікація за кількома мітками[en].

Розпізнавання осіб

У комп'ютерному баченні зображення облич широко використовуються для розробки систем які розпізнають  обличчя, займаються виявленням облич та багатьох інших проектів.

Більше інформації Назва, Опис ...

Розпізнавання дій

Більше інформації Назва, Опис ...

Виявлення та розпізнавання об'єктів

Більше інформації Назва, Опис ...

Почерк і розпізнавання символів

Більше інформації Назва, Опис ...

Аерофотознімки

Більше інформації Назва, Опис ...

Інші зображення

Більше інформації Назва, Опис ...
Remove ads

Текстові дані

Узагальнити
Перспектива

Ці набори даних складаються переважно з тексту для таких завдань, як обробка мови, аналіз настроїв, переклад і кластерний аналіз.

Відгуки

Більше інформації Назва, Опис ...

Новини

Більше інформації Назва, Опис ...

Повідомлення

Більше інформації Назва, Опис ...

Твіттер і твіти

Більше інформації Назва, Опис ...

Діалоги

Більше інформації Назва, Опис ...

Інший текст

Більше інформації Назва, Опис ...
Remove ads

Звукові дані

Узагальнити
Перспектива

Ці набори даних складаються зі звуків і звукових функцій, які використовуються для таких завдань, як розпізнавання мовлення та синтез мовлення.

Мовлення

Більше інформації Назва, Опис ...

Музика

Більше інформації Назва, Опис ...

Інші звуки. Класифікація

Більше інформації Назва, Опис ...
Remove ads

Дані сигналу

Узагальнити
Перспектива

Набори даних, що містять інформацію про електричний сигнал, що вимагає певної обробки сигналу для подальшого аналізу.

Електричні

Більше інформації Назва, Опис ...

Відстеження рух

Більше інформації Назва, Опис ...

Інші сигнали

Більше інформації Назва, Опис ...
Remove ads

Фізичні дані

Узагальнити
Перспектива

Набори даних з фізичних систем.

Фізика високих енергій

Більше інформації Назва, Опис ...

Системи

Більше інформації Назва, Опис ...

Астрономія

Більше інформації Назва, Опис ...

Наука про Землю

Більше інформації Назва, Опис ...

Інші фізичні

Більше інформації Назва, Опис ...
Remove ads

Біологічні дані

Узагальнити
Перспектива

Набори даних з біологічних систем.

Соціальні

Більше інформації Назва, Опис ...

Тварини

Більше інформації Назва, Опис ...

Гибкий

Більше інформації Назва, Опис ...

Рослини

Більше інформації Назва, Опис ...

Мікроб

Більше інформації Назва, Опис ...

Відкриття наркотиків

Більше інформації Назва, Опис ...
Remove ads

Дані про аномалії

Більше інформації Назва, Опис ...
Remove ads

Відповіді на питання

Узагальнити
Перспектива

Цей розділ містить набори даних, які мають справу зі структурованими даними.

Більше інформації Назва, Опис ...
Remove ads

Багатоваріантні дані

Узагальнити
Перспектива

Набори даних, що складаються з рядків спостережень і стовпців атрибутів, що характеризують ці спостереження. Зазвичай використовується для регресійного аналізу або класифікації, але можуть використовуватися й інші типи алгоритмів. Цей розділ містить набори даних, які не вписуються в вищезазначені категорії.

Фінанси

Більше інформації Назва, Опис ...

Погода

Більше інформації Назва, Опис ...

Перепис населення

Більше інформації Назва, Опис ...

Транзит

Більше інформації Назва, Опис ...

Інтернет

Більше інформації Назва, Опис ...

Ігри

Більше інформації Назва, Опис ...

Інші багатоваріантості

Більше інформації Назва, Опис ...
Remove ads

Кураторські сховища наборів даних

Узагальнити
Перспектива

Оскільки набори даних бувають у безлічі форматів і іноді можуть бути важкими у використанні, була проведена значна робота в організації та стандартизації формату наборів даних, щоб полегшити їх використання для дослідження машинного навчання.

  • OpenML:[525] веб-платформа з Python, R, Java та іншими API для завантаження сотень наборів даних машинного навчання, оцінки алгоритмів у наборах даних і порівняння продуктивності алгоритму з десятками інших алгоритмів.
  • PMLB:[526] велике сховище контрольних наборів даних для оцінки контрольованих алгоритмів машинного навчання. Забезпечує набори даних класифікації та регресії в стандартизованому форматі, які доступні через API Python.
  • Metatext NLP: веб-сховище https://metatext.io/datasets, яке обслуговується спільнотою, містить майже 1000 контрольних наборів даних і збільшується. Надає багато завдань від класифікації до QA, а також різні мови від англійської, португальської до арабської.
  • Appen[en]: Off the Shelf and Open Source Datasets, розміщені та підтримувані компанією. Ці біологічні, графічні, фізичні, відповіді на запитання, сигнальні, звукові, текстові та відеоресурси налічують понад 250 і їх можна застосувати до більш ніж 25 різних випадків використання[527].[527]
Remove ads

Дивись також

Примітки

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads