Топ питань
Часова шкала
Чат
Перспективи

Databricks

З Вікіпедії, вільної енциклопедії

Databricks
Remove ads

Databricks — американська компанія з корпоративного програмного забезпечення, заснована творцями Apache Spark[4]. Databricks розробляє веб-платформу для роботи зі Spark, яка забезпечує автоматизоване керування кластерами[en] та блокноти[en] в стилі IPython.

Коротка інформація Тип, Правова форма ...
Remove ads

Історія

Узагальнити
Перспектива

Databricks виріс з проекту AMPLab[en] в Каліфорнійському університеті в Берклі, який був залучений до створення Apache Spark, фреймворка розподілених обчислень з відкритим кодом, побудованого на основі Scala. Компанію заснували Алі Годсі[en], Енді Конвінскі, Арсалан Таваколі-Шираджі, Іон Стоіка[en], Матей Захарія[5], Патрік Венделл і Рейнольд Сін[en].

У листопаді 2017 року компанія була анонсована як сторонній сервіс Microsoft Azure через інтеграцію Azure Databricks[6].

Компанія розробляє проект з відкритим кодом Delta Lake, який спрямований на забезпечення надійності озер даних, при використанні у машинному навчанні та задачах поширених у науці про дані[7].

У червні 2020 року Databricks придбала інструмент з відкритим кодом Redash, який допомогає науковцям і аналітикам даних візуалізувати та створювати інтерактивні інформаційні панелі своїх даних[8].

У лютому 2021 року Databricks разом з Google Cloud забезпечили інтеграцію з рушієм Google Kubernetes і платформою BigQuery від Google[9]. Fortune оцінив Databricks як одне з найкращих великих «робочих місць для міленіалів» у 2021 році[10]. Тоді ж компанія заявила, що її продукцією користуються понад 5000 організацій[11].

У серпні 2021 року Databricks завершила свій восьмий раунд фінансування, зібравши 1,6 мільярда доларів і оцінка компанії склала 38 мільярдів доларів[12].

У жовтні 2021 року Databricks здійснила друге придбання німецької компанії 8080 Labs, яка створила платформу для розробки без використання коду[en]. Інструмент дослідження даних, створений цією компанією, який не вимагає кодування при використанні, — bamboolib[13].

Remove ads

Фінансування

У вересні 2013 року Databricks оголосила, що залучила 13,9 мільйона доларів від Andreessen Horowitz, і заявила, що прагне запропонувати альтернативу системі MapReduce від Google[14][15]. Microsoft була відомим інвестором Databricks у 2019 році, залученим у Series E на невизначену суму[16][17]. Компанія залучила фінансування в розмірі 1,9 мільярда доларів, включаючи 1 мільярд доларів США Series G віл холдінгу Franklin Templeton та отримала грошову оцінку в 28 мільярдів доларів у лютому 2021 року. Серед інших інвесторів Amazon Web Services, CapitalG[en] (компанія, що розвивається в рамках Alphabet, Inc.) і Salesforce Ventures[11].

Більше інформації Серія, Дата ...
Remove ads

Продукти

Узагальнити
Перспектива

Databricks розробляє та продає хмарну платформу даних, використовуючи маркетинговий термін «Lakehouse», що є словозлиттям на основі термінів «сховище даних» та «озеро даних[en]»[25]. Lakehouse від Databricks базується на фреймворку Apache Spark з відкритим кодом, який дозволяє виконувати аналітичні запити до напівструктурованих даних без використання традиційної схеми бази даних[26].

Delta Engine від Databricks був запущений у червні 2020 року як новий механізм запитів, який розташовується поверх Delta Lake, щоб підвищити продуктивність запитів[27]. Він сумісний з Apache Spark і MLflow, які також є проектами з відкритим кодом від Databricks[28].

У листопаді 2020 року компанія Databricks представила Databricks SQL (раніше відома як SQL Analytics) для запуску бізнес-аналітики та звітності на основі озер даних. Аналітики можуть запитувати набори даних безпосередньо за допомогою стандартного SQL або використовувати конектори продуктів для безпосередньої інтеграції з інструментами бізнес-аналітики, такими як Tableau, Qlik, Looker і ThoughtSpot[en][29].

Databricks також пропонує платформу для інших задач, зокрема для машинного навчання, зберігання та обробки даних, потокової аналітики та бізнес-аналітики[30].

Компанія також створила проекти з відкритим кодом Delta Lake, MLflow і Koalas, які охоплюють інженерію даних[en], науку про дані та машинне навчання[31]. Окрім створення платформи Databricks, компанія спільно організувала масові відкриті онлайн-курси по Spark[32] та конференцію для спільноти Spark під назвою Data + AI Summit[33], раніше відому як Spark Summit.

Діяльність

Штаб-квартира Databricks знаходиться в Сан-Франциско[34]. Також компанія працює в Канаді, Великій Британії, Нідерландах, Сінгапурі, Австралії, Німеччині, Франції, Японії, Китаї, Індії та Бразилії.

Примітки

Посилання

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads