Apache Sqoop
来自维基百科,自由的百科全书
Apache Sqoop是用於在關係型數據庫和Hadoop之間傳輸數據的開源工具。[1] 該項目始於2009年,在2021年6月結束,並被移至Apache Attic。[2]
![]() | |
開發者 | Apache Software Foundation |
---|---|
首次發布 | 2009年6月1日 |
最終版本 |
|
源代碼庫 | Sqoop Repository |
編程語言 | Java |
操作系統 | 跨平台 |
類型 | 數據管理 |
許可協議 | Apache License 2.0 |
網站 | sqoop |
概要
Sqoop支持增量更新,將新記錄添加到最近一次的導出的數據源上,或者指定上次修改的時間戳。導入也可以填充Hive或HBase中的表。[3] 導出則支持將Hadoop的數據放入關係數據庫中。Sqoop得名於「SQL-to-Hadoop」。Sqoop於2012年3月成為頂級Apache項目。[4]
Informatica從10.1版開始提供基於Sqoop的連接器。Pentaho自4.5版開始在其ETL套件Pentaho Data Integration中提供基於開源Sqoop的連接器,Sqoop導入[5]和導出[6]。[7]微軟使用基於Sqoop的連接器將數據從Microsoft SQL Server傳輸到Hadoop。[8]Couchbase還通過Sqoop提供Couchbase Server-Hadoop連接器。[9]
參考書目
- White, Tom. Chapter 15: Sqoop. Hadoop: The Definitive Guide 2nd. O'Reilly Media. : 477–495. ISBN 978-1-449-38973-4.
參考資料
Wikiwand - on
Seamless Wikipedia browsing. On steroids.