目录
一. Sqoop介绍
二. Mysql 数据导入到 Hive
三. Hive数据导入到Mysql
四. mysql数据增量导入hive
1). 新建一张表
2). 初始化hive
表:
1). 创建hive
表
2). 创建job
3). 执行job
1. 基于递增列Append导入
2.Lastmodified
导入实战
一. Sqoop介绍
Sqoop
是一个用来将Hadoop
和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如:MySQL、Oracle、Postgres
等)中的数据导进到Hadoop
的HDFS
中,也可以将HDFS
的数据导进到关系型数据库中。对于某些NoSQL
数据库它也提供了连接器。Sqoop
,类似于其他ETL
工具,使用元数据模型来判断数据类型并在数据从数据源转移到Hadoop
时确保类型安全的数据处理。Sqoop
专为大数据批量传输设计,能够分割数据集并创建Hadoop
任务来处理每个区块。