当前位置: 首页 > news >正文

哪个网站可查询有没有做社保卡深圳seo论坛

哪个网站可查询有没有做社保卡,深圳seo论坛,郑州网站建设方案服务公司,wordpress百度地图使用方法参考视频 大数据Sqoop教程丨从零开始讲解大数据业务及数据采集和迁移需求_哔哩哔哩_bilibili 介绍 Sqoop是Hadoop生态体系和RDBMS(关系型数据库)体系之间传送数据的一种工具 Hadop生态系统:HDFS,Hbase,Hive等 RDBMS包…

参考视频

        大数据Sqoop教程丨从零开始讲解大数据业务及数据采集和迁移需求_哔哩哔哩_bilibili

介绍

Sqoop是Hadoop生态体系和RDBMS(关系型数据库)体系之间传送数据的一种工具

        Hadop生态系统:HDFS,Hbase,Hive等

        RDBMS包括:Mysql,Oracle,DB2等

        Import:数据导入, RDBMS(DBinputFormat) -> Hadoop(TestoutputFormat)

        export:  数据导出,Hadoop(DBoutputFormat) -> RDBMS(TestInputFormat)

机制

        Sqoop工作机制是将导入或导出命令翻译成MapReduce程序来实现,在翻译出的MapReduce中主要对ImportFormat和OutFormat进行定制

安装部署

前置条件:

安装java,hadoop

配置文件(基于sqoop1.4.6):

上传,解压,修改配置

cd $SQOOP_HOME/conf
mv sqoop-env-template.sh sqoop-env.sh
vim sqoop-env.shexport HADOOP_CONFIG_HOME=/export/../hadoop-2.7.5
export HADOOP_MAPRED_HOME=/export/../hadoop-2.7.5
export HIVE_HOME=/export/../hive

加入mysql的jdbc驱动包

cp /hive/lib/mysql-connector-java-5.1.32.jar $SQOOP_HOME/lib/

验证

bin/sqoop list-databases \
--connect jdbc:mysql://localhost:3306/ \
--username root --password 123456\: 一行过长,用\表示一行还没有完,等待

sqoop导入

bin/sqoop import \
--connect jdbc:mysql://ip:port/dbName \
--username roor \
--password 123456\
--delete-target-dir \ (如果target-dir 的路径存在,提前删除)
--target-dir /sqoopresult \ (可以用来存放导出数据存放到HDFS的目录)
--table myTableName \
--m 1 \ (可以理解成maptask ,并行度,表有主键根据主键分,没有主键需要指定字段)
--split-by id \ (根据什么字段切割,最好是数字字段)
--fields-terminated-by '\t' (指定分隔符,还可以,等,默认,)条件导入
--where "age>12" (条件查询导入,可改成每天时间,则是每日导出)
--query 'select id,name,age from myTableName where age>18 and $CONDITIONS' (1 不加--table,2 必须有where条件, 3必须加上$CONDITIONS, 4 sql必须是单引号)增量导入
--check-column(col)  (指定列,一般是主键或者时间戳,自增长不重复)
--incremental(mode)  (append:追加 lastmodified:最后的修改时间)
--last-value(value)  (指定上次导入后判断的最大值,也可以自己指定某一个值)
--merge-key (col)(append模式下可以合并文件,不会每次导入都在hdfs里新增一个文件.除了追加合并外,如果之前的数据有修改也可以进行修改操作,且数据不会重复)
eg:
--check-column id
--incremental append
--last-value 1205 
--merge-key id (追加,id>=1205的数据)
--check-column create_time
--incremental lastmodified
--last-value '2020-02-01 15:00:00' (追加,大于整个时间的数据)

sqoop导出

目标表必须存在数据库当中

导出的三种模式

1 默认,执行insert语句,插入到表里

2 更新模式,sqoop将生成UPDATE置换数据库中现有记录的语句

3 调用模式,sqoop将为每条记录场景一个存储过程调用

待补充

参考文档:

Sqoop简介以及使用-CSDN博客

http://www.khdw.cn/news/47731.html

相关文章:

  • 做竞价的网站还用做seo百度小程序入口官网
  • 网站怎么做响应式布局站长工具seo综合查询源码
  • 昆明网站建设介绍2023年8月新闻热点事件
  • 大气黑色女性时尚类网站织梦模板合肥全网推广
  • 网站挣钱怎么做网址导航浏览器下载
  • 做网站横幅 的网站推荐几个广告公司网站
  • 做公众号首图的设计网站湖南百度seo排名点击软件
  • 自己建网站做推广沧州网站优化公司
  • 云服务器怎么样做网站重庆seo技术
  • 南充城乡建设委员会网站做任务赚佣金一单10块
  • 可以免费学编程的网站关键词优化外包
  • wordpress电影站数据下载seo全网优化推广
  • 老师众筹网站开发银川seo
  • 住房与建设部网站 2018 128号什么软件可以刷网站排名
  • 网站要怎样建设关键词seo服务
  • 深圳辰硕网站优化网站开发用什么语言
  • 代运营合同模板seo外链工具
  • 做网站的工作好做吗网络营销的主要手段
  • 伊春网站建设桂林网站设计
  • 网站建设基本步骤顺序北京口碑最好的教育机构
  • 帮他人做视频网站违法吗seo零基础视频教程
  • 做外单都有什么网站百度一下你就知道官方网站
  • 威海专业做网站公司广州seo软件
  • 个人做网站多少钱什么是外链
  • 顺的网站建设信息中国十大企业培训机构排名
  • 小程序和网站开发难度荆州seo推广
  • 简述网站推广的基本方法成人短期电脑培训班学费
  • 摄影创意网站营销传播
  • 哪家公司做企业网站稳定优惠手机百度官网首页
  • wordpress建站有什么好处百度电脑版网页版