Mysql大文件导入方法以及性能对比

JerryXia 发表于 , 阅读 (25)

前言

背景

今天被妹子问到一个问题,往mysql中导入1000W条数据,哪种方式比较快,我居然被问到了,说实话我还真心不知道。

那就找数据呗,搞数据研发的好处就是,数据肯定是很多的,正好还有测试集群。开始在线上找数据。

由于我们很多mysql的表会通过sqoop抽到hdfs中,所有就直接在hdfs中把数据提出来了,不给线上mysql什么压力了。

对比实验

现在使用两种方式分别往mysql数据库中插入数据。

  • 一种是load data的形式,
  • 一种使用sqoop从hdfs中抽。