专业的编程技术博客社区

网站首页 > 博客文章 正文

Java使用poi进行excel的导入操作(java poi操作excel)

baijin 2024-10-11 10:42:09 博客文章 10 ℃ 0 评论

创建项目测试

1 创建springBoot项目

2 pom导入相关依赖

xml复制代码 <!--导入依赖jar包-->

 <!--xls(03)-->

<dependency>

    <groupId>org.apache.poi</groupId>

    <artifactId>poi</artifactId>

    <version>3.9</version>

</dependency>



 <!--xlsx(07)-->

<dependency>

    <groupId>org.apache.poi</groupId>

    <artifactId>poi-ooxml</artifactId>

    <version>3.9</version>

</dependency>



 <!--日期格式化工具-->

<dependency>

    <groupId>joda-time</groupId>

    <artifactId>joda-time</artifactId>

    <version>2.10.1</version>

</dependency>



 <!--单元测试-->

<dependency>

    <groupId>junit</groupId>

    <artifactId>junit</artifactId>

    <version>4.12</version>

</dependency>

本地创建两个excel 分别是03版和07版

首先03版,它最多有65536行

但是07版的,是没有限制的

他们对应的后缀也是不一样的,03版本的xls,07版本的是xslx,这意味着操作它们的工具类也不相同.03版本用的是poi,07版用的则是poi-ooxml

4 Java的宗旨就是万物皆对象,我们也要把excel当成我们的一个对象去处理

1 工作薄

首先我们打开的excel就是一个大对象,也叫工作簿,它包括以下内容

2 工作表

每一个sheet也是我们excel对象的属性,也叫工作表,我们肯定是现有工作簿才会有工作表,而且会默认自带sheet,也可以根据我们的需要自行添加sheet工作表

3 行

excel中有很多行,每一行也是我们excel对象的属性(横的叫行,竖的叫列)

4 列

excel中有很多列,每一列也是我们excel对象的属性(横的叫行,竖的叫列)

5 单元格

一行一列有很多个单元格,每一个单元格也是我们excel对象的属性

创建我们的测试类,创建Workbook对象,按着ctrl点进去发现它是一个接口

点击箭头可以看到它的三个实现类

定义工作簿,工作表,行列,单元格,和我们手动创建excel是一样的操作,只不过是用代码来实现

03版本excel IO操作写的全部代码如下

java复制代码package com.wyh.Test;



import org.apache.poi.hssf.usermodel.HSSFSheet;

import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.joda.time.DateTime;

import org.junit.Test;



import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.util.Date;



 /**

 *  @program:  JavaExecl

 *  @description:  写excel 03版本

 *  @author:  魏一鹤

 *  @createDate:  2021-12-12 10:42

 **/



public class ExcelWrite03 {

    //全局路径,供我们操作使用方便

  static String path= "D:\Tools\JavaWorkSpace\JavaExecl\" ;

    @Test

    public  void ExcelWrite03() throws Exception {

        //1创建一个工作簿

 Workbook workbook=new HSSFWorkbook();

        //2创建一个工作表 工作簿里面包含工作表,所以创建工作表要通过工作簿创建

 //默认的工作表是没有名字的,需要我们手动赋值,和我们在excel中更改sheet工作表的名称是一样的 操作

 Sheet sheet=workbook.createSheet( "用户表" );

        //3创建行 行也是在我们的表中存在的,所以需要用到表来创建

 //默认从0开始 也就是第一行

 Row row1 = sheet.createRow(0);

        //创建单元格 第一行的第一个数据 用坐标表示为(1,1)

 Cell cell11 = row1.createCell(0);

        //创建单元格 第一行的第二个数据 用坐标表示为(1,2)

 Cell cell12 = row1.createCell(1);

        //给单元格赋值

 cell11.setCellValue( "姓名" );

        cell12.setCellValue( "魏一鹤" );

        //创建第二行

 Row row2=sheet.createRow(1);

        //创建第二行的第一列

 Cell cell21 = row2.createCell(0);

        Cell cell22 = row2.createCell(1);

        //给单元格赋值(2.1)

 cell21.setCellValue( "出生日期" );

        //创建时间并且格式化

 String s = new DateTime().toString( "yyyy-MM-dd HH:mm:ss" );

        //给单元格赋值(2.2)

 cell22.setCellValue(s);

        //生成一张表 其实就是IO流操作 03版本就是使用xls文件结尾

 FileOutputStream fileOutputStream = new FileOutputStream(path + "用户测试03.xls" );

        //输出工作簿

 workbook.write(fileOutputStream);

        //关闭流

 fileOutputStream.close();

        System.out.println( "用户测试03.xls生成完毕" );

    }

}

07版本excel IO操作写的全部代码如下

less复制代码package com.wyh.Test;



import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.apache.poi.xssf.usermodel.XSSFWorkbook;

import org.joda.time.DateTime;

import org.junit.Test;



import java.io.FileOutputStream;



 /**

 *  @program:  JavaExecl

 *  @description:  07版本excel写操作

 *  @author:  魏一鹤

 *  @createDate:  2021-12-12 23:58

 **/



public class ExcelWrite07 {

    //全局路径,供我们操作使用方便

  static String path= "D:\Tools\JavaWorkSpace\JavaExecl\" ;

    @Test

    public  void ExcelWrite07() throws Exception {

        //07版和03最大的差别就是使用的工具不一样 03是HSSF 07是XSSF

 //其他代码无需改动

 //1创建一个工作簿

 Workbook workbook=new XSSFWorkbook();

        //2创建一个工作表 工作簿里面包含工作表,所以创建工作表要通过工作簿创建

 //默认的工作表是没有名字的,需要我们手动赋值,和我们在excel中更改sheet工作表的名称是一样的 操作

 Sheet sheet=workbook.createSheet( "用户表" );

        //3创建行 行也是在我们的表中存在的,所以需要用到表来创建

 //默认从0开始 也就是第一行

 Row row1 = sheet.createRow(0);

        //创建单元格 第一行的第一个数据 用坐标表示为(1,1)

 Cell cell11 = row1.createCell(0);

        //创建单元格 第一行的第二个数据 用坐标表示为(1,2)

 Cell cell12 = row1.createCell(1);

        //给单元格赋值

 cell11.setCellValue( "今日学习" );

        cell12.setCellValue( "api和easyExcl导出导入excel" );

        //创建第二行

 Row row2=sheet.createRow(1);

        //创建第二行的第一列

 Cell cell21 = row2.createCell(0);

        Cell cell22 = row2.createCell(1);

        //给单元格赋值(2.1)

 cell21.setCellValue( "学习日期" );

        //创建时间并且格式化

 String s = new DateTime().toString( "yyyy-MM-dd HH:mm:ss" );

        //给单元格赋值(2.2)

 cell22.setCellValue(s);

        //生成一张表 其实就是IO流操作 07版本就是使用xlsx文件结尾

 FileOutputStream fileOutputStream = new FileOutputStream(path + "用户测试07.xlsx" );

        //输出工作簿

 workbook.write(fileOutputStream);

        //关闭流

 fileOutputStream.close();

        System.out.println( "用户测试07.xls生成完毕" );

    }

}

运行后发现,会在项目本地生成我们定义的excel,打开查看

03版和07版的区别如下

1 03版本有最大长度现在 07版本没有

2 03版本后缀xls 07版本后缀xlsx

3 03版本使用的工具是HSSF,07版本使用的是XSSF

5 大数据绕导入导出(批量)

真实开发中,大多数就是大数据批量导入或者导出excel

大文件写HSSF

缺点:最多只能处理65536行,否则会报内存溢出异常

优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快

大文件写XSSF

缺点:写数据时速度非常慢,非常消耗内存,也会发生内存溢出,比如100万条

优点:可以写较大的数据量,比如20万条

03版本HSSF循环导入65536行数据(03版本最大行就是65536)

03版本HSSF循环插入65536条

java复制代码

package com.wyh.Test;



import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.junit.Test;



import java.io.FileOutputStream;



 /**

 *  @program:  JavaExecl

 *  @description:  大数据量写03版本

 *  @author:  魏一鹤

 *  @createDate:  2021-12-14 23:31

 **/



public class BigDateExcelWrite03 {

    //全局路径,供我们操作使用方便

  static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ;



    @Test

    public void BigDateExcelWrite03() throws Exception {

        //开始时间 用于计算时间差

  long beginTime = System.currentTimeMillis();

        //创建工作簿  03版本使用HSSF

 Workbook workbook = new HSSFWorkbook();

        //创建工作表 这里就不给它命令了 按照默认的来

 Sheet sheet = workbook.createSheet();

        //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行

  for (int rowNum = 0; rowNum < 65536; rowNum++) {

            //循环创建行

 Row row = sheet.createRow(rowNum);

            for(int cellNum=0;cellNum<10;cellNum++){

                //循环插入列

 Cell cell = row.createCell(cellNum);

                //循环设置值

 cell.setCellValue(cellNum);

            }

        }

        System.out.println( "生成excel表完毕" );

        //03版本的后缀是xls

 //开启文件流

 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite03.xlsx" );

        //开始写excel

 workbook.write(fileOutputStream);

        //关闭流

 fileOutputStream.close();

        //结束时间

  long endTime = System.currentTimeMillis();

        //输出花费的时间

 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000);

    }

}

运行发现excel已经创建成功,速度也非常的快

打开查看

已知03版本xls最多存65536行,那么如果我们循环插入65537行会怎么样呢? 保留源代码,循环最大值设置为65537

再次运行发现会报错

java复制代码java.lang.IllegalArgumentException: Invalid row number (65536) outside allowable range (0..65535)

07版本XSSF循环插入65536条

把后缀改为xlsx,把HSSF缓存XSSF即可

java复制代码

package com.wyh.Test;



import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.apache.poi.xssf.usermodel.XSSFWorkbook;

import org.junit.Test;



import java.io.FileOutputStream;



 /**

 *  @program:  JavaExecl

 *  @description:  大数据量写03版本

 *  @author:  魏一鹤

 *  @createDate:  2021-12-14 23:31

 **/



public class BigDateExcelWrite07 {

    //全局路径,供我们操作使用方便

  static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ;



    @Test

    public void BigDateExcelWrite07() throws Exception {

        //开始时间 用于计算时间差

  long beginTime = System.currentTimeMillis();

        //创建工作簿 07版本的使用XSSF

 Workbook workbook = new XSSFWorkbook();

        //创建工作表 这里就不给它命令了 按照默认的来

 Sheet sheet = workbook.createSheet();

        //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行

  for (int rowNum = 0; rowNum < 65536; rowNum++) {

            //循环创建行

 Row row = sheet.createRow(rowNum);

            for(int cellNum=0;cellNum<10;cellNum++){

                //循环插入列

 Cell cell = row.createCell(cellNum);

                //循环设置值

 cell.setCellValue(cellNum);

            }

        }

        System.out.println( "生成excel表完毕" );

        //037版本的后缀是xlsx

 //开启文件流

 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite07.xlsx" );

        //开始写excel

 workbook.write(fileOutputStream);

        //关闭流

 fileOutputStream.close();

        //结束时间

  long endTime = System.currentTimeMillis();

        //输出花费的时间

 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000);

    }

}

虽然也运行成功,但是可以明显感觉到速度不如03版HSSF,但是可以存更多的数据

打开excel查看发现数据到了65536停并没有结束,说明07版本XSSF上限不是65536,是可以存储更多的,可以写更多的数据

如果我们正在查看同一个文件,但是又进行其他操作,就会出现以下错误,我们把我们正在查看的文件关闭让它运行,等运行结束后再次打开即可

lua复制代码java.io.FileNotFoundException: D:\Tools\JavaWorkSpace\JavaExecl\BigDateExcelWrite07.xlsx (另一个程序正在使用此文件,进程无法访问。)

07版本XSSF导入100000条数据,把循环数改为100000即可

既然XSSF可以存这么多数据,但是速度比较慢,有没有方法可以优化效率呢(缓存,这个问题也可以叫做如何给poi加速

它就是Workbook借口三个实现类之一的SXSSFWorkbook,其他的两个我们上面都有操作过

这时候需要用到我们的SXSSF

优点:可以写非常大的数据量.如100万条甚至更多,写速度非常快,占用更少的

注意

1 过程中会产生临时文件,需要清理临时文件

2 默认由100条记录被保存在内存中,如果超过这数量,则最前面的数据被写入临时文件,当然缓存数量也可以自定义

3 如果自定义内存中数据的数量,可以使用new SXSSFWorkbook(数量)

SXSSF循环插入100000条数据

java复制代码

package com.wyh.Test;



import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.apache.poi.xssf.streaming.SXSSFWorkbook;

import org.apache.poi.xssf.usermodel.XSSFWorkbook;

import org.junit.Test;



import java.io.FileOutputStream;



 /**

 *  @program:  JavaExecl

 *  @description:  大数据量写03版本

 *  @author:  魏一鹤

 *  @createDate:  2021-12-14 23:31

 **/



public class BigDateExcelWrite07Super {

    //全局路径,供我们操作使用方便

  static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ;



    @Test

    public void BigDateExcelWrite07Super() throws Exception {

        //开始时间 用于计算时间差

  long beginTime = System.currentTimeMillis();

        //创建工作簿 07版本的使用XSSF

 Workbook workbook = new SXSSFWorkbook();

        //创建工作表 这里就不给它命令了 按照默认的来

 Sheet sheet = workbook.createSheet();

        //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行

  for (int rowNum = 0; rowNum < 100000; rowNum++) {

            //循环创建行

 Row row = sheet.createRow(rowNum);

            for(int cellNum=0;cellNum<10;cellNum++){

                //循环插入列

 Cell cell = row.createCell(cellNum);

                //循环设置值

 cell.setCellValue(cellNum);

            }

        }

        System.out.println( "生成excel表完毕" );

        //037版本的后缀是xlsx

 //开启文件流

 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite07Super.xlsx" );

        //开始写excel

 workbook.write(fileOutputStream);

        //关闭流

 fileOutputStream.close();

        //由于SXSSF会产生临时文件,这里我们需要清除下临时文件

 ((SXSSFWorkbook) workbook).dispose();

        //结束时间

  long endTime = System.currentTimeMillis();

        //输出花费的时间

 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000);

    }

}

运行发现,excel也正常生成了,但是它(SXSSF)的速度比XSSF快的多

查看我们的super

这就是我们的临时文件,随着我们把文件的关闭,临时文件也会随之消失

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表