目录
- 背景
- 问题
- 解决办法
背景
上传 .csv 文件进行数据导入到 pg 时,报错显示如下:
ods.tbl_inp_fee_detail.csv数据上传失败
报错信息:org.postgresql.util.PSQLException: ERROR: invalid byte sequence for encoding "UTF8": 0x00 Where: COPY tbl_inp_fee_detail, line 3942264
问题
通过报错信息定位到 line 3942264,发现该 .csv 文件中存在 NUL 的字符,在 notepad++ 中显示如下图所示:
PS:notepad++ 记得先勾选上 功能栏选择 视图->显示符号->显示所有字符
解决办法
-
把打开 .csv 文件的默认格式改为 notepad++ 打开
-
最好采用本地的解压软件打开压缩包
-
由于压缩包的 .csv 文件是加密的,需要先解密,然后就可以打开报错相应的 .csv 文件,这时就直接打开的是 notepad++
-
在 notepad++ 中,点搜索栏的查找,在弹出窗口选替换,输入框输入 \x00 ,下面的替换为给它删到空,因为就是要把 NUL 字符替换为空,然后注意查找模式要选择扩展,最后点全部替换即可,记得 ctrl + s 保存,然后压缩包会提示你保存更改,点确认即可
-
PS:解压 .csv 文件,notepad++ 打开 。csv 文件,以及替换字符的过程都可能需要挺长时间(看 .csv 文件的大小),不要乱点界面不然会卡死被强制退出