转1:https://blog.csdn.net/a532672728/article/details/79432619
转2:https://www.cnblogs.com/qq78292959/p/3794993.html
小结:
1)注意txt文件,保存的格式,Windows的记事本默认保存的ANSI,我们要让它保存成UFT-8格式;
2)问题出在FileReader读取文件的过程中,FileReader继承了InputStreamReader,但并没有实现父类中带字符集参数的构造函数,所以FileReader只能按系统默认的字符集来解码,然后在UTF-8 -> GBK -> UTF-8的过程中编码出现损失,造成结果不能还原最初的字符。
原因明确了,这个问题解决起来并不困难,用InputStreamReader代替FileReader,InputStreamReader isr=new InputStreamReader(new FileInputStream(fileName),"UTF-8");这样读取文件就会直接用UTF-8解码,不用再做编码转换。
List<String> lines=new ArrayList<String>(); // 方法一 BufferedReader br=new BufferedReader(new InputStreamReader(new FileInputStream("d:/test.txt"),"UTF-8")); String line = null; while ((line = br.readLine()) != null) {lines.add(line); }