Java详解如何获取一个文本文件使用的编码字符集

2025-04-14 05:33:24

1、只需通过文本文件最开始的两个字节,即可判断其使用的字符集,步骤如下:1. 读取文件的一个字节,并向高位移动8位,即低位空余出8个0;2. 再读取一个字节,加到上面移位后的字节上,即将两个字节组合;3. 根据文件前两个字节和几个固定值比较,可获取该文件使用的编码字符集。

Java详解如何获取一个文本文件使用的编码字符集

2、准备第一个测试文件:创建一个文本文件 testUTF8.txt, 设置其内容使用字符集 UTF-8。

Java详解如何获取一个文本文件使用的编码字符集

3、准备第二个测试文件:创建一个文本文件 testGBK.txt, 设置其内容使用字符集 GBK。

Java详解如何获取一个文本文件使用的编码字符集

4、编写本地测试代码,获取上述两个文件文件使用的编码字符集。

Java详解如何获取一个文本文件使用的编码字符集

5、运行本地测试主方法,观察控制台输出,符合我们的设置,测试通过。

Java详解如何获取一个文本文件使用的编码字符集
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢