Mathematica 文件读取乱码的解决

2025-04-14 01:09:44

1、首先,通过$CharacterEncodings我们可以查看所有MMA支持的编码。其中常见的有Unicode,UTF8,WindowsANSI,MacintoshChineseSimplified。

Mathematica 文件读取乱码的解决

2、我们现在有三个文件用于测试,都是用记事本编写保存。三个文件分别按照ANSI,Unicode,UTF幻腾寂埒-8编码保存。如果直接使用ReadString,几乎都出现了乱码。ReadString无编码设置,只处理英文字符即可。

Mathematica 文件读取乱码的解决
Mathematica 文件读取乱码的解决

3、可以使用Import函数,设置一个参数CharacterEnco蟠校盯昂ding。ANSI保存的文件,设置为Mac足毂忍珩intoshChineseSimplified即可正常读取。另外两种,分别设定Unicode和UTF-8.

Mathematica 文件读取乱码的解决

4、读取结果如图,只是MMA对某些编码换行符的解释,可能和别的文本编辑器不一致。可以使用字符串处理函数去除额外的换行符。

Mathematica 文件读取乱码的解决

5、对于自带编码的文档,比如xml文档就自己指定了编码,直接Import即可成功导入。

Mathematica 文件读取乱码的解决

6、另外,一些编辑器按照GB2312编码保存的文件,在中文Windows上就是ANSI,用MacintoshChineseSimplified编码打开即可。

Mathematica 文件读取乱码的解决

7、另外,Read函数也可能读取到正确的编码。Read使用一行一行流读取的方式。但是,如果将字符转码再转回,不一定是可逆的,可能和原文有出入。需要小心。

Mathematica 文件读取乱码的解决
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢