文件夹和文件的名字里面含有中文字符串时出现乱码的处理:
把该字符串编码转换为unicode或gbk编码的字符串来解决。代码第二行如有声明编码格式如utf-8,则代码里面出现中文字符串的地方就按照utf-8格式的字符串去处理;如没有编码声明,则windows系统默认为gbk编码,而linux默认为utf-8编码。
#!/usr/bin/envpython #coding:utf-8 importos #对变量s的值字符串'中国'按utf-8编码处理 s='中国' #创建的文件夹为乱码,乱码原因:代码编码为utf-8的中文字符串,但windows系统默认使用gbk编码,所以会乱码, 只有它们一致才不乱码 #os.mkdir(s) #下面2种方法都能创建含有中文字符串的文件夹及文件 #把s的值进行解码,由于其为utf-8编码,所以使用utf-8解码 #os.mkdir(s.decode('utf-8')) #windows系统的文件夹和文件的名字需要为unicode或gbk编码的字符串,才可以正常显示不乱码。 #os.mkdir(s.decode('utf-8').encode('gbk')) #f=open(s.decode('utf-8')+'.txt','w') f=open(s.decode('utf-8').encode('gbk')+'.txt','w') f.close()
此外,还发现一个现象,是否在使用unittest模块时,创建含有中文名字的文件夹时,是有区别的。
没有使用unittest模块时,可以直接创建含有中文的文件夹,也没出现乱码。代码如下:
#!/usr/bin/envpython #coding:utf-8 importos importchardet s=raw_input('请输入要创建的文件夹名字:') #s的值为ascii字符串,即gbk字符串 printchardet.detect(s) #发现不在unittest模块里面,可以不用编码解码处理,直接进行创建含有中文字符串的文件夹,结果也没发现乱码。而 且文件代码声明为utf-8,也没有进行转码,真是不可思议。 os.mkdir(s) os.chdir(s)
python学习网,免费的在线学习python平台,欢迎关注!