版块导航
正在加载中...
客户端APP下载
论文辅导
申博辅导
登录
注册
帖子
帖子
用户
本版
应《网络安全法》要求,自2017年10月1日起,未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用,请尽快对帐号进行手机号验证,感谢您的理解与支持!
24小时热门版块排行榜
>
论坛更新日志
(3541)
>
虫友互识
(1036)
>
文献求助
(269)
>
导师招生
(179)
>
休闲灌水
(166)
>
考博
(135)
>
教师之家
(90)
>
硕博家园
(84)
>
博后之家
(82)
>
论文投稿
(81)
>
找工作
(77)
>
基金申请
(71)
>
论文道贺祈福
(67)
>
考研
(60)
>
公派出国
(51)
>
招聘信息布告栏
(38)
小木虫论坛-学术科研互动平台
»
计算模拟区
»
程序语言
»
Shell&Perl
»
一个汉字竟坏了整个程序?
5
1/1
返回列表
查看: 838 | 回复: 4
只看楼主
@他人
存档
新回复提醒
(忽略)
收藏
在APP中查看
journeyer
铁虫
(正式写手)
应助: 0
(幼儿园)
金币: 3795.3
红花: 1
帖子: 683
在线: 161.2小时
虫号: 2129000
注册: 2012-11-15
专业: 大地测量学
[
求助
]
一个汉字竟坏了整个程序?
已有1人参与
最近,用python作字处理程序,发现一个特殊的汉字“䢵”(应该还有其它),当无“䢵”字时程序可以正常运行,但只要有“䢵”,程序就会中断,请论坛里高手指点。
CODE:
# -*- coding: UTF-8 -*-
import codecs, sys
print '-'*60
# 创建gbk编码器
look = codecs.lookup("gbk")
# 创建utf-8编码器
look2 = codecs.lookup("utf-8")
a = '我爱北京天安门䢵' #去掉“䢵” windows 下运行就正常
print len(a), a
# 把a编码为内部的unicode
b = look2.decode(a)
# 返回的b[0]是数据,b[1]是长度,这个时候的类型是unicode了
print b[1], b[0], type(b[0])
# 把内部编码的unicode转换为gbk编码的字符串,encode方法会返回一个字符串类型
b2 = look.encode(b[0])
# 发现不一样的地方了吧?
print b2[1], b2[0], type(b2[0])
# codecs.encode会统计字数
print len(b2[0])
# 需要说明的是,上述程序在 Windows 下运行时会因“䢵”字存在而出问题,而在 Mac 下运行正常。
[
Last edited by jjdg on 2013-12-25 at 00:16
]
回复此楼
» 猜你喜欢
存款400万可以在学校里躺平吗
已经有7人回复
基金委咋了?2026年的指南还没有出来?
已经有10人回复
拟解决的关键科学问题还要不要写
已经有6人回复
基金申报
已经有6人回复
推荐一本书
已经有13人回复
国自然申请面上模板最新2026版出了吗?
已经有17人回复
纳米粒子粒径的测量
已经有8人回复
疑惑?
已经有5人回复
计算机、0854电子信息(085401-058412)调剂
已经有5人回复
Materials Today Chemistry审稿周期
已经有5人回复
» 本主题相关价值贴推荐,对您同样有帮助:
求JOCR抓字软件
已经有11人回复
【科普教程】《Photoshop字体设计密码》彩图版
已经有48人回复
分类统计一个字符串的字符个数,书上的原样代码,不能实现功能
已经有3人回复
请问英文论文里的程序用什么字体合适?急求大家帮助!
已经有9人回复
亲测很好玩的3D动画字gif制作软件 绿色单文件版本【转载】
已经有64人回复
紧急求助,如何用c语言实现从键盘输入一个64字节的十进制数,然后转换为二进制数输出
已经有5人回复
食字号与健字号的申报程序有何不同
已经有18人回复
批处理开头字符无法正常识别
已经有6人回复
C++里如何保证汉字和字符一起输出时宽度相等?
已经有4人回复
vi中每行末尾增加一个相同字符用什么表达式?
已经有4人回复
怎么把从键盘输入的多个字符串分别赋值给字符串数组的一个个元素?
已经有6人回复
【分享】40种华康超可爱字体【已搜索无重复】
已经有40人回复
求助delphi 编程,在window2003中输入汉字为乱码问题
已经有5人回复
【求助】急需最新全国行政区划数据和常见汉字及其拼音(也可以是声母的第一个字母)数
已经有4人回复
【求助】如何去掉一个字符串的前几位字符
已经有4人回复
【求助】FORTRAN中的这几个关键字是什么意思呢【已完结】
已经有4人回复
在OriginPro8 软件中如何去掉两个字之间的空格
已经有4人回复
【求助】化工流程图中 这些字母是什么意思啊
已经有16人回复
【分享】手写软件,生字的克星--handinput1.0+逍遥笔 6.50【已搜索无重复】
已经有17人回复
【分享】教你去掉图片上的文字【已搜索无重复】
已经有621人回复
1楼
2013-12-24 20:56:23
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
sunoru
新虫
(初入文坛)
应助: 1
(幼儿园)
金币: 347
帖子: 10
在线: 8.2小时
虫号: 2798232
注册: 2013-11-13
性别: GG
专业: 理论和计算化学
【答案】应助回帖
额,刚刚在我的电脑上试了一下,因为windows的命令行默认编码是gbk的,所以就算你已经得到了一个正确的unicode字符串,在输出到命令行的时候它还是会被转成gbk,但在gbk中并没有“䢵”这个字,导致会看到出错。。
一个解决方法是用不是gbk编码的控制台来运行这个程序,比如我用的是qt版的IPython。
(不知道还帮不帮得上楼主的忙
赞
一下
回复此楼
2楼
2014-01-22 16:09:22
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
garyfirst
木虫
(小有名气)
应助: 0
(幼儿园)
金币: 3605.8
帖子: 118
在线: 61.9小时
虫号: 1834934
注册: 2012-05-26
专业: 自然语言理解与机器翻译
用python处理汉字还真是不容易呢
赞
一下
回复此楼
CL
3楼
2014-02-18 08:04:20
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
journeyer
铁虫
(正式写手)
应助: 0
(幼儿园)
金币: 3795.3
红花: 1
帖子: 683
在线: 161.2小时
虫号: 2129000
注册: 2012-11-15
专业: 大地测量学
???????:
2?
:
Originally posted by
sunoru
at 2014-01-22 16:09:22
??????????????????????????windows????????????????gbk????????????????????????????unicode???????????????????е??????????????gbk??????gbk?в???С?䢵??????????????????? ...
?????????????Mac????????????????Win??????а???????? gbk ???????????䢵??????
赞
一下
回复此楼
4楼
2014-02-18 15:15:51
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
journeyer
铁虫
(正式写手)
应助: 0
(幼儿园)
金币: 3795.3
红花: 1
帖子: 683
在线: 161.2小时
虫号: 2129000
注册: 2012-11-15
专业: 大地测量学
引用回帖:
3楼
:
Originally posted by
garyfirst
at 2014-02-18 08:04:20
用python处理汉字还真是不容易呢
其实,我在Mac下运行python程序没有问题,python处理字符串还是很方便的。
赞
一下
回复此楼
5楼
2014-02-18 15:17:52
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
相关版块跳转
第一性原理
量子化学
计算模拟
分子模拟
仿真模拟
程序语言
我要订阅楼主
journeyer
的主题更新
5
1/1
返回列表
如果回帖内容含有宣传信息,请如实选中。否则帐号将被全论坛禁言
普通表情
龙
兔
虎
猫
百度网盘
|
360云盘
|
千易网盘
|
华为网盘
在新窗口页面中打开自己喜欢的网盘网站,将文件上传后,然后将下载链接复制到帖子内容中就可以了。
信息提示
关闭
请填处理意见
关闭
确定