今天在酷!学园看到一个问题:
Python版本:2.3
请问若是我将一字串从unicode转成XML格式的字元编码,如何再重XML格式编码转成unicode呢?
如:
text = u”1月1日”
text2 = text.encode(‘ascii’,’xmlcharrefreplace’)
print text2 #显示 1月1日
请问我要怎样做才能将[1月1日]字串变回”1月1日”呢?
ㄚ琪想想好像以前有碰过这类问题,所以就Google一下如何解法?终于找到了,就是使用Beautiful Soup模组!
解法如下:
# -*- coding: utf-8 -*-
from BeautifulSoup import BeautifulStoneSoup
text = u”1月1日”
text2 = text.encode(‘ascii’,’xmlcharrefreplace’)
print text2
decodedString=unicode(BeautifulStoneSoup(text2,convertEntities=BeautifulStoneSoup.HTML_ENTITIES ))
print decodedString