今天用python解析xml文件,出现异常信息如下:
xml.parsers.expat.ExpatError: not well-formed (invalid token): line 13, column 31
解决方式:
将文件重新编码成utf-8格式就可以了。
在linux下一种取巧的解决方式:
对于中文,这里选了一种取巧的方法。即先通过iconv命令将xml文件变成utf-8格式,然后将xml中指定编码格式的内容去掉即可。
可参考如下代码:
cmd = "iconv " + filename + " -t \"utf-8\" >utf.tmp"
os.system(cmd)
utf_filename = "utf.tmp"
f = open(utf_filename)
data = f.read()
f.close()
os.system("rm -f utf.tmp")
#----delete the encode type in xml file-----
#result = re.sub(regex, newstring, subject)
data = data.replace('encoding="GB2312"', '')
data = data.replace('encoding="gb2312"', '')
#self.dom.unlink
self.dom = xml.dom.minidom.parseString( data )
- 浏览: 389740 次
- 性别:
- 来自: 北京
最新评论
-
hopana:
不用下插件,用JSON.stringify(cmd)就可以了
spring mvc 接收前台传来的json对象(转) -
libankling:
很好很强大,谢谢分享
jquery datatables api (转) -
liuweihug:
推荐这个博客看看。Jquery DataTable基于Twit ...
jquery datatables api (转) -
岛田无涯:
不错,下次试试
MinGW -
javaeye官理员:
import sys, tracebacktry: f ...
python 异常处理
相关推荐
python解析xml文件,python语言解析xml文件的常用的有两种方式: 通过MiniDom库解析xml文件 通过ElementTree库解析xml文件
python解析xml生成excel文档,有彩色效果,注释
本文将介绍深入解读利用Python语言解析XML文件的几种方式,并以笔者推荐使用的ElementTree模块为例,演示具体使用方法和场景。文中所使用的Python版本为2.7。XML是可扩展标记语言(ExtensibleMarkupLanguage)的缩写...
Python编写界面,与xml关联,解析xml的问题。
主要介绍了python解析xml文件方式(解析、更新、写入),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
python解析xml文件增删查找,相关教程参考:https://blog.csdn.net/tanghong1996/article/details/88657307
这是一个采用Python脚本自动解析XML格式并生成对应Qt的解析XML的代码, 让Qt完全解脱了编写解析的逻辑。
这篇文章主要介绍了用Python解析XML的几种常见方法,包括快速的使用ElementTree模块等方法的实例介绍,需要的朋友可以参考下 一、简介 XML(eXtensible Markup Language)指可扩展标记语言,被设计用来传输和存储数据...
python处理xml很实用好用的工具 主要有BeautifulSoup和BeautifulStoneSoup,import就好,前者处理html,后者处理xml 具体使用方法可以上网查
python解析xml,字符串替换,正则表达式,可以参考
python库 解析xml和文本字符集探测,适用于python2.6
一 、python模块 xml.dom 解析XML的APIminidom.parse(filename)加载读取XML文件 doc.documentElement获取XML文档对象 node.getAttribute(AttributeName)获取XML节点属性值 node.getElementsByTagName(TagName)获取...
本文实例讲述了python解析xml文件的方法。分享给大家供大家参考。具体如下: python解析xml非常方便。在dive into python中也有讲解。 如果xml的结构如下: <?xml version="1.0" encoding="utf-8"?> ...
用Python解析XML文件的软件实现
利用python xml模块来解析xml文件
当前效率最高,用的最广泛的开源python解析xml接口文档。
python解析xmind工具,可将xmind文件内容解析成所需的数据类型(dict、json、xml),同时还可将展示结果配置化