结构化标记处理工具¶
Python支持各种模块来处理各种形式的结构化数据标记。这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。
html---超文本标记语言支持html.parser---简单的HTML和XHTML解析器html.entities——HTML通用实体的定义- XML处理模块
xml.etree.ElementTree---元素树XML APIxml.dom---文档对象模型APIxml.dom.minidom---最小的DOM实现xml.dom.pulldom——支持建立部分DOM树xml.sax---支持SAX2解析器xml.sax.handler---SAX处理程序的基类xml.sax.saxutils---SAX实用程序xml.sax.xmlreader---XML解析器接口xml.parsers.expat---使用expat快速分析XML