Xml
?XML指可擴展標記語言(Extensible Markup Language)
?XML被設(shè)計用于結(jié)構(gòu)化、存儲和傳輸數(shù)據(jù)
?XML是一種標記語言,很類似于HTML
?XML沒有像HTML那樣具有預定義標簽,需要程序員自定義標簽。
?XML被設(shè)計為具有自我描述性,并且是W3C的標準
XML元素
XML的元素是指從開始標簽直到結(jié)束標簽的部分(均包括開始結(jié)束)。
一個元素可以包含:
1、其他元素
2、文本
3、屬性
4、或混合以上所有
XML語法規(guī)則
所有的XML元素都必須有一個開始標簽和結(jié)束標簽,省略結(jié)束標簽是非法的。如:
content
XML標簽對大小寫敏感;比如: 下面是兩個不同的標簽
this is a test1
this is a test2
XML文檔必須有根元素。如:
this is a test2
joy
XML必須正確嵌套,父元素必須完全包住子元素。如:
this is a test2
XML屬性值必須加引號,元素的屬性值都是一個鍵值對形式。如:
注意:
book元素中的屬性category的值是python必須用引號引起來,使用單引號和雙引號都可以,但是如果屬性值本身包含雙引號,外層就必須使用單引號;但如果包含了單引號,外層必須使用雙引號
XML命名規(guī)則
?名稱可以包含字母、數(shù)字以及其他字符
?名稱不能以數(shù)字或標點符號開頭
?名稱不能以字母xml或XML開始
?名稱不能包含空格
?可以使用任何名稱,沒有保留字
?名稱應該具有描述性,簡短和簡單,可以同時使用下劃線。
?避免“-”、“.”、“:”等字符
Xml的注釋格式
Xml.dom解析XML
這個DOM的解析器在解析一個XML文檔時,一次性讀取整個文檔,把文檔中所有元素保存在內(nèi)存中的一個樹結(jié)構(gòu)里,之后利用DOM提供的不同函數(shù)來讀取該文檔的內(nèi)容和結(jié)構(gòu),也可以把修改過的內(nèi)容寫入XML文件
book.xml
learning math
張三
561
learning Python
李四
600
minidom.parse(parser=None, bufsize=None)
該函數(shù)的作用是使用parse解析器打開xml文檔,并將其解析為DOM文檔,也就是內(nèi)
存中的一棵樹,并得到這個DOM對象
doc.documentElement
獲取xml文檔對象,就是拿到DOM樹的根。
>>> from xml.dom.minidom import parse
>>> DOMTree = parse("d:\\book.xml")#把xml解析為內(nèi)存中的的一棵樹
>>> print(DOMTree)
>>> booklist = DOMTree.documentElement#拿到樹的根
>>> print(booklist)
doc.toxml(encoding=None)
返回xml的文檔內(nèi)容
節(jié)點的xml文檔內(nèi)容,只有節(jié)點對象可以調(diào)用
>>> from xml.dom.minidom import parse
>>> DOMTree = parse("d:\\book.xml")
>>> booklist = DOMTree.documentElement
>>> print(booklist.toxml())
learning math
張三
561
learning Python
李四
600
doc.lastChild
獲取節(jié)點的最后一個孩子節(jié)點
>>> booklist.lastChild
doc.firstChild
獲取節(jié)點的第一個人孩子節(jié)點
>>> booklist.firstChild
getElementsByTagName(name)獲取節(jié)點元素
獲取xml文檔中某個父節(jié)點下,具有相同節(jié)點名的節(jié)點對象的集合。返回的是list
>>> from xml.dom.minidom import parse
>>> DOMTree = parse("d:\\book.xml")
>>> booklist = DOMTree.documentElement
>>> books = booklist.getElementsByTagName("book")#獲取標簽為book的所有節(jié)點
>>> print(books)
[, ]
>>> print(type(books))
>>> from xml.dom.minidom import parse
>>> DOMTree = parse("d:\\book.xml")
>>> booklist = DOMTree.documentElement
>>> print(booklist.getElementsByTagName("book")[0].getElementsByTagName("author")[0])
>>> print(booklist.getElementsByTagName("book")[0].getElementsByTagName("author")[0].toxml())
張三
hasAttribute(name)
判斷節(jié)點對象是否包含指定屬性
>>> from xml.dom.minidom import parse
>>> DOMTree = parse("d:\\book.xml")
>>> booklist = DOMTree.documentElement
>>> if booklist.hasAttribute("type"):
... print("booklist 元素存在屬性type")#判斷根節(jié)點booklist是否有type屬性
... else:
... print("booklist 元素不存在屬性type")
...
booklist 元素存在屬性type
Node.getAttribute(name)獲取屬性
獲取節(jié)點node的屬性值
>>> from xml.dom.minidom import parse
>>> DOMTree = parse("d:\\book.xml")
>>> booklist = DOMTree.documentElement
>>> if booklist.hasAttribute("type"):
... print("booklist存在屬性type")
... print(booklist.getAttribute("type"))
... else:
... print("booklist不存在屬性type")
...
booklist存在屬性type
science and engineering
node.childNodes
返回節(jié)點node下所有子節(jié)點組成的list。
>>> from xml.dom.minidom import parse
>>> DOMTree = parse("d:\\book.xml")
>>> booklist = DOMTree.documentElement
>>> #獲取所有book節(jié)點的集合
... books = booklist.getElementsByTagName("book")
>>>
>>> print("第一本書的子節(jié)點: ",books[0].childNodes)這個需要指定取列表的那個元素,必須要帶上索引
第一本書的子節(jié)點: [, , , , , , ]
獲取節(jié)點文本值
#coding=utf-8
from xml.dom.minidom import parse
DOMTree = parse("d:\\book.xml")
booklist = DOMTree.documentElement
#獲取所有book節(jié)點的集合
books = booklist.getElementsByTagName("book")
for book in books:
if book.hasAttribute("category"):
print("category is: ",book.getAttribute("categroy"))
#先找到節(jié)點,然后再找節(jié)點下面的孩子文本節(jié)點
title = book.getElementsByTagName("title")[0].childNodes[0].data
author = book.getElementsByTagName("author")[0].childNodes[0].data
pageNumber = book.getElementsByTagName("pageNumber")[0].childNodes[0].data
print("title: ",title)
print("title: ",author)
print("title: ",pageNumber)
node .hasChildNodes()
判斷是否有子節(jié)點
#coding=utf-8
import xml.dom.minidom
from xml.dom.minidom import parse
#minidom解析器打開xml文檔并將其解析為內(nèi)存中的一棵樹
DOMTree = parse("d:\\book.xml")
#獲取xml文檔對象,就是拿到樹的根
booklist = DOMTree.documentElement
if booklist.hasAttribute("type") :
#判斷根節(jié)點booklist是否有type屬性,有則獲取并打印屬性的值
print (u"Root element is", booklist.getAttribute("type"))
#獲取booklist對象中所有book節(jié)點的list集合
books = booklist.getElementsByTagName("book")
print ("books",books[0])
print (u"book節(jié)點的個數(shù):", books.length)
print (books[0])
if books[0].hasChildNodes():
print (u"存在子節(jié)點:",books[0].childNodes)
else:
print (u"不存在子節(jié)點")
xml.dom解析xml的一個實例
movies.xml
War, Thriller
DVD
2003
PG
10
Talk about a US-Japan war
Anime, Science Fiction
DVD
1989
R
8
A schientific fiction
Anime, Action
DVD
4
PG
10
Vash the Stampede!
Comedy
VHS
PG
2
Viewable boredom
示例:
#coding=utf-8
import xml.dom.minidom
from xml.dom.minidom import parse
DOMTree = parse("d:\\movies.xml")
collection = DOMTree.documentElement
movies = collection.getElementsByTagName("movie")
for movie in movies:
for element in ["type","format","rating","description"]:
node = movie.getElementsByTagName(element)[0]
textNode = node.childNodes[0]
print("%s節(jié)點文本是: %s" %(node,textNode.data))
#coding=utf-8
from xml.dom.minidom import parse
import xml.dom.minidom
# 使用minidom解析器打開 XML 文檔
DOMTree = xml.dom.minidom.parse(r"e:\\xml\\movies.xml")
collection = DOMTree.documentElement
if collection.hasAttribute("shelf"):
print ("Root element : %s" % collection.getAttribute("shelf"))
# 在集合中獲取所有電影
movies = collection.getElementsByTagName("movie")
# 打印每部電影的詳細信息
for movie in movies:
print ("*****Movie*****")
if movie.hasAttribute("title"):
print ("Title: %s" % movie.getAttribute("title"))
type = movie.getElementsByTagName('type')[0]
print ("Type: %s" % type.childNodes[0].data)
format = movie.getElementsByTagName('format')[0]
print ("Format: %s" % format.childNodes[0].data)
rating = movie.getElementsByTagName('rating')[0]
print ("Rating: %s" % rating.childNodes[0].data)
description = movie.getElementsByTagName('description')[0]
print ("Description: %s" % description.childNodes[0].data)
xml.dom創(chuàng)建XML文件
創(chuàng)建xml文件步驟:
1、創(chuàng)建xml空文檔
2、產(chǎn)生根對象
3、往根對象加數(shù)據(jù)
4、把xml內(nèi)存對象寫入文件
minidom.Document()創(chuàng)建xml空文檔
該方法用于創(chuàng)建一個空白的xml文檔對象,并返回這個doc對象。每個xml文檔都是一個Document對象,代表著內(nèi)存中的DOM樹。
#coding=utf-8
import xml.dom.minidom as xdm
#在內(nèi)存中創(chuàng)建一個空的文檔
doc = xdm.Document()
print (doc)
#此處創(chuàng)建一個根節(jié)點Managers對象
root = doc.createElement("Managers")
print (u"添加的xml標簽為:", root.tagName)
node.setAttribute(attname, value)
該方法表示給節(jié)點添加屬性-值對(Attribute) 。
參數(shù)說明:
attname :屬性的名稱
value :屬性的值
import xml.dom.minidom as xdm
#在內(nèi)存中創(chuàng)建一個空的文檔
doc = xdm.Document()
print(doc)
#創(chuàng)建一個根節(jié)點Managers對象
root = doc.createElement("Managers")
print (u"添加的xml標簽為:", root.tagName)
# 給根節(jié)點root添加屬性
root.setAttribute("company","光榮之路")
print("根節(jié)點的屬性: ",root.getAttribute("company"))
doc.createTextNode(data)
給葉子節(jié)點添加文本節(jié)點
#coding=utf-8
import xml.dom.minidom
#在內(nèi)存中創(chuàng)建一個空的文檔
doc = xml.dom.minidom.Document()
print(doc)
#創(chuàng)建一個根節(jié)點Managers對象
root = doc.createElement('company')
print (u"添加的xml標簽為:", root.tagName)
# 給根節(jié)點root添加屬性
root.setAttribute('name', '光榮之路教育科技有限公司')
# 給根節(jié)點添加一個葉子節(jié)點
ceo = doc.createElement("ceo")
#給葉子節(jié)點name設(shè)置一個文本節(jié)點,用于顯示文本內(nèi)容
ceo.appendChild(doc.createTextNode("呼總"))
print(ceo.tagName)
print (u"給葉子節(jié)點添加文本節(jié)點成功")
添加子節(jié)點
#coding=utf-8
import xml.dom.minidom
#在內(nèi)存中創(chuàng)建一個空的文檔
doc = xml.dom.minidom.Document()
#創(chuàng)建一個根節(jié)點companys對象
root = doc.createElement('companys')
# 給根節(jié)點root添加屬性
root.setAttribute("name","光榮之路")
#將根節(jié)點添加到文檔對象中
doc.appendChild(root)
# 給根節(jié)點添加一個葉子節(jié)點
company = doc.createElement("gloryroad")
# 葉子節(jié)點下再嵌套葉子節(jié)點
name = doc.createElement("Name")
# 給節(jié)點添加文本節(jié)點
name.appendChild(doc.createTextNode("光榮之路"))
ceo = doc.createElement("CEO")
ceo.appendChild(doc.createTextNode("吳總"))
# 將各葉子節(jié)點添加到父節(jié)點company中
# 然后將company添加到跟節(jié)點companys中
company.appendChild(name)
company.appendChild(ceo)
root.appendChild(company)
print(doc.toxml())
注意父節(jié)點和子節(jié)點的關(guān)系,依賴于appendChild()函數(shù)
以上'companys是根節(jié)點
gloryroad是1級子節(jié)點
name、 ceo 是2級子節(jié)點
Parent.appendChild(childNode)
把子節(jié)點childNode添加到父節(jié)點parent中
doc.writexml()生成xml文檔
該方法用于將內(nèi)存中xml文檔樹寫入文件中,并保存到本地磁盤。上面創(chuàng)建的xml文檔僅是存在內(nèi)存中的,并未真正寫入硬盤,只有調(diào)用該方法以后,才能真正將我們創(chuàng)建的xml文檔寫入本地硬盤,這時我們才能在硬盤中看見新建的xml文檔。
語法:
Writexml(file,indent=””,addindent=””,newl=””,encoding=None)
參數(shù)說明:
file:要保存為的文件對象名
Indent:根節(jié)點的縮進方式
addindent:子節(jié)點的縮進方式
newl: 針對新行,指明換行方式
encoding:保存文件的編碼方式
示例:
#coding=utf-8
import xml.dom.minidom
#在內(nèi)存中創(chuàng)建一個空的文檔
doc = xml.dom.minidom.Document()
#創(chuàng)建一個根節(jié)點companys對象
root = doc.createElement('companys')
# 給根節(jié)點root添加屬性
root.setAttribute("name","公司列表")
#將根節(jié)點添加到文檔對象中
doc.appendChild(root)
# 給根節(jié)點添加一個葉子節(jié)點
company = doc.createElement("gloryroad")
# 葉子節(jié)點下再嵌套葉子節(jié)點
name = doc.createElement("Name")
# 給節(jié)點添加文本節(jié)點
name.appendChild(doc.createTextNode("光榮之路"))
ceo = doc.createElement("CEO")
ceo.appendChild(doc.createTextNode("吳總"))
# 將各葉子節(jié)點添加到父節(jié)點company中
# 然后將company添加到跟節(jié)點companys中
company.appendChild(name)
company.appendChild(ceo)
root.appendChild(company)
fp = open('d:\\company.xml','w')
doc.writexml(fp,indent='',addindent='\t',newl='\n',encoding="utf-8")
fp.close()
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。
創(chuàng)新互聯(lián)建站提供成都做網(wǎng)站、網(wǎng)站設(shè)計、網(wǎng)頁設(shè)計,品牌網(wǎng)站制作,1元廣告等致力于企業(yè)網(wǎng)站建設(shè)與公司網(wǎng)站制作,10年的網(wǎng)站開發(fā)和建站經(jīng)驗,助力企業(yè)信息化建設(shè),成功案例突破上1000家,是您實現(xiàn)網(wǎng)站建設(shè)的好選擇.