雖然和優(yōu)秀的HTML來源于同樣的技術SGML(類似HTML,也使用標記,屬性和值來格式化文檔結(jié)構(gòu)),但XML卻完全不同于早期的標記語言,XML和HTML來源于同樣的技術,和XML是HTML的一個提升(盡管很像HTML,XML也用標簽,屬性,屬性值來定義文檔結(jié)構(gòu)),且XML完全不同于HTML這種古老的標記語言,XML的目標是替代HTML. HTML是構(gòu)架WEB頁面的一種基本語言,它由一些固定數(shù)量的標記和看起來好像有些矛盾的規(guī)則組成,在HTML中,你可以使用或者不使用關閉某些標記,這種松散的規(guī)則使人們創(chuàng)建一個WEB頁面變得很容易,甚至他們不需要完全知道他們在做什么,這便是問題的核心所在. 在早期,那時候WEB只需要基本的仙鶴并不需要更多其他信息,HTML是個很好的解決方法,但在今天,那些歷經(jīng)過成長的網(wǎng)站,經(jīng)常需要頻繁通過發(fā)布工具重新組裝頁面,經(jīng)常需要將內(nèi)容從數(shù)據(jù)庫發(fā)布到WEB頁面或者無線設備,但在HTML缺少這種統(tǒng)一的規(guī)則,從而阻礙了數(shù)據(jù)的轉(zhuǎn)化,我們很容易把文本轉(zhuǎn)化成HTML,但是很難把標記在HTML文件中的數(shù)據(jù)轉(zhuǎn)換成我們需要的其他文件格式. 同樣,HTML,僅僅是一種格式化語言,而不是一個能確切描述自己的語言,它沒有任何信息來描述探疑所格式化的語言,因此限制了我們征用這些內(nèi)容的能力,當然,HTML確實是適用于WEB頁面的. 相對而言,基于XML的標記,則由一些統(tǒng)一的規(guī)則組成并且具備超越WEB領域的能力,當你用XML分寸 個文檔的時候,你不僅僅要考慮把它們在WEB頁面中顯示出來,你還應當對標記進行編碼,以便使得任何支持XML的環(huán)境都能理解你的XML文檔.