word的xml格式解析 wordxml格式解析
发布日期:2021-01-04摘要:为什么word文档变成了xml格式 所谓的xml,就是eXtensible Markup Language, 翻译成中文就是“可扩展标识语言“,在国内很多人理解xml为html的简单扩展,这实际上是一...
为什么word文档变成了xml格式
所谓的xml,就是eXtensible Markup Language, 翻译成中文就是“可扩展标识语言“,在国内很多人理解xml为html的简单扩展,这实际上是一种误解。
尽管xml同html关系非常密切。
XML与SGML、HTML的关系。
SGML、HTML是XML的先驱。
SGML是指“通用标识语言标准”(Standard Generalized Markup Language), 它是国际上定义电子文件结构和内容描述的标准,是一种非常复杂的文档的结构,主要用于大量高度结构化数据的防卫区和其他各种工业领域,利于分类和索引。
同XML相比,定义的功能很强大,缺点是它不适用于Web数据描述,而且SGML软件价格非常价格昂贵。
HTML相信大家都比较熟悉,即“HyperText Markup Language” (超文本标识语言),它的优点是比较适合web 页面的开发。
但它有一个缺点是标记相对少,只有固定的标记集如.等。
缺少sgml 的柔性和适应性。
不能支持特定领域的标记语言,如对数学、化学、音乐等领域的表示支持较少。
举个例子来说,开发者很难在web pape 上表示数学公式、化学分子式和乐谱。
Xml 结合了sgml 和html的优点并消除其缺点。
Xml 仍然被认为是一种sgml语言。
比sgml要简单,但能实现sgml的大部分的功能。
1996年的夏天,Sun Microssystem的John Bosak开始开发W3C SGML工作组(现在称为xml工作组)。
他们的目标是创建一种sgml,使其在Web中,既能利用Sgml的长处,又保留html的简单性。
现在目标基本达到。
二、Xml 的发展。
在专业领域中,出现了Web标记语言的许多项目,著名的有CML—化学标记语言,由Peter Murray_Rust 开发,同时开发了第一个通用xml 浏览器Jumbo . 在数学方面,包括IBM公司再内都在致力开发MathML 1997年四月,出版了xll的第一个版本。
当xll完整实现时,将比html 和当前浏览器所达到的链接水平更复杂,更强大。
1997年8月,Microsoft公司和Inso公司引入xsl.由于xml是纯结构和语义的,需要描述单个元素格式方法。
可以使用html的CSS;另一种方案是xsl. 1998年1月,microsoft 公司出版发行了msxsl程序。
可以利用xsl表和xml文档创建能被IE4 识别的html页面。
1998年2月,W3C发布了xml1.0的正式版本。
最近一年多来,由于网络应用的飞速发展,xml的发展非常迅猛。
出现了DOM(Document Object Model),XSLT(XSL Transformation)等新名词,xml的应用软件也有了飞速的发展,Microsoft、IBM、Breeze、Stilo等公司纷纷推出了自己的或解析器,或开发平台。
在MicrosoftIBM、HP等大公司的推动下,目前有两个著名的xml的研究组织,分别是biztalk.com和oasis.org,由他们向W3C提出标准的建议。
其中biztalk是有Microsoft牵头组织的,有趣的是Microsoft公司同时参加了oaisis,不过不同于IBM、HP等著名大公司,他的年费只交10万美元,用Microsoft发言人的话就是“一切视oasis的发展而定!“,言下之意就是如果oasis制定的标准抵触Microsoft的应用,一场标准大战不可避免。
什么是XML 首先XML是一种元标记语言,所谓“元标记”就是开发者可以根据自己的需要定义自己的标记,比如开发者可以定义如下标记 ,任何满足xml命名规则的名称都可以标记,这就为不同的应用程序打开了的大门。
HTML是一种预定义标记语言,它只认识诸如,等已经定义的标记,对于用户自己定义的标记是不认识的。
第二xml是一种语义/结构化语言。
它描述了文档的结构和语义。
举个例子,在和html中,要描述一本书,可以如下表示: book name author_name publisher_name ;;;; isbn_number 在xml中,同样的数据表示为 book name author name publisher name isbn_number 从上面的对比,可以看出,xml的文档是有明确语义并且是结构化的。
XML是一种通用的数据格式从低级的角度看,xml是一种简单的数据格式,是纯100%的ASCII文本,而ASCII的抗破坏能力是很强的。
不象压缩数据和java对象,只要破坏一个数据文件数据就不可阅读。
从高级的角度看,是一种自描述语言。
XML可利用于数据交换 主要是因为XML表示的信息独立于平台的,这里的平台即可以理解为不同的应用程序也可以理解为不同的操作系统;它描述了一种规范,利用它Microsoft的word文档可以和Adobe 的Acrobat交换信息,可以和数据库交换信息。
XML表示的结构化数据。
对于大型复杂的文档,xml 是一种理想语言,不仅允许指定文档中的词汇,还允许指定元素之间的关系。
比如可以规定一个author元素必须有一个name子元素。
可以规定企业的业务必须有包括什么子业务。
XML文档。
XML文档有DTD和XML文本组成,所谓DTD(Document Type Definition ),简单的说就是一组标记符的语法规则.,表明XML文本是怎么样组织的,比如DTD可以表示一个必须有一个子标记, 可以有或者没有子标记 等等。
当然一个简单的XML文本可以没有DTD。
下面是一个简单的xml文本。
haha 其中以?开始并结尾的是进程说明。
Standalone表示外围设备。
这里外围设备可以理解为该XML文本没有应用其他的文件。
因为XML文件可以外部应用DTD等外部数据。
XML 涉及的一些技术。
XSL和CSS。
通过前面的介绍可以知道,...
为什么word文档变成了xml格式
首先要明确的是:XML是被设计用来存储数据、携带数据和交换数据的,它不是为了显示数据而设计的。
1、XML可以从HTML中分离数据,通过XML,你可以在HTML文件之外存储数据。
在不使用XML时,HTML用于显示数据,数据必须存储在HTML文件之内;使用了XML,数据就可以存放在分离的XML文档中。
这种方法可以让你集中精力去到使用HTML做好数据的显示和布局上,并确保数据改动时不会导致HTML文件也需要改动。
这样可以方便维护页面。
XML数据同样可以以“数据岛”的形式存储在HTML页面中。
你仍然可以集中精力到使用HTML格式化和显示数据上去。
2、XML用于交换数据,通过XML,我们可以在不兼容的系统之间交换数据。
在现实生活中,计算机系统和数据库系统所存储的数据有N^N种形式,对于开发者来说,最耗时间的就是在遍布网络的系统之间交换数据。
把数据转换为XML格式存储将大大减少交换数据是的复杂性,并且还可以使得这些数据能被不同的程序读取。
3、XML 和 B2B,使用XML, 可以在网络中交换金融信息。
在不远的将来,我们可以期望看到很多关于XMl和B2B(Business To Business)的应用。
XML正在成为遍布网络的商业系统之间交换金融信息所使用的主要语言。
许多与B2B有关的完全基于XML的应用程序正在开发中。
4、XML可以用于共享数据,通过XML,纯文本文件可以用来共享数据。
既然XML数据是以纯文本格式存储的,那么XML提供了一种与软件和硬件无关的共享数据方法。
这样创建一个能够被不同的应用程序读取的数据文件就变得简单了。
同样,我们省级操作系统、升级服务器、升级应用程序、更新浏览器就容易多了。
5、XML可以用于存储数据,利用XML, 纯文本文件可以用来存储数据。
大量的数据可以存储到XML文件中或者数据库中。
应用程序可以读写和存储数据,一般的程序可以显示数据。
6、XML可以充分利用数据,使用XML,你的数据可以被更多的用户使用。
既然XML是与软件、硬件和应用程序无关的,所以可以使你的数据可以被更多的用户、更多的设备所利用,而不仅仅是基于HTML标准的浏览器哦。
别的客户端和应用程序可以把你的XML文档作为数据源来处理,就像他们对待数据库一样,你的数据可以被各种各样的“阅读器”处理,这时对某些人来说是很方便的,比如盲人或者残疾人。
7、XML可以用于创建新的语言XML是WAP和WML语言的母亲。
无线标记语言(WML,The Wireless Markup Language ), 用于标识运行于手持设备上(比如:手机)的Internet程序。
8、如果开发者有足够的预见性,那么将来的应用程序都应该使用XML的形式来此存储数据。
将来我们所使用的字处理器、电子表格软件和数据库应该能够以纯文本的格式相互读取数据,而不需要经过格式转化的过程。
我们只能期盼微软和其他软件开发商也赞同这一点。
//事实上微软正在大力发展XML的应用呢。
XML格式用什么软件可以打开?
XML是一种标记语言。
结构化的信息中包含了一些内容(例如文字,图片等)和一些指示出内容的重现手段的标记(例如,在一个章节头部的信息和其脚注处的信息是有不同含义的。
)所有的文档都有不同的结构。
一种标记语言,是定义文档结构的机制。
XML规范定义了一个对文档进行标记的标准。
打开方法:1、直接在浏览器打开。
用word、FrontPage、IE、记事本都能打开用word编辑之后可以另存为xml格式用FrontPage和记事本可以直接编辑xml文件的代码用IE只能查看代码,但是不能修改(单纯查看代码,用IE比较方便)2、如果是微软的XML,使用.net的编辑器打开也是不错的,可以浏览和编辑增加数据。
不过仅仅限于微软自己格式的XML。
3、用openoffice打开。
文本编辑器...
请问电脑高手一个问题我的文件原来是XML格式的被我改成WORD格式...
1-apache的POI,此方法对Excel的导出做的很好,目前对Word的导出方面的功能尚未完全。
2-纯JavaScript脚本实现。
主要通过客户端调用本机Office组件来实现。
3-在JSP页面引入头文件实现。
纯JavaScript脚本实现细节方面大体是创建一个word组件ActiveXObject("Word.Application"),用js通过表ID取得表内容然后保存到word,要注意的是js实现有很多不好的地方,例如Internet选项需要把ActiveX空间全部启用,安全级别设置为中。
这样的话岂不是每台机器都要配置一下。
其次每次生成word文档以后弹出对话框(无法保存此文件,因为它已在别处打开(C:\...\STARTUP\Powerword.dot)),出现此问题就需要把C:\Documents and Settings\当前用户名\Application Data\Microsoft\Word\STARTUP下的Powerword.dot文件删除,每次遇到此问题就需要删除文件来解决,十分不方便。
-
给我们打电话
7*24小时服务热线:1399999999
全国客服热线:400-0000-000 -
百度地图
福建省三明市 -
给我们发邮件
E-mail:[email protected]
在线沟通