当前位置导航:炫浪网>>网络学院>>网页制作>>ASP.NET教程

.Net中处理Word 2007文档的一种方法

  有的时候我们需要在程序中处理Word文档,比如,删除或替换掉文档中的某些字符串,实现这个功能有很多方法,我这里介绍一种方法,个人认为其效率要优于其它方法,但本方法目前只适用于office 2007 中的Excel,Word, PowerPoint. 下面引用一些msdn上关于office 2007的介绍。 2007 Microsoft Office system为Microsoft Office Excel 2007,Microsoft Office Word 2007,和Microsoft Office PowerPoint 2007采用了基于XML的文件格式,新的格式增强了文件与数据的管理能力,数据恢复能力,以及与业务线系统的互操作能力。它们是对早期版本的二进制文件的扩展。任何支持XML的应用程序都可以访问新文件格式当中的数据,并与之协同工作。这些应用程序并不需要成为Microsoft Office system或Microsoft产品的一部分。用户也可以使用标准的转换来提取或重新组织数据。另外,有关安全性的担忧也大大的降低,因为信息是存储在XML当中的,它从本质上来讲都是纯文本的。因此,数据可以没有任何障碍地通过企业防火墙进行传递。
 
  注意:不要将Office Open XML格式与Microsoft Windows XML Paper Specification格式相混淆。Office Open XML格式使用Open Packaging Conventions,XML Paper Specification (XPS)也使用它。但是,这两种格式在许多重要的方面是不同的。XPS是一个页面内的,固定的文档格式,它是在Microsoft Windows Vista操作系统当中所引入的。而Office Open XML格式是面向Office Word 2007,Office Excel 2007,和Office PowerPoint 2007的完全可编辑的文件格式。虽然它们在XML和ZIP压缩的使用方面有很多相似的地方,但是它们在文件格式的设计和使用目的上还是有着很大的不同。
 
  为了打开一个Word 2007 XML文件1、创建一个临时目录来存储文件和它的部件。
 
  2、创建一个Word 2007文档,包括文本,图片,以及其它元素,保存为一个。docx文件。
 
  3、在文件名的末端添加一个。zip扩展名。
 
  4、双击文件。这时将会在ZIP应用程序当中打开该文件。您可以查看组成文件的每个部件。(可以不用winrar压缩工具打开,以windows默认的zip格式打开)
 
  5、将这些部件提取到刚才创建的临时目录当中。
 
  这时就可以看到组成docx文件的所有XML格式的文件。这里需要大家详细阅读一下我上面给的链接的内容,现在我主要介绍一下在。net中处理word(2007)文档的一种方法,需要说明的是在。net frameword 2.0 中并没有提供相关的类来处理zip格式的文件,在。net framework 3.0中提供了一个类Package,所属的命名空间为System.IO.Packaging,因此在本例中要实现对word文档的处理必须安装。net frameword 3.0 或者 3.5,在引用中要添加对WindowsBase.dll的引用,这个DLL文件在windows 2003 系统里位于C:\Program Files\Reference Assemblies\Microsoft\Framework\v3.0\目录下。
 
  我做的这个例子是替换Word页脚中的链接,将http://www.google.cn/

共2页 首页 上一页 1 2 下一页 尾页 跳转到
相关内容
赞助商链接