HttpHandler解析并展示PDF文档内容

前言
如果我们想将服务端的PDF文档内容展示给客户端，往往会通过URL直接访问的方式。这样一来，PDF文档就会毫无保留的保存到客户端去，通过浏览器的PDF插件，客户端可以随意拷贝PDF的副本。（如下图）

本文通过HttpHandler和开源控件PDFBox来对PDF文档进行访问控制，只向客户端解析并展示PDF的内容而非PDF文件本身。

PDF解析
目前有许多PDF解析组件，国内比较常用的是iTextSharp，该控件早期从JAVA移植过来，完全支持.NET平台，在创建PDF文档方面非常灵活易用。然而在读取解析PDF时却显得力不从心，只有少数复杂难用的类可以让我们读取PDF。故不适合本案。

PDFBox在此方面表现却非常突出，同样，它也是从java平台移植过来的，常用来作为Lucene的PDF索引器。目前，它的开源项目中已经包含了通过IKVM.NET（IKVM.NET is an implementation of Java for Mono and the Microsoft .NET Framework.）封装，而支持.NET的组件。

PDFBox对PDF的读取解析非常简单，只用如下代码即可完成：

private static string parseUsingPDFBox(string filename)
{
    PDDocument doc = PDDocument.load(filename);
    PDFTextStripper stripper = new PDFTextStripper();
    return stripper.getText(doc);
}
故我们选取PDFBox作为PDF解析器。

编写HttpHandler
接下来，我们新建一个类库项目，在其中创建PDFHandler类，实现IHttpHandler接口，用来作为.pdf文件的handler。

主要完成的步骤如下：

1. 为类库和网站添加如下引用：
PDFBox-0.7.2.dll IKVM.GNU.Classpath.dll 并将下面两个类库也复制到网站的Bin文件夹中：

FontBox-0.1.0-dev.dll IKVM.Runtime.dll 2.

共3页首页上一页 1 2 3 下一页尾页跳转到页

上一篇：ASP.NET动态设置页面标题下一篇：ASP.NET如何在mail的正文显示图片

相关内容

[更多]

赞助商链接

【注意】炫浪网版权所有,未经书面授权禁止模仿风格或建立镜像网站.如有违反,追究法律责任.
【声明】本网站部分内容属社区网友发布，本网站仅提供网友交流平台，但有权在本网站范围内引用、发布、
转载来自社区网友发布的内容。网友发布内容纯属个人行为，与本网站立场无关。本网站对于网友发布的
内容所引发的版权、署名权的异议及纠纷，不承担任何责任。粤ICP备11064832号公安备案编号：4453023010550