看过本文的还看了

相关文献

该作者的其他文献

文献详情 >PDF阅读器的设计与实现 收藏
PDF阅读器的设计与实现

PDF阅读器的设计与实现

作     者:李强 刘时进 

作者机构:华中师范大学物理科学与技术学院湖北武汉430079 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2010年第31卷第7期

页      码:1635-1638页

摘      要:为有效提取PDF(portable document format)文件中的文字、图片、图形信息,提出了包含文件预处理、显示预处理、功能扩展、显示4个单元的PDF阅读器的实现模型。基于PDF文件结构特点,提出了忽略次要信息定位关键位置的解析思路。在此基础上,针对FlateDecode、DCTDecode和CCITTFaxDecode这3种过滤器处理的数据流,给出了详细的解决方案,然后对PDF页面内容进行两次解析,设计相应的文字图形等数据结构保存结果,最后对数据利用和功能扩展进行了讨论。通过实验结果表明,该模型能较好地实现PDF信息提取和显示,有利于PDF在中文信息处理领域中的进一步开发利用。

主 题 词:可移植文档格式 阅读器 文件解析 图像提取 信息处理 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2010.07.014

馆 藏 号:203733544...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分