XADPP数字出版加工平台

  一、产品简介
  优质的媒体内容是传统出版最大的优势。将这些内容进行全媒体出版,包括网络出版、移动出版等,使内容的价值得到最大化,是传统出版与新媒体技术的强强联合。
  要满足各种数字出版应用的需要,就必须对报刊电子出版物或数字化结果进行版面理解和版面分析,建立数据之间的结构和逻辑关系。原始的内容经过深度加工后,还能提高信息的附加值。
  本软件是一个将PDF、PS等文件进行分析、反解、标引和输出各种格式的集成工具,为数字报、数字期刊、移动出版提供一个高效率、功能全的内容加工平台,为数字出版各个环节(存储、查询、展示、再利用、知识挖掘、版权保护、电子商务等)生产符合需求的数据。本软件面向各种数字出版应用,全面超越了传统的报刊反解标引工具,为出版内容和出版形式进行全方位深层次的开发和利用提供了可能。
  系统示意图:


  二、技术特点
  1、 全面的输入格式支持
   PDF:支持单层PDF、双层PDF。由于各种格式均可转为PDF,不需要为每种格式单独开发,就共享了PDF内容加工的所有特性。鉴于支持PDF至关重要,我们在系统中配备了两套PDF解析引擎,最大程度地兼容了各种PDF可能存在的问题。系统可以不依赖Acrobat独立运行。对PDF解析的正确性和效果可以达到Acrobat标准。
   PS:为了方便用户,和充分利用PS中版面结构信息,系统支持直接打开PS。支持的PS包括方正全系列(书版、维思、飞腾3、飞腾4、飞腾5、创艺、文合等)、华光全系列、以Adobe为代表的标准PS。能有效处理PS内嵌字体、内嵌图片、EPS图、艺术字、花边、图片裁剪、公式、字体映射、乱码修正、字符位置修正等。无需另行提供页面图。
  2、 基于模板的自定义标引界面

  3、 全面的输出能力和自定义输出能力
   支持输出主要的文件格式:包括TEXT、HTML、XML、EPUB、WORD等。
  4、自动分析和处理
  5、高效的生产效率
   减少录入:默认值、可选值、值继承、全局字段、变量自动取值等。
   自动查错:检查空值、唯一性、多值、正则表达式。
   自动标引:通用的关键词自动标引。
   备份恢复:一次做不完,可以备份工作状态,下次恢复后继续。
   多人协作:报纸版面大,时效性强,可以多人分工,分别处理不同版面。
   自定义快捷键。
  6、完善的特殊功能
   连版的批量拆分。
   英文空格分析。
   PDF原图抽取。
   合并处理。
   可视化人工干预。
  7、开放性、灵活性及可扩展性
  可定制的标引方案、输出方案、分类法,多种上传方式,便于针对不同的数据或应用,快速定制,满足不同项目的需要,与不同系统进行配合。
  三、特色功能列表
  支持飞腾5 PS:很多同类产品不支持。
  支持PDF:未来趋势,多种识别引擎保证。
  支持版面分析(自动划框)。
  自动识别图文块类型(标题、正文、图片、表格)。
  自动分析段落。
  自动抽取元数据(引题、副题、作者等)。
  支持自定义分类。
  支持电子报、手机报的数据加工。
  四、演示截图

报纸数字出版 期刊杂志数字加工 ps解析 pdf解析