(2015年真题)简答题:根据所给材料回答问题。(凡要求作选择回答的问题,应将与所选选项对应的字母填写在答题卡上的相应括号内。把错项选入,该问题不得分;正确项少选,按所选的正确项数量得分。凡要求作陈述回答的问题,请将答案书写在答题卡的相应区域。)
某出版社拟将一批纸质图书进行数字化加工后制作数字出版产品,其设计的数字化加工流程如下(其中各个环节按序排列,而具体工作内容已予以简化):
第一环节 数据整理与格式转换
对接收到的数据进行规范化整理和修改工作。
第二环节 图书整理
逐页检查图书,处理好影响扫描的污损、粘连等问题。
第三环节 图书扫描
利用图文扫描仪将纸质图书逐页扫描为图像并以TIFF格式存储。
第四环节 图像处理
对扫描后的图像进行处理,包括污点去除、浓淡调整、版心调整和倾斜矫正,使之更适合阅读和识别。
第五环节 OCR识别
利用工具软件把图像中的文字、符号等转化为文本文件。
第六环节 版面分析
标记各类内容区域并确定其属性。
第七环节 内容结构化加工
使用专门工具软件对图书内容进行加工工作,确保图书数据的全面和准确。
第八环节 版式和流式文件加工
对上述各环节的成果进行集成和加工,使用专门的工具软件制作成版式文件和流式文件。
第九环节 质量检验
对成品数据的质量进行检验,确保加工的数据是合格的。
根据上述资料,回答下列问题。
该加工流程设计中对环节的安排存在哪些失误?
该加工流程设计中对环节的安排存在的失误有:
(1)纸质图书加工不需要“数据整理与格式转换”环节。
(2) “OCR识别”环节后缺少“内容校对”坏节。
(3)“版面分析”环节应该在“OCR识别”环节之前。
内容结构化加工时需要做哪些具体工作?
内容结构化加工时需要做的具体工作是内容拆分、内容标引、元数据加工。
数字化加工完成后,哪些类型的文件应该作为成品数据保存?请作选择回答。
A.原始图像文件
B.原始文本TXT文件
C.单层图像PDF文件
D.双层PD F文件
E.图形、图像打包ZIP文件
F.单层矢且PDF文件
G.图书元数据XML文件
H.结构化XML文件
I.资源数据库DBF文件
J.图书ePub文件
A、C、D、F、G、H、J