结构文档概述
结构化文档符合定义和控制文档结构的一组规则。XML 和 HTML 是结构化文档的实例。
定义文档结构的规则集合称为“文档类型”。在 Arbortext Editor 中创作文档时,编辑器将持续检查在关联文档类型中定义的规则,并且仅允许将符合这些规则的内容插入到文档中。DocBook 和 DITA (达尔文信息类型化体系结构) 是文档类型的实例。
文档类型定义文档的以下组成部分:
• 可在文档中使用的标记集
标记是结构化文档的基本构建块。标记是一个容器,具有起始标记和结束标记。标记可包含其他标记、属性和文本。段落和列表是标记的实例。
• 与各标记关联的“属性”
属性提供有关标记的附加信息,属性包含在标记内部。例如,标记可具有一个属性,用于定义标记中的信息适用于何种用户类型。
• 用于排列标记的结构
每个文档类型都有一个单独的标记,该标记包含在文档类型中定义的所有其他标记。文档类型定义该外部标记中包含的标记的层次结构。文档类型也定义标记是可选的还是必需的,及其是否可包含其他标记、文本或二者。
下面是用于写信的文档类型的一个示例:
Letter、Date、Greeting、Body、Paragraph、List、Table 或 Close
Letter 文档类型包含以下主要标记:
• Letter
Letter 标记是文档类型中的外部标记,包含另外七个标记。其中四个标记 (Date、Greeting、Body 和 Close) 是必需的,并且必须以该顺序出现在 Letter 文档中。
• 日期
Date 标记必须是插入到 Letter 文档中的第一个标记。它只能包含文本,并且用于包含日期。
• 问候语
Greeting 标记必须是插入到 Letter 文档中的第二个标记。它只能包含文本。
• 正文
Body 标记必须是插入到 Letter 文档中的第三个标记。它只能包含其他标记,而不能包含文本。Body 标记可包含一个或多个 Paragraph、List 或 Table 标记。Body 可以包含任意数量及任意顺序的这些标记。
• 关闭
Close 标记必须是插入到 Letter 文档中的最后一个标记。它只能包含文本。
样式表
结构化文档的格式并不存储在文档自身中。相反,各种文档类型都具有与其关联的一个或多个样式表,用于通过一系列样式设置来控制文档的外观。样式设置可包含基本格式化信息,如字体大小、段落间距及页面布局,也可包含更多的高级格式化信息,如目录和索引的自动生成。
通过样式表控制 Arbortext Editor 窗口中文档的外观。