内容爬网程序
内容爬网程序事物用于调用其他实体中的服务。内容爬网程序可用于检索数据并将其存储在内容爬网程序事物的
数据表中。
在独立于内容爬网程序事物的其他实体中,您必须定义用于获取数据并将该数据的信息表返回到内容爬网程序的服务。之后,内容爬网程序会将入站字段和标记映射到内容爬网程序的数据形状中所使用的字段。每一行均以新条目的形式添加到内容爬网程序事物的数据表中。内容爬网程序数据表的索引方式与数据表实体的索引方式相同。
创建内容爬网程序
要将某一实体的数据表中的数据检索到内容爬网程序事物的数据表中,请执行以下操作:
1. 创建一个数据形状并定义数据表中要使用的字段。要从 Composer 中创建数据形状,请浏览 > ,然后单击“新建”按钮。
a. 输入名称和说明。
b. 在“字段定义”区域中,单击“添加”按钮。
c. 在新字段定义窗格中,输入相应的信息,然后单击
。
2. 使用上一步中创建的数据形状来创建数据表。要从 Composer 中创建数据表,请浏览 > ,然后单击“新建”按钮。
a. 选择数据表模板,然后单击“确定”。
b. 输入名称和说明,然后选择上一步中创建的“数据形状”。
c. 在“服务”区域中,单击“添加”创建自定义服务。
d. 在“输出”区域中,从下拉列表中选择 INFOTABLE。
e. 选择在上一步中创建的“数据形状”。
f. 将“信息表类型”设置为“是内容爬网程序条目”,然后单击“完成”。
3. 为内容爬网程序事物创建新的数据形状。
| 您可以创建新的内容爬网程序特定的数据形状,也可以使用在步骤 1 中创建的数据表中所使用的数据形状。尽管此步骤为可选步骤,但我们将在此示例中使用内容爬网程序事物的新数据形状。 |
a. 创建新的内容爬网程序事物:
i. 在 Composer 中,浏览 > ,然后单击“新建”按钮。
ii. 输入一个名称,然后在“基本事物模板”字段中,选择“内容爬网程序”。
iii. 在“数据形状”字段中,选择在上一步中创建的数据形状,然后单击“保存”。
内容爬网程序配置
内容爬网程序事物的“配置”区域中包含多个配置表格,以便您从检索到的数据进行字段映射。
• “字段到标记映射”配置表会将字段值映射到数据标记词汇的标记中。
◦ 当数据标记词汇为动态词汇时,从数据中映射的任何值都会在词汇中自动输入一个术语。
◦ 当数据标记词汇不是动态词汇时,从数据中映射的任何值都需要一个预定义术语,该术语表示要正确映射的值。
◦ 例如:TestingVocab:false;TestingVocab:iAmAString。第一部分为 boolProp 值,第二部分为 stringProp 值。
• 您可以通过数据表的“索引设置”配置来定义其他表索引。这与关系数据库表类似,除了主键 (主键在数据形状中定义) 之外,还需要根据其他字段查询表。您应该为经常使用的每组筛选器标准创建一个索引。此操作将对查询性能产生重大影响。
• “字段到字段映射”配置表会将已检索数据中的字段映射到针对内容爬网程序事物的数据形状所定义的字段中。
| 如果内容爬网程序事物和内容爬网程序服务中返回的信息表使用相同的数据形状,则无需进行字段映射,因为字段映射会进行自动处理。 |
内容爬网程序服务
以下为内容爬网程序事物所独有的服务:
• CrawlEntries - 清除内容爬网程序的所有数据表条目,然后执行 GetExternalContent。
• GetExternalContent - 执行内容爬网程序事物的“常规信息”区域中定义的服务。系统将从服务中返回已检索值的信息表。不会对内容爬网程序数据表执行任何修改。
• GetExternalContentDetail - 通过密钥检索特定的内容项。