蜜蜂采集器的使用教程 - 将采集数据发布到Word文档
蜜蜂采集器的采集数据,可以通过“发布到文件”来发布到Word文档。此外,也可以使用“发布到插件”的方式,通过插件发布到Word文档。这里仅介绍通过使用“发布到文件”方式来实现发布到Word文档的功能。
发布到Word文件
打开主菜单“发布”——“发布到文件”管理器。添加一个文件发布配置,其中的“输出文件名”为[任务名].[文件扩展名] ,模板文件路径自定义并且后缀为.html 。这里希望保留网页里面的排版,所以,将标签转义设置为无 。
系统自带模板中,仅支持输出[标签:标题] 、[标签:内容] 等几个固定标签。因此这里使用自定义模板方式。即,模板文件路径使用自定义路径,再点击“自动生成模板文件”,选中相应的采集规则,选中需要发布的标签,点击“确定”。至此,生成了文件发布模板。
编辑模板文件。自定义生成的模板是table表格格式的,需要修改一下。此外,如果希望保留网页里面的排版,还得将网页里面的css文件内容复制到模板中,放到style标签下面。
编辑采集任务规则时,内容发布通道中添加一个“发布到文件”通道,并选中刚刚添加的文件发布配置。至此,完成了文件发布的设置。
任务发布时,系统就会自动将数据发布到HTML文件中了。再使用Word软件打开这个HTML文件,然后另存为doc或docx格式的文件。 |