• unix操作系统下载网站 > 泽元网站内容管理系统(ZCMS)网页采集操作手册
  • 泽元网站内容管理系统(ZCMS)网页采集操作手册

    免费下载 下载该文档 文档格式:PDF   更新时间:2010-04-01   下载次数:0   点击次数:1
    文档基本属性
    文档语言:English
    文档格式:pdf
    文档作者:Windows XP
    关键词:
    主题:
    备注:
    点击这里显示更多文档属性
    泽元网站内容管理系统(ZCMS)网页采集操作手册
    泽元网站内容管理系统(ZCMS) 泽元网站内容管理系统(ZCMS) 网页采集操作手册 网页采集操作手册
    北京泽元迅长软件有限公司 2010 年 04 月
    泽元网站内容管理系统(ZCMS)网页采集操作手册
    关于本文档
    ZCMS是泽元软件出品的一款基于J2EE技术和AJAX技术的企业级网站内容管 理软件,旨在帮助用户解决日益复杂与重要的Web内容的创建,维护,发布和应 用.本文档概要地介绍了通过ZCMS快速采集其他网站内容的方法和步骤.
    读者对象
    本文档的读者为ZCMS的使用者.使用者应具备以下基础知识: 熟悉Microsoft Internet Explorer或Mozilla Firefox的使用; 熟悉Windows或Linux/Unix操作系统; 熟悉HTML基本知识和相关的HTML页面制作方法.
    用户反馈
    感谢您使用泽元软件的产品. 如果您发现本文档中有错误或者产品运行不正 常,或者您对本文档有任何意见和建议,请及时与泽元软件联系.您的意见将是 我们做版本修订时的重要依据.
    联系地址
    北京泽元迅长软件有限公司: 北京泽元迅长软件有限公司 北京市海淀区学院路30号北京科技大学国家科技园D座311 邮编:100086 电话:(010)52752668 传真:(010)52752667 Email:support@zving.com
    泽元网站内容管理系统(ZCMS)网页采集操作手册
    1.ZCMS 中的 Web 采集
    ZCMS 中的 Web 采集功能是一个易用的功能强大的基于模板的内容采集和提 取工具,支持自动采集文章列表分页,ASP.net 分页采集,自动采集 URL 转向后 的内容,自动识别内容编码,自动识别网页修改日期,多线程采集,多层级 URL 采集等特性,并支持使用代理服务器和 URL 过滤,内容过滤. 采集完成后,ZCMS 将根据匹配块中的规则,提取文章的标题,内容等信息, 并自动添加到指定的内容,以便于编辑人员进一步利用.
    2.填写采集基本设置
    点击菜单"采集与分发"下的"从 Web 采集"子菜单,点击"新建"按钮, 可以增加新的采集任务,如下图所示:
    其中: 采集类别为文档采集 采集类别 文档采集时,采集程序将直接将网页转化成 ZCMS 中的文档,如 文档采集 果是自定义采集 自定义采集,则只采集数据,不进行转换,需要开发程序去读取采集回来的 自定义采集 文本,并进行处理.自定义采集 自定义采集只用于 ZCMS 的二次开发. 自定义采集 内容页最大采集数 内容页最大采集数表示本任务最多采集多少个文章内容页.
    泽元网站内容管理系统(ZCMS)网页采集操作手册
    列表页最大采集数表示本任务最多采集多少个文章列表页. 最大采集数 采集线程数表示同时进行采集的线程个数,此数值越大,则采集速度越快, 采集线程数 占用带宽也越多.一般情况使用 1 个线程即可,最多不超过 30 个. 超时等待时间表示如果目标网页所在服务器忙时,采集程序等待的秒数.默 超时等待时间 认是 30 秒,一般不应超过 120 秒. 发生错误时重试次数表示如果目标服务器没有响应或者响应出错,采集程序 发生错误时重试次数 重试的次数. 发布日期格式表示从网页内容中提示出来的发布日期的格式,与 JAVA 中的 发布日期格式 日期格式一致,以 y 代表年,M 代表月,d 代表日,h 代表小时,m 代表分,s 代表秒.发布日期将用来排序采集到的文档,发布日期较晚的将会排在前面. 采集选项中的"下载远程图片 下载远程图片"被勾选的话,采集程序会自动将内容中的图 下载远程图片 片下载到 ZCMS 服务器,并替换内容中的图片地址. 采集选项中的"去掉内容中的链接 去掉内容中的链接"被勾选的话,则采集程序会自动将内容 去掉内容中的链接 中所有超链接变成纯文本. 采集到此栏目表示采集后的文档存放到哪个栏目 采集到此栏目 如果 ZCMS 所在服务器不能直接访问互联网或者目标网页必须通过特殊代理 才能访问,则需要勾选"使用代理服务器 使用代理服务器"选项,并填写代理服务器的地址,端 使用代理服务器 口,用户名以及密码.
    3.填写 URL 规则
    填写完基本设置后,即可开始填写 URL 规则,以网易通信新闻为例,可以按 如下步骤进行: 1)填写起始 URL,将网易通信新闻列表页 URL 填如,如下图所示:
    泽元网站内容管理系统(ZCMS)网页采集操作手册

    下一页

  • 下载地址 (推荐使用迅雷下载地址,速度快,支持断点续传)
  • 免费下载 PDF格式下载
  • 您可能感兴趣的
  • 最新unix操作系统下载  unix操作系统镜像下载  unix中文操作系统下载  scounix操作系统下载  unix操作系统  unix操作系统入门  unix操作系统乌班图  查看unix操作系统命令  unix操作系统设计