帝国模板之家为广大用户提供专业、一站式建站服务。

帝国cms教程

帝国cms教程栏目,提供精品建站,仿站,二次开发,安装,标签使用等图文教程,帮助建设和管理好你的帝国cms站点。

当前位置:首页 > 教程 > 帝国cms教程 > 正文

帝国cms 采集正则

帝国模板之家 2020-08-12 帝国cms教程 评论

帝国cms 采集正则

帝国CMS的采集正则作用:通过设置采集正则以便使系统识别你要采集的内容。帝国CMS的采集正则是什么样的,下面我们用实例讲解:

(1)、假如我们要采集页面的内容页为如下页面:

图1:HTML页面

帝国cms 采集正则

图2:查看页面源代码为如下:

帝国cms 采集正则

(2)、由上图的源代码内容我们可以得出帝国CMS的采集正则:

新闻标题正则:
    <td>标题:<strong>[!--title--]</strong></td>
新闻内容正则:
    <td>内容:<font color="#FF0000">[!--newstext--]</font></td>

上面中的“[!--title--]”与“[!--newstext--]”分别为“标题”字段与“内容”字段的正则变量。用于指定我们要采集的内容位置。

(3)、由上面我们得出了,帝国CMS采集正则是把正则变量替换要采集内容后的代码内容。格式:

识别代码头部[!--变量名--]识别代码尾部
注意事项:上面的“识别代码头部”一定是要唯一的标记。

3、帝国CMS正则还有表示任意内容的字符:“*”

如果“识别代码头部”中有内容是变化的,那么我们可以用*代替它。如页面源代码为如下,我们要采集下面的链接地址:
<a title="任意可变内容" href="链接地址">标题</a>
通过使用“*”任意内容表示字符,我们可以用下面的正则忽略可变内容,获得链接地址:
<a title="*" href="[!--newsurl--]">
附加说明:[!--newsurl--]为页面链接地址的正则变量。

4、其他说明:

(1)、正则要找出唯一性的开头字符。有时候空格都会成为识别的依据。

(2)、对于特殊字符请在前面加上“\\”,当然直接将特殊字符改为“*”最合适了。特殊字符如下:

“ )”、“(”、“{”、“}”、“[”、“]”、“\”、“?”等等。

至此,帝国cms 采集正则教程介绍完毕!

这世上无忧无虑的人,反而相对寿命会长点。

已有 位小伙伴发表了看法

欢迎 发表评论

  • 匿名发表

关于

帝国cms模板

网页插件

帝国模板之家 | www.moyouyouw.cn

本站所有模板/文章除标明原创外,均来自网络转载,版权归原作者所有,如果有侵犯到您的权益,请联系站长删除,谢谢! 寻找帝国cms模板首选帝国模板之家,用心做站,上线至今广受好评,值得信赖!

  • 交流群1:帝国cms交流群1
  • 交流群2:帝国cms交流群2
在线QQ 给我留言