帝国cms文章采集教程(1)
DedeCMSV5.6版自动采集功能规则使用基本知识详细讲解教程
DedeCMSV5.6版自动采集功能规则使用基本知识讲解教程(一) 2011-05-05 17:09:01 来源: 作者: 【大中小】浏览:5026次评论:0条★★我要投稿★★将此页添加到网摘:DedeCMS采集功能使用基本知识讲解采集是指有着确定方向、明确目的的采撷和记录写作材料的一种活动。
它主要指调查采访和查阅和搜集资料。
采集最主要的作用在于为写作、分析、报表获取直接的和间接的材料。
今天我们讲的采集主要是指网站采集,网站采集的概念主要是:程序按照指定的规则定向获取其他网站数据的一种方式,另一种简单的说法就是将CTRL+C CTRL+V 程序化,系统化,自动化,智能化DedeCMS早期就已经加入了这个采集的功能,以前我们添加网站内容一般都是通过复制、粘贴、编辑然后再发布,这样对于少量的文章还是可以,但如果对于一个新站,什么内容都没有,那就需要复制粘提大量的文章,这是一个重复、枯燥的过程,内容采集就是解决这个问题,将这个重复的操作简化成规则,通过规则进行批量操作。
当然采集还可以通过一些专门的采集器来进行采集,国内比较出名的采集器有火车头。
今天我们这里以DedeCMS程序自带的采集功能来讲解如何使用采集,并介绍如何对采集的内容进行一些批量的管理。
首先我们进入系统后台,打开[采集]-[采集节点管理],在学习使用这个采集工能之前先介绍一些基本的技术知识。
首先我们需要知道HTML基本内容,我们知道浏览器中显示的各种各样的页面其实都是由最基本的HTML组成的,我们可以在我们DedeCMS系统后台发布一篇内容,然后对内容进行一些格式上面的设置。
也就是说我们的页面都是HTML代码经过浏览器解析后显示出来的,这些基本的HTML代码是给机器看的,而解析出来显示的内容是给我们的用户看的,机器其实是一个死东西,他阅读网页不像用户一样,直接看到某一个部分的内容,机器能够看到的是某一部分代码。
DedeCMSV5.6版自动采集功能规则使用基本知识讲解教程(二) 2011-05-05 17:09:01 来源: 作者: 【大中小】浏览:5027次评论:0条★★我要投稿★★将此页添加到网摘:例如,我们查看一个网页:,我们很容易就看到这个文档的内容部分,如图中黄色区域。
PHPCMS 、帝国及织梦对比分析(十一)之采集功能
提到采集,有些站长抛出鄙夷的眼神,而似乎大部分站长都会觉得是CMS的标配。
在落叶看来采集只是一个功能,一个工具,关键看是采什么,采来后做什么,怎么处理采来的内容。
大家都知道火车头,一般基本用来采文章,但落叶经常用来采集邮箱,CMS间导数据,基至都用来采过QQ号。
火车头的整套流程即使对采集规则了解不多,也很方便来采文章,那么相较之于这种客户端软件,主流CMS中的采集模块,有哪些优缺点呢?本文中落叶对PHPCMS、帝国CMS及DEDECMS的采集功能作些对比,同时也对采集流程细节作些需求分析。
我们知道,通常的采集流程都是通过列表页分页批量获取内容页网址,然后对内容页分析,获取内容标题、文章内容等信息,因为各目标站的结构不同,采集规则会不同,CMS 不可能也不会提供通用的采集规则,那么要考量一款CMS采集模块是否好用基本是由整个采集任务设置流程的易用性、采集的稳定性与效率、采集完入库方便性等方面决定。
1.采集设置流程:整体体验:PHPCMS的任务添加流程中直接在TAB菜单的形式列出来网址采集、内容规则设置、高级设置三步骤,每一步中的结构都和火车头比较像,对火车头采集的比较熟悉用户会觉得PHPCMS的采集设置比较明了。
DEDE中流程类似,只是没有直接将几步列出,后一步的设置的前提是前一步设置正确。
帝国CMS中则是希望用户一口吃饱,从上至下把需要的信息全部列出来。
其实整体都基本三步,没有太明显的区别是,只是三者表现方式的不同给用户的心理感受是不同的。
PHPCMS简洁明了,让用户觉得采集很简单,三下两下就设置好了,新手愿意去尝试。
帝国CMS中用户一进入采集设置界面顿感压力,页面一直下拖,这么多设置项,首先想到的是“算了,换别的采集”,“这么多填到什么时候,填完了能不能提交还是一回事”,而DEDECMS中把采集过程和设置流程整合起来,优点时可以保证每一步都设置正确,但对采集比较熟悉的用户而言,效率偏低,每次都得POST提交一次测试一次。
帝国cms接口使用手册
文章标题
栏目,用于指定检查栏目,可在后台网站栏目管理处查看;
校验码,请自行设定,并在检查接口文件开始处修改$使其一致;
、发布配置文章检查网址处,可以如下填写:
您的网站<>您的栏目聞創沟燴鐺險爱氇谴净祸測樅。
注:使用大小写敏感的服务器的用户请注意网址大小写和网站文件一致
、接口文件无须任何改动即可使用,如果你希望增加校验或其他功能,请仔细修改;
、自定义字段
和其他参数一样,在发布配置参数取值处填好自定义字段的参数名,并设置好取值即可。
、需要自动生成首页、栏目页等静态,请在网站后台设置栏目属性选项设置后台信息发布设置;
但因性能关系,不建议选择除生成内容之外的静态页面,建议在计划任务中设置刷新任务生成它们;
、文件下载上传
如果需要缩略图、自动提取标题图,应使用参数调用的远程保存图片功能;此时,应取消采集规则中的文件下载和发布规则中的文件上传;謀荞抟箧飆鐸怼类蒋薔點鉍杂。
内容参数名,若要进行手动内容分页,请使用数据整理将的内容分隔标记“”替换为帝国的分页标记[],手动分页时,请将自动分页参数关闭;残骛楼諍锩瀨濟溆塹籟婭骒東。
栏目编号(请对照后台栏目管理查看栏目)
、主要参数
安全校验码,请自行设定,本项用以防止接口被他人利用,如果需要进行更多校验,请自行填加相关代码。
标签,可留空,多个用","逗号格开
注:“不属专题子类”,则取值为;
专题子类查询如图示:
目录名
相关链接模式,为按关键字查询,为手动设置;
手动模式设置相关链接时的相关文章,英文逗号分隔多个;
定时发布上线时间,请使用长日期标准格式;
定时发布下线时间,请使用长日期标准格式;
dedecms规则采集和使用教程
大家好!今天给大家录制一个dedecms采集规则编写以及使用教程星期8_淘淘小店地址今天采集的目标站地址选择下面的列表地址编写规则/more-yuleshijianbu-1.html0.节点名称随意编写我们写娱乐事件 如图(1)1.程序编码gbk utf8 程序编码是GB2312和gbk一样如图(1)2.地址批量/more-yuleshijianbu-(*).html如图(1)图13.列表前后代码截取代码在列表页必须只有这样一条代码<div class="more_left_6"><div class="paging"> 如图(2)4.必须包含链接关键词(通用)shtml 如图(2)图25.不得包含关键词主要是过滤文章内容链接不需要的地址如图(2)6.文章标题提取通常都是<title>[内容]</title> 如图(4)图4过滤规则{dede:trim replace=''}要过滤的内容{/dede:trim}{dede:trim replace=''}_娱乐_onlylady女人志{/dede:trim}标题规则这样就OK了如图(5)图57.内容规则提取内容前后截取的代码同样必须是整个页面唯一性的代码<div class="detail_content" id="detail_content">[内容]<!--PAGE-->8.过滤规则提取dedecms过滤规则最重要的地方很多朋友不会使用他本条规则过滤代码如下{dede:trim replace=""}<a([^>]*)>{/dede:trim}{dede:trim replace=""}<script([^>]*)>(.*)</script>{/dede:trim}{dede:trim replace=""}本文导航(.*)键翻页{/dede:trim}{dede:trim replace=""}<div([^.]*)>{/dede:trim}{dede:trim replace=""}</div>{/dede:trim}{dede:trim replace=""}<p style([^.]*)>{/dede:trim}{dede:trim replace=""}>" >点击图片进入下一页>>{/dede:trim}官方提供的过滤规则如下{dede:trim replace=''}<a([^>]*)>(.*)</a>{/dede:trim}{dede:trim replace=''}<script([^>]*)>(.*)</script>{/dede:trim}{dede:trim replace=''}<!--(.*)-->{/dede:trim}{dede:trim replace=''}<table([^>]*)>(.*)</table>{/dede:trim}{dede:trim replace=''}<style([^>]*)>(.*)</style>{/dede:trim}{dede:trim replace=''}<img([^>]*)>{/dede:trim}{dede:trim replace=''}<object([^>]*)>(.*)</object>{/dede:trim}{dede:trim replace=''}<embed([^>]*)>(.*)</embed>{/dede:trim}{dede:trim replace=''}<iframe([^>]*)>(.*)</iframe>{/dede:trim}{dede:trim replace=''}<param([^>]*)>(.*)</param>{/dede:trim}{dede:trim replace=''}<div([^.]*)>{/dede:trim}{dede:trim replace=''}</div>{/dede:trim}下面讲下常用的过滤规则{dede:trim replace=''}<a([^>]*)>(.*)</a>{/dede:trim} a链接的过滤规则但是如果在a链接后面带img图片链接的话只需要改下面规则{dede:trim replace=''}<a([^>]*)>{/dede:trim}js过滤规则{dede:trim replace=''}<script([^>]*)>(.*)</script> {/dede:trim} 一般不用动他是要前后开头<script都会自动把这样的代码干掉{dede:trim replace=''}<div([^.]*)>{/dede:trim}常用如果内容页面有<td width=950 height=100 align=middle>就可以把{dede:trim replace=''}<div([^.]*)>{/dede:trim} 改成{dede:trim replace=''}<td([^.]*)>{/dede:trim} 一次性全部干掉还有就是文字{dede:trim replace=''}</div>{/dede:trim}整段文字过滤{dede:trim replace=''}文字开头(.*)文字结尾{/dede:trim}9.内容分页代码系统提供{path}{file}_{p}{ext} 一般用这个就可以全部解决了不行的话就要在分页代码前后截取如<div class=page>[内容]</div>(1.)全部列出的分页列表(2.)上下页形式或不完整的分页列表(3.)分页列表规则开始: 结束三个选项基本上都可以解决分页难题10.规则采集数据导出方法采集-采集节点管理-勾选需要采集的规则-规则下面点采集如图(6)图6每页采集默认 5 可以按照自己服务器宽带速度适量修改一次采集太多可能会造成采集进度卡停如图7图7间隔时间一般在采集图集的时候需要用到他因为图集在采集标题的时候经常会采集错误导出数据如图8 到图9图8图9。
帝国cms调用博客最新或随机文章的方法
帝国后台随即调用博客的方法目前在国内比较流行的几款开源程序有帝国cms、织梦cms、wordpress等等,这些对建站和做seo优化的站长一定不陌生,一般都有在首页或者内页调用最新或是随机文章的嗜好,如果这些文章是同一个开源程序的,那比调用就相对容易一些。
如果是不相同的怎么办?下面我讲一下帝国cms调用wordpress博客最新或随机文章的方法,仅供大家参考。
1、帝国cms里信息调用标签比较常用的是(ecmsinfo),如下图,是ecmsinfo调用标签的格式,主要是栏目/专题ID和模板ID这两个参数,操作系统默认ID是24。
举个例子:比如[ecmsinfo]10,5,36,1,24,20,0[/ecmsinfo]“10”表示在“管理栏目”里的被标识的相应栏目的ID“20”表示“管理标签模板”里的标签模板ID整个代码的意思是按照标签模板ID(20)的规则在栏目ID(10)里调用其5篇文章的标题,而且调用的文章标题前不显示其栏目名和图片。
2、根据上面的例子,帝国cms调用wordpress博客随机文章的标签如下:[ecmsinfo]"select post_title as title,id as id from wp_posts order by rand() desc limit5",5,36,1,24,29,0[/ecmsinfo]说明:“select post_title as title,id as id from wp_posts order by rand()desc limit 5”这一段表示用SQL语句调用wordpress博客的数据库的字段命令。
(1)post_title对应的是wordpress博客的文章标题。
(2)id对应的是标题序号。
(3)wp_posts是存放wordpress的文章的数据表,如果帝国cms与wordpress博客是不同数据库,那么,上面的“wp_posts”改为“博客数据库名。
帝国cms如何获取根栏目或父栏目下所有文章内容
帝国cms如何获取根栏⽬或⽗栏⽬下所有⽂章内容帝国cms默认添加⽂章时,根栏⽬是不能添加的,只能添加在终极⼦栏⽬⾥,这个时候,如果通过灵动标签来获取根⽬录的⽂章是获取不到的,下⾯万书涛就来讲⼀下该如何通过代码来获取根栏⽬下所有⽂章内容获取根⽬录所有⽂章和数据内容代码如下:<?php$getsqlclass=$empire->query("select * from {$dbtbpre}enewsclass where bclassid='$GLOBALS[navclassid]'");$i=0;$arrclass= array();while($getclass=$empire->fetch($getsqlclass)){$sinclassid=$getclass['classid'];$arrclass[$i]=$sinclassid;$i++;}$classimp = implode(",", $arrclass);$getsqlnewssql=$empire->query("select * from {$dbtbpre}ecms_news where classid in ('$classimp')");while($getsqlnews=$empire->fetch($getsqlnewssql)){echo $getsqlnews[title]."<br/>";}>代码解释:上⾯代码⾸先是获取当前根栏⽬下的栏⽬id,然后再把栏⽬id压⼊⼀个数组,最后遍历数组,遍历过程中把新闻循环取出来了。
获取⼦栏⽬中的所有⽂章数据代码如下:<?php$getnewssql=$empire->query("select * from {$dbtbpre}ecms_news where classid='$GLOBALS[navclassid]'");while ($getnews=$empire->fetch($getnewssql)){><li><a href="<?=$getnews[titleurl]?>"><h2><?=$getnews[title]?></h2></a></li><?php}>代码解释:关键是sql语句,当为⼦栏⽬时classid='$GLOBALS[navclassid]',⽽为根栏⽬或者⽗栏⽬时bclassid='$GLOBALS[navclassid]',代码关键意思是取出所有新闻,条件是classid=当前栏⽬id,然后遍历循环取出。
帝国CMS首页调用内容页下载地址的方法-电脑资料
帝国CMS首页调用内容页下载地址的方法-电脑资料
这篇文章主要为大家介绍了帝国CMS首页调用内容页下载地址的方法,通过采用灵动标签结合动态URL地址实现该功能,是非常实用的技巧,需要的朋友可以参考下
本文实例讲述了帝国CMS首页调用内容页下载地址的方法,。
分享给大家供大家参考。
具体实现方法如下:
代码如下:
[e:loop={‘download‘,10,23,0,‘isgood=1‘}]
" target="_blank"> &id=&pathid=0" target="_blank">点击下载
[/e:loop]
希望本文所述对大家的帝国CMS建站有所帮助,
电脑资料
《帝国CMS首页调用内容页下载地址的方法》(https://www.)。
帝国CMS7.2和7.5适用的火车头采集免登陆发布模块配置方法详解(亲测可用)
帝国CMS7.2和7.5适⽤的⽕车头采集免登陆发布模块配置⽅法详解(亲测可⽤)帝国cms7.2增加了⾦刚模式,登录发布有难度。
⽕车采集器配合,完美解决你遇到的问题。
⽕车采集器(LocoySpider) ⽹页数据采集利器 V10.2 中⽂免费安装版类型:站长⼯具⼤⼩:29.4MB语⾔:简体中⽂时间:2022-03-02查看详情最近,整了⼀个帝国cms;帝国cms确实挺⿇烦的,后台所有的东西都需要去熟悉;整好之后,就开始配置⽕车头采集器的发布模块;下⾯把整个配置过程需要注意的问题给⼤家整理⼀下:获取分类这个地⽅,⼀直弄了很长时间,怎么操作都获取不到,后⾯仔细的检查接⼝⽂件,发现帝国cms的模板类型id没有修改,如果我们的帝国cms源码⾃带内容模板,这个地⽅⼀定要修改,下⾯先告诉⼤家如何获取这个模板id。
帝国后台依次按照下图点击:我的分类模板id是7,然后,再修改接⼝⽂件,修改的地⽅如下图:把modid后⾯的“7”改成⾃⼰的分类模板id就可以了。
再获取分类就可以了。
在该发布模块中有个作者便签需要修改,改成⾃⼰的,具体修改步骤:为防⽌⼀部分朋友找不到这个地⽅,下⾯给⼤家做下详细的图⽂步骤:⾸先流程是:打开⽕车头-点击上⾯的“web发布配置”--没有导⼊发布模块的先导⼊发布模块 --然后编辑,切换到内容发布参数进⾏编辑。
笔者这⾥直接抛开全局变量的设置,将全局变量值直接写到帝国cms发布模块的配置信息中:帝国CMS免登录web发布模块【获取栏⽬列表】配置:这⾥的pw⼀定要与EcmsLogin.php⽂件中的$password配置⼀致:【内容发布参数】也是⼀样要设置好pw参数:通过上⾯的操作可以解决发布的问题了。
下⾯⼩编还为⼤家附上了亲测可⽤的【】,需要的朋友可以进⾏下载体验。
总结配置帝国发布,还是注意上⾯的两点,获取分类时注意:⽂章系统id,发布⽂章时注意:发布模块中的⽤户名,⼀定要记得检查⼀下。
其他:采集下载过程中图⽚,使⽤年⽉⽇时分⼗秒命名时再加个⾃增id或者采⽤随机⽂件名命名,同⼀秒下载多张图⽚可能会出现图⽚命名重复的问题。
帝国CMS后台管理系统使用手册
帝国CMS网站后台管理系统使用手册--用户手册一、后台登陆 (2)二、个人资料修改 (2)三、新增稿件 (3)四、稿件的排序以及复制移动 (5)五、注意事项 (6)六、常见问题 (10)前言本网站后台使用的是帝国CMS7.2版本,对后台的登录背景图进行了替换,以及后台的样式进行了优化调整,与原版在功能方面并无区别,通过本说明,可以让用户了解帝国CMS后台系统的基本功能。
一、后台登陆1、在浏览器地址栏中输入后台登陆地址:xxx/e/admin2、在输入框中输入自己的用户名和密码登陆。
二、个人资料修改1、将鼠标移至顶部“”菜单,再点击二级菜单“”;2、在打开的右侧页面中输入相应的信息进行修改,如下图:三、新增稿件1、切换至相应的栏目(点击左侧待增加信息的栏目);2、点击右侧“”按钮;3、在“增加信息”页面中字段名称录入相应的信息;4、录好信息后全选信息,点击一键排版,可去掉多余的空格,换行,规范文章字体等,使页面更加美观,点击一键排版后勾选箭头所示选项。
5、信息编辑完毕,并且整理好格式后,点“提交”即可发布。
四、稿件的排序以及复制移动1、如果稿件有排序或者置顶需要,可以在后台稿件列表页操作,点击勾选文章,选择底部的推荐或者置顶或者头条按钮(置顶在排序权重上优先于推荐,推荐优先于头条),级数越高文章排序越靠前,选择完级别后点击相应按钮。
三种排序按钮在同等级下,优先权重如下图稿件排序操作示意图如下2、如果稿件在发布后需要复制到多个栏目或者移动到其他栏目,可以在右下方选择好相应的栏目,并且点击复制或者移动按钮完成操作。
3、移动过去的稿件需要点进去再次提交一次,否则直接打开会报错。
五、注意事项1、在内容管理系统后台每账号只能看到自己权限范围的目录;2、“新闻报道”类栏目的新闻如果有图片需要在首页焦点图的位置显示,需要在“新增信息”页面中的“标题图片”字段上传图片,首页才能正确获取到图片信息进行显示,网站后台默认文章中的第一张图片为标题图片。
帝国cms采集关键字方法
帝国cms采集关键字⽅法
1、系统设置——管理数据表——管理字段——增加字段
(字段名:keywords字段标识:关键词字段类型:字符型0-255字节长度:70存放表:主表前台内容显⽰:钩选"将回车替换成换⾏符")
2、系统设置——管理数据表——管理系统模型——修改——关键词
(钩选:录⼊项+投稿项+必填项+可增加+可修改+采集项+内容模板+搜索项)
(录⼊表单模板在适当处插⼊<tr><td width='16%' height=25 bgcolor='ffffff'>关键词</td><td bgcolor='ffffff'>[!--keywords--]</td></tr>) (前台投稿表单模板在适当处插⼊<tr><td width='16%' height=25 bgcolor='ffffff'>关键词</td><td bgcolor='ffffff'>[!--keywords--]</td></tr>) 3、系统设置——备份/恢复数据——执⾏SQL语句
输⼊"update phome_ecms_这⾥填写您的表名 set keyboard=keywords"
4、系统设置——基本设置——系统参数设置——信息设置——相关链接依据
(选择:"标题包含与关键字相同")
5、系统设置——基本设置——数据更新中⼼
(更新"批量更新模型表单"+"批量更新相关链接")。
帝国cms教程帝国CMS是一款基于PHP语言的开源内容管理系统
帝国cms教程帝国CMS是一款基于PHP语言的开源内容管
理系统
帝国CMS是一款基于PHP语言的开源内容管理系统,经过多年的发展已经成为了国内较为成熟的CMS之一。
帝国CMS的基本教程。
1. 安装帝国CMS
首先,您需要从帝国社区官网下载最新版帝国CMS,并将其上传至您的网站根目录下。
然后打开网站,按照提示进行安装。
2. 创建栏目
安装完成后,您需要创建栏目。
点击后台管理界面上的“网站当前位置”下的“添加栏目”按钮,在弹出的界面中输入相应信息,即可创建栏目。
3. 添加文章
在创建好栏目后,您就可以在该栏目下添加文章了。
在后台管理界面中,点击“内容管理- 管理文章”,在弹出的界面中输入文章的相关信息、内容、图片等,即可成功添加文章。
4. 优化SEO
为了提高网站的访问量和排名,您需要对网站进行SEO优化。
主要包括关键词选择、层级结构优化、内部链接优化、网站地图生成、图片优化等一系列操作。
5. 定制主题
如果您想要提升网站的用户体验和美观,可以选择定制主题或购买别人制作的主题。
您可以在帝国社区下载主题,在安装主题前,您
需要将主题文件夹复制到“dedecms”文件夹下的“templets”文件夹中,然后在后台管理界面中选择“系统设置- 站点基本参数设置”,在主题一栏选择您所需要的主题即可。
总之,帝国CMS是一个功能强大的内容管理系统,您可以利用它构建属于自己的网站。
在使用您需要确保网站的安全性,时刻关注最新漏洞信息,保持软件版本和系统的更新和维护,以免被黑客攻击。
帝国CMS列表页调用文章tag两种方法
列表页调用tag的方法有两种,一种是切割副表的infotags字段,第二种种是从phome_enewstagsdata表中提取。
如果采用tagid或tag静态化,则推荐使用第二种方法,效率更高。
如果采用tagname的动态链接方式,可以采用第一种方法。
第一种方法:切割infotags字段/* 列表页显示tag 开始*/$fr=$empire->fetch1("select infotags from{$dbtbpre}ecms_".$class_r[$r['classid']]['tbname']."_data_{$r[stb]} where id='$r[id]'");$tagstr='';$infotags_r=explode(',',$fr['infotags']);$tagscount=count($infotags_r);for($i=0;$i<$tagscount;$i++){$tagname=$infotags_r[$i];if(empty($tagname)){continue;}//tagname的动态或伪静态时的链接,采用以下2行代码/*$tu=eReturnRewriteTagsUrl(0,$tagname);$tagslink=$tu['pageurl'];*///tagid式的动态链接,采用以下6行代码$tt=$empire->fetch1("select * from {$dbtbpre}enewstags where tagname='".$tagname."' limit 1"); if(!$tt['tagid']){continue;}else{$tagslink=$public_r['newsurl'].'e/tags/?tagid='.$tagid;;}//采用东坡网静态化插件时的tag链接,采用以下6行代码/*$tt=$empire->fetch1("select * from {$dbtbpre}enewstags where tagname='".$tagname."' limit 1"); if(!$tt['tagid']){continue;}else{$tagslink=user_HtmlTagLink($tt['tagid']);}*///返回单独一个tag的代码$tagstr.='<a title="'.$tagname.'" target="_blank" href="'.$tagslink.'">'.$tagname.'</a>';}/*结束*/$listtemp='其它代码'.$tagstr.'其它代码';第二种方法:从phome_enewstagsdata表中提取/* 列表页显示tag 开始*/$tagstr='';$tsql=$empire->query("select tagid from {$dbtbpre}enewstagsdata where id='$r[id]' and classid='$r[classid]' ");while($tr=$empire->fetch($tsql)){$tt=$empire->fetch1("select * from {$dbtbpre}enewstags where tagid=".$tr['tagid']." limit 1"); if(!$tt['tagid']){continue;}else{//tagname的动态或伪静态时的链接,采用以下1行代码//$tagslink=eReturnRewriteTagsUrl(0,$tt['tagname'],1);//tagid式的动态链接,采用以下1行代码$tagslink=$public_r['newsurl'].'e/tags/?tagid='.$tt['tagid'];//采用东坡网静态化插件时的tag链接,采用以下1行代码//$tagslink=user_HtmlTagLink($tt['tagid']);}$tagstr.='<a title="'.$tagname.'" target="_blank" href="'.$tagslink.'">'.$tt['tagname'].'</a>';}/*结束*/$listtemp='其它代码'.$tagstr.'其它代码';说明:1、代码中的tag链接都有3种方式,可以根据实际情况进行选择。
帝国cms采集图文教程(下)(2)
前两讲我们分别介绍了帝国cms采集基本流程和帝国cms如何采集内容分页,最后这一讲主要介绍帝国cms采集过滤与替换,还有些技巧。
一、过滤1、帝国cms采集过滤分为两种:(1)“整体页面过滤正则”:(2)“过滤广告正则”:我们有些疑惑,这两种过滤到底有什么区别?“整体页面过滤正则”是过滤整个网页的html 代码。
“过滤广告正则”是过滤文章内容,仅对文章内容([!--newstext--])起作用。
2、过滤实例:过滤实例(1):我们采集后发现信息内容底部多了行代码:“<div style="clear:both;height:0;visibility:hiddden;overflow:hidden;">&bnsp;</div>”,根据格式“广告开始[!--ad--]广告结束”得到“过滤广告正则”:过滤实例(2):要过滤链接代码怎么办,注意“过滤广告正则”右边有堆代码:鼠标先点击A,系统自动生成过滤链接代码“<a[!--ad--]>,</a>,<A[!--ad--]>,</A>”,这样就可以把采集后的内容链接过滤掉了。
同理,如果想过滤其他html代码就点击相应的标签代码。
注意事项:当内容分页包含在内容([!--newstext--])里时,要过滤掉内容分页,否则会重复出现内容分页。
二、替换1、帝国cms采集替换也分为两种:(1)“整体页面替换”:(2)“替换”:他们两种区别:“整体页面替换”是替换整个网页的html代码。
“替换”是替换文章标题和内容,仅对标题([!--title--])和([!--newstext--])起作用。
2、替换实例:我们要把内容里的“新华网”替换成“中华网”:预览下:没有问题,替换过来了。
三、图片采集(1)我们采集时会碰到信息内容可以正常采集,但是里面的图片却不显示,例子:信息内容可以正常采集,就是图片不显示出来,这是由于内容图片的路径不对,图片的路径为相对地址。
帝国cms调用相关文章若没有则调取最新文章
<!--相关文章--> [otherlink]2,'',10,42,0,0,0[/otherlink] <!--相关文章-->
<?php } else { ?>
<!--最新文章--> [ecmsinfo]0,10,42,0,3,3,0,'','newstime DESC'[/ecmsinfo] <!--最新文章-->
<?php } ?>
当然你也可以用第三方的js插件来调取相关文章,比如bd推荐等
前面我们说了帝国cms调用最新文章利用文字调用标签phomenews现在我们说下相关文章的调用如果文章有设置关键词的话可以直接用
帝国 cms调用相关文章若没有则调取最新文章
前面我们说了,现在我们说下相关文章的调用,如果文章有设置关键词的话可以直接用[!--other.link--]进行调取,现在我们来升级一下, 如果有相关文章就调相关文章,如果没有就调最新文章,优化代码如下:
帝国CMS自动采集思路分析
帝国CMS采集分析帝国CMS采集分析 (1)一、采集思路: (1)二、自动采集 (1)三、定时采集 (2)四、关键词采集 (3)一、采集思路:1.先确定你的服务器是否支持采集2.寻找响应速度快的目标网站,当然首先要看准目标网站是否防采集的3.查看源文件,写正则4.正则写好,先预览,预览正常后再采集影响采集速度:1.本身空间的质量与速度2.本身网站的数据大小,即数据库的使用情况.3.目标网站的速度及代码结构二、自动采集帝国自动采集、自动入库、自动发布、自动刷新列表、自动刷新首页的服务器端实现(不用浏览器,纯服务器调度)在帝国采集的基础上做了简单的修改,实现自动采集、发布和刷新。
必要的数据替换、整理工作也可以加进来。
只有两个文件:autocj.php和autonews.phpautonews.php文件里面的个性化代码已经删除,在使用的时候,按照代码里的说明更改一下autonews.php文件里面的配置数据就可以用了。
autocj.php有几个地方关于"Report”的调用可以忽视或者删除,因为这是一个自己定制的采集代码,所以会有些地方大家看起来不是很合适,见谅。
使用方法:1.将autonews.php放到e/admin下2.将autocj.php放到e/class下3.autonews.php加入系统任务调度至此基本可以实现自动采集。
采集整理和数据整理原来需要每天花3个小时,现在完全实现自动化了。
三、定时采集计划任务功能:定时生成,定时采集,其实很简单利用官方的计划任务我们可以轻松的制作定时采集,定时生成栏目以及内容页面其实思路很简单大家把采集地址完整的复制下来,写到程序里面比如我的网站下国内新闻的采集地址是http://localhost/e/admin/DoCj.php?enews=CjUrl&classid[]=1那么新建一个dscj_task.php文件内容如下<?php/*计划任务名称:自动采集*/if(!defined('InEmpireCMS')){exit();}echo '<IFRAME frameBorder="0" scrolling="no" src="http://localhost/e/admin/DoCj.php?enews=CjUrl&classid[]=1"style="HEIGHT:0;VISIBILITY:inherit;WIDTH:0;Z-INDEX:1"></IFRAME>';?>然后保存文件,并将dscj_task.php文件复制到帝国系统的e/tasks目录里。
帝国cms随机文章调用的写法
帝国CMS是一款功能强大的内容管理系统,能够满足用户对全球信息站内容管理的各种需求。
在使用帝国CMS时,随机文章调用是一个常见的需求,可以让全球信息站内容展示更加丰富多样。
下面我们将介绍帝国CMS随机文章调用的写法,希望能够帮助到大家。
一、使用标签调用在帝国CMS中,可以通过使用标签来实现随机文章的调用。
具体的步骤如下:1. 在模板文件中使用标签进行文章调用。
可以使用如下标签实现随机文章的调用:```{ pounds randomlist(10) as $r} {/pounds}```这段标签的意思是随机调用10篇文章进行展示。
你也可以根据实际需求调整数字。
2. 将标签嵌入到模板文件中合适的位置,然后保存文件并更新缓存。
3. 刷新网页,查看随机文章的展示效果。
二、使用PHP代码调用除了使用标签调用外,还可以通过编写PHP代码来实现随机文章的调用。
具体的步骤如下:1. 编写PHP代码。
可以使用如下代码来实现随机文章的调用:```$randArticle = $this->getModel('content')->where('status = 1 and itype = 1')->order('rand()')->limit(10)->select();```这段PHP代码的意思是从内容表中随机筛选出10篇已发布的文章进行展示。
2. 将代码嵌入到模板文件中合适的位置,然后保存文件并更新缓存。
3. 刷新网页,查看随机文章的展示效果。
三、注意事项在实现随机文章调用时,需要注意一些事项,以确保功能的正常使用:1. 确保模板文件的编写没有错误,避免影响整个全球信息站的正常访问。
2. 在调用随机文章时,要考虑到全球信息站的内容分类和展示需求,确保随机文章与全球信息站整体风格和主题相符。
3. 选择合适的位置进行随机文章的展示,避免影响全球信息站用户的阅读和浏览体验。
帝国cms调用单个文章的方法
在帝国CMS中,可以通过调用单个文章的方法来获取文章的信息。
以下是一种可能的方法:
首先,需要获取文章的信息。
可以使用帝国CMS提供的函数来获取特定文章的信息。
具体的函数名称可能因版本或设置的不同而有所变化,但通常会有类似`get_article_info()`的函数用于获取文章信息。
例如,要获取ID为10的文章,可以使用以下代码:
```php
<?php
$article = get_article_info(10);
>
```
这样,就可以将ID为10的文章信息存储到`$article`变量中。
请注意,以上代码仅为示例,实际使用时请根据帝国CMS 的文档或相关资源进行正确的调用和参数传递。
帝国CMS使用灵动标签调用新闻内容第一张图片
帝国CMS使用灵动标签调用新闻内容第一张图片最新帝国CMS使用灵动标签调用新闻内容第一张图片以下是三零网为大家整理的最新帝国CMS使用灵动标签调用新闻内容第一张图片的文章,希望大家能够喜欢!有时候我们在建站的过程当中需要调用内容页中正文的第一张图片(并不是缩略图),这样就会无从下手,但其实对不懂开发的站长是太难了,往往是会用标题图片来取代,下面分享网友们贡献出来的方法在connect.php搜索“//替换列表模板/标签模板/搜索模板”在上方增加以下代码://获取内容页第一张大图片function diy_imgFirst($r){global $empire,$dbtbpre;$fr=$empire->fetch1("select newstext from {$dbtbpre}ecms _news_data_1 where id='$r[id]'");$newstext=stripslashes($fr['newstext']);//去除反斜杠并且获取文章正文内容$pattern = "/.*src=\"([^^]*?)\".*/i"; //正则preg_match_all($pattern, $newstext, $match);if(count($match[1])>=1){//return $match[1][0];//返回第一张图片地址$diyfpic=$match[1][0];}else{$diyfpic=$r['titlepic'];}return $diyfpic;}还是修改这个文件,搜索$titleurl=sys_ReturnBqTitleLink($r);//链接在下方增加以下代码:$diyfpic=diy_imgFirst($r);还是这个文件,搜索$listtemp=str_replace('[!---titleurl--]',$titleurl,$listtemp);在下方增加以下代码:$listtemp=str_replace('[!---diyfpic--]',$diyfpic,$listtemp);后台在管理列表模板的list.var中,直接使用[!---diyfpic--] 最好把$diyfpic=$r['titlepic'];改成$diyfpic='e/data/images/notimg.gif';因为一般没有大图,就没有缩略图。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
帝国cms是我们用得比较多得PHP的建站系统,在建站过程中,如果自己没有信息源,只能靠手工不断的重复copy和粘贴,这样费时费力,于是我们就要使用帝国cms自带的采集功能来完成信息的录入。
为了深入了解帝国cms采集功能,下面我们以“新浪各地新闻”栏目为例来进行实战采集。
一、增加采集节点
1、添加节点:
2、选择要增加采集的栏目:
3、进入增加节点表单:
4、在节点名称框里起个名字,然后把要采集的新浪各地新闻列表地址copy过来:
5、下来发现好多选项,如“采集页面地址方式二,内容页地址前缀。
”先不要理他,后面再一一详解,直接拉到“信息链接区域正则”这里:
6、这里是设置采集的列表信息链接区域正则,我们点击查看新浪各地新闻列表“源文件”:
7、把源文件代码copy到Dreamweaver里,在Dreamweaver里选定要采集的信息链接区域:
8、切换到Dreamweaver代码方式,
就是信息链接区域:
9、得到信息链接区域正则:
10、得到信息页链接正则:
11、注意:如果信息页链接是相对地址,例如,那么“内容页地址前缀”要加域名:
12、现在要采集内容页的标题和内容:
13、查看新闻页“源文件”,找title标签:
14、取得标题正则:
15、这里是要采集的内容区域:
16、取得新闻内容正则:
(注意:新闻内容正则里的d_id=…*‟ 用了通配符,因为每一篇新闻的d_id值是不同的,所以可以用*来代替它,“*”可以代替任意字符。
)
17、点击提交按钮就完成了整个采集节点:
二、预览采集节点是否正确
1、提交按钮后返回管理节点:
2、点击“预览”采集,进入节点预览结果:
3、采集内容页列表
4、采集内容页页面:
三、采集
1、预览采集节点无误后,然后返回“管理节点”,点击“开始采集”链接就开始进行采集:
2、系统正在采集中:
3、采集完后显示本地临时入库的信息,这时可以对临时入库的信息进行修改或者删除:
4、修改信息页面如图:
5、对采集的信息进行审核并入库,点击“入库全部信息按钮”:
6、确定操作:
7、信息入库完毕提示:
信息入库完毕后下来点击”管理信息“:
我们可以看到刚刚采集入库的新闻信息:
最后到“数据更新”刷新首页、栏目、和内容页就可以完成网站的信息采集了。
由于帝国cms采集功能非常强大,一时半刻也说不完,下一讲将继续讲解其他功能的使用和技巧。
本文由/整理,转载请保留链接,谢谢!。