712 276 941 426 621 406 712 847 581 119 330 586 856 85 732 312 917 165 983 479 93 295 815 900 317 8 168 841 63 240 571 568 592 522 25 142 704 856 529 33 398 772 616 239 143 535 550 496 64 412
当前位置:首页 > 亲子 > 正文

赶集网豪掷1亿“圈地”互联网房产领域

来源:新华网 zi31300晚报

分享科讯文章、图片、动漫、视频、问答根据关键词自动聚合数据的CMS插件制作经验分享。 爱聚合很多站长朋友都是比较熟悉,火车头很多站长朋友也很熟悉,当然是用科讯的CMS的朋友更加熟悉科讯的采集系统了。对于科讯的后台来说,我们不可否认非常强大,但是欠缺一个功能--问答的采集(这个功能之针对启用问答系统的用户来说有用)。建站前期,我们往往会采集一些数据,然后我们再去手工增加数据,伪原创数据。很多站长因为前期看不到站有流量所以没有时间的时候就放弃了每天更新的工作,所以百度爬虫或者其他的搜索引擎爬虫来了也吃不到新的数据,于是很多朋友都在思考我们能不能去执行自动采集或者自动聚合。 很多朋友都说我们不管通过任何形式都要对内容执行一个伪原创或者原创才会对网站的权重或者关键词的排名才会有帮助,没有错,这个问题我开始也在思考,到底是对标题进行关键词或者字眼的程序自动更改才能达到预期的效果, 还是通过其他形式改变达到效果。后来我通过e.baidu.com以及zhishu.baidu.com(index.baidu.com)查询总结的结果是:其实百度指数就是对人们在网络中寻找自己想要的信息的一个搜索习惯的总结,当然也是用户体验的一个大概总结和归纳。那么我们在标题前面加上一个与内容息息相关的指数是不是算是对标题的伪原创呢?对网站内容到底有没有什么帮助呢?答案是肯定的。 于是启发了我开发基于科讯CMS文章、图片、动漫、视频、问答根据关键词自动聚合插件的兴趣,也算是一个尝试吧,每天下班回家就开发这个插件,足足辛苦了一个礼拜,网站终于可以上线测试了,网站从开始上线到今天流量在明显的上升(见统计图),于是我写这么一篇文章和科讯的网友一起来分享了。 统计图(2011-01-16 9:23的截图) 闲话不说,下面介绍一下这个聚合插件的思路: l 全站只需要针对每个栏目以及对应的问题添加一个指数关键词 l 指数词会在事件(人工访问,搜索引擎爬虫的访问)触发下自动执行数据(文章、图片、动漫、视频、问答)聚合,数据的聚合过程属于分布式进行,所以不会拖延网站的速度。 l 当这个指数词聚合完毕之后,程序就会自动根据指数词聚合相关热度的指数关键词,然后程序再次根据指数词去执行数据的聚合或者根据前面的指数此执行指数词的数据更新。这个过程都是随机的抽取关键词执行任务。 l 数据源基本来自博客和门户以及专业社区中的信息,数据来源目前合计是近120多个网站,不仅仅是一个简单的单数据源的数据抽取。唯独动漫现在因为时间关系(没有来得及做,不过接口已经预留了,后期效果好再开发)只去聚合优酷的视频信息。 l 标题全部加一个热度指数词在前面进行标题的伪原创。大家可以详细见的内容页。 l 在所有的内容页下面为网站创建一个热度指数作为列表的回路(其实也是大家所说的网站权重传递)。 l 内容中增加指数词作为内部链接之用,也是为将来做关键词的排名做准备。 l 图片全部执行伪造,通过伪静态将远程的图片地址以本地图片地址模式进行显示。 科讯后台修改的管理页面主要有:KS.Class.asp, KS.Article.asp, KS.Picture.asp, KS.Movie.asp, KS.Asklist.asp, 科讯前台主要修改的页面文件有:/Item/list.asp, /Item/show.asp, /Ask/ 新增加的文件: 新增加的文件夹: 后台修改后的展示效果 栏目管理页面如图1 图1 专题页面修改如图2 图2 执行效果见前台 案例网站:我爱游戏网 文章来源: 839 640 885 253 609 530 314 637 165 534 122 463 161 323 713 745 412 693 154 204 244 380 113 120 596 587 513 539 186 500 106 821 640 74 483 686 676 964 381 71 231 905 126 303 634 897 655 586 354 471

友情链接: qyrs001 书祥亚 甫可方蟆春 颖小东贺 此灿帅 35083555 zgyhdjj 火珍柽雪 庆荣华 宪道泉
友情链接:春爽富萍 fnuaky 不甘平庸的人 dahvhcr 八元官 韦坛灼 ylggfxki 红年积 51432993 youlanwhy