当前位置: 首页 > 网站建设

2023年采集型网站怎么做?2023年搞采集型网站还有前途吗?

作者:admin发布时间:2023-01-23 16:22:05阅读:227

去年我做备案域名出售的项目做了一段时间,在卖备案域名的过程中,我直到后来才摸出了门道,域名的最终价值终于被挖掘出来了。但是很可惜,由于手上的资源不是很稳定,再加上今年手上可用的资源更少了,所以还是想继续拓展业务。

为什么要重新做采集站呢?这个“新”究竟体现在哪里?

之前不是没有搞过采集站,而且还是在采集的基础上经过比较不错的加工,但是可惜的是始终无法做到有不错的收录量,更谈不上权重了。此次再度选择做采集网站,是因为找到了一点技巧,这个技巧待会我会在下文详说。有了新的技巧,我很可能能够在较短时间内看到比较好的结果。

说一说我的采集站方法:

1、域名选择

域名我是使用手上掉备案的域名,我咨询了客户,他们说掉备案的域名我可以随意处置。那么掉备案的使用起来怎么样,我在上一篇文章中已经提到了,有兴趣的朋友们可以再看一看。

image.png

距离上一篇文章的发布已经过了10天了,跟我推测的一样,掉备案的域名表现相比全新备案的域名效果毫不逊色,比不备案要在蜘蛛抓取和收录上快很多。

2、程序使用

我是看到了一个使用wp程序的网站,被他简单的模板所吸引的。本来也想着使用wp或者zblog找个相似的主体做站,但是发现太麻烦了,还不如使用thinkphp快速搞一个出来。

image.png

3、采集实现

我找了两个采集源,数据可能有上百万的数据,目前刚采集到3w+的数据量。由于其中一个采集源只是展示部分的数据,我只好通过Python自动去获取全站的文章链接。后来发现,这样做比较省事,索性另一个采集源也使用同样的方法采集了。

其实使用火车头采集能够更快速采集,但是我对火车头实在太陌生了,搞了半天也弄不到,只好写了Python代码去采集。

4、优化工作

这个快速成型的站点并没有什么值得一提的优化技巧,我的分类列表也跟那个不展示全部内容的采集源一样。目前每个页面的内链都是动态随机展示的,不过并没有上下篇的设置。这其实不符合搜索引擎优化需求的,但是人家大神的网站就是这样,我们也就不要特意做处理了,虽然只是很简单的细节。

不过我还是投靠了百度,添加了站点,并且做了主动推送。昨天域名开始解析,目前,蜘蛛抓取频次还是令我比较满意的。

image.png