关于百度等搜索引擎最新相关信息(专业术语为时效性卡片模块)的抓取原理,我在前些年写的文章当中已经多次提到过,虽然已经过了很多年,但是当时提到的相关原理和操作方式,依然适用于当下。感兴趣的用户可以看下《如何出现在百度最新相关信息深入探究》。
之所以要再单独写这一篇文章,是因为随着搜索引擎算法的不断变化。新闻源是收录机制也发生了很大的改变,其中最主要的变化是在2017年3月21日新闻源取消公告(【深度解读】新闻源取消公告深度解读),新闻源的收录机制发生了改变,新闻源的收录渠道拓宽了,并且首次引入内容创作者的概念。百度在3月21日发布此公告后,本人也与次日针对这个公告做了相关的说明和解读,内容详情可以查看《绿萝网:勿过分解读百度取消新闻源机制》。当时我们就给出了详细的解读说明。
转眼间四年时间已经过去,今天有了一些空余的时间,正好来给大家做事件回顾和最新的分析。事件分析在前文当中已经做了简要回顾,就不再阐述。百度当时给出的取消新闻源公告,对今日的影响,准确来说,并非取消了新闻源,而是取消了过去的新闻源收录机制,拓宽了新闻源抓取渠道,将内容生产者的概念替换了过去的新闻源机制。也就是说取消新闻源以后,最新相关信息内展现的内容=过去新闻源收录机制拓宽+最新的内容生产者产生的内容。
如上图所示,我们通过百度搜索某个关键词,展现出来最新相关信息。通过观察我们可以看到,在最新相关信息内展现的,除了过去传统的新闻源媒体之外,还有IT之家百家号,网易号等自媒体渠道信息。
我们再通过百度资讯栏目进行搜素,也可看到除了传统的网络媒体新闻源之外,自媒体号占比非常高。其中包含腾讯企鹅号、百家号、网易号等等。这也与我们前面的分析最新的百度相关信息时效性卡片当中取消了过去的新闻源收录机制,拓宽了收录渠道。其中最大的改变就是自媒体号的占比非常高。
因此我们可以得出结论,在百度最新相关的抓取原理中,与过去的新闻源抓取机制相同,但是拓宽了新闻源抓取渠道,其中自媒体号的占比非常高。这也就要求我们在以后的工作当中,发布软文时,除了发布传统的网络媒体之外,也需要适当提升自媒体号的媒体发布数量,尤其是选择一些账号关注人数多,文章更新频率高的自媒体号发布,更容易出现在百度最新相关信息的时效性卡片当中。
(责任编辑:绿萝网)