1
用户相关度
搜索引擎首先需要确保呈现结果与用户的搜索需求紧密相关,这里的相关度包括关键词在网页中出现的位置、频次(密度)。比如,企业官网包含的品牌和产品关键词最多,对于搜索引擎来讲,就是相关度最高的自然搜索结果推荐。
对于构成绝大多数自然搜索结果的资讯内容来说,关键词在正副标题、首段、正文中出现的位置、频次(合理的),对搜索引擎的相关度评判会有直接影响。在百度早期,内容与用户相关度的影响在搜索排序中的比重会占到七成。
以沃尔玛这篇新闻稿为例,核心关键词“沃尔玛”和“陈文渊”在标题和首段中分别出现六次和三次,在搜索结果中,相关度更高的网页就会优先推荐给用户。
再如,中国平安、华为、智慧城市为核心关键词,在标题和首段中的位置和频次得到保障,作为具有时效性的新闻事件,在百度网页和新闻搜索结果中推荐会更相关。
2
内容时效性
作为互联网动态更新的时效性内容源,搜索引擎会给予新闻网站以较高的权重。如果内容中带有比较明确的时间点信息(如新闻发生的具体时间),更有机会被搜索引擎作为新鲜的时效性内容抓取,再综合其它(下方)各项指标判定索引和推荐。
如果内容紧贴热点,在百度新闻和网页时效性卡片中获得展示的机会越大。 百度在 2017 年 3 月宣布取消新闻源数据库时,其公告中强调的核心根源就是因为“时效性内容识别技术”的升级。
3
内容质量
所谓内容质量,也就是内容能为用户产生的价值,近一年来非常明显的一个趋势是,百度正在网页和新闻搜索结果中过滤掉没有时效性,或被算法判定为营销内容的结果,即便是内容发布门户网站上,也不会受到靠前的搜索结果推荐。
百度站方曾接受界面采访时提到,“我们有个部门在过去半年时间内一直在调教算法,针对所有百度抓取到的网页,教机器来判断时效性和内容质量,在前端展示上,一些软文会被过滤掉,其他的不会发生太大变化”。
4
用户参与度
所谓用户参与度,是指构成用户参与的行为有阅读、点击、转评赞等互动行为,这些指标也是构成百度资讯指数的基础。用户对网页内容的参与度越高,搜索引擎认为其重要程度和受欢迎程度越高,页面则更有机会展现给用户。
一般来讲,社交类UGC内容如知乎、豆瓣等,招聘信息、分类信息、电商信息、股市行情等,通常更新频度高,点击量大,搜索结果会靠前,但基本上是非品牌公关目的的功能性作用,如招聘、销售等目的。
新闻网站发布的资讯新闻,新闻价值决定用户参与度,看的人越多,搜索结果推荐越靠前,越靠前用户点击越多,累积循环,这也解释了为什么多年前的负面新闻一直沉淀在百度首页,这就是典型的马太效应。
5
相关网页数量
除了搜索直接访问外,用户可能从其它网页链接的点击访问到内容,通过其它网页产生的关联越多,则更有利于长期的搜索长尾。对于站点来讲,内外链的数量,尤其是外部网页指向页面的锚文本数量、质量等,仍是搜索引擎判定网页价值的指标之一。
6
网页质量
网页的质量包括内容质量、浏览体验、PC和移动端的访问速度,友好程度、能否满足用户的延展需求等。除了对站点的评价之外,百度逐渐强化内容质量的识别评判,综合为内容所在落地页的评价。
尤其在百度取消新闻源数据库后,即使是门户等之前权威的新闻源站点,相同频道的不同质量的内容,获得百度新闻及网页收录的情况也明显不同,被算法综合评判为低质营销目的的软文(非时效性新闻),会被从结果中直接过滤或减少呈现。
7
关键词竞争度
关键词竞争度,是最容易被忽略和不被了解的因素,但恰恰是影响搜索结果排序最重要的隐藏方面。所谓关键词竞争度,也指关键词热度,指该关键词在百度搜索的热度和收录的相关网页、新闻数量。
举个简单例子,某关键词被用户搜索的频次越高,热度就越高,相关网页,新闻收录的数量越大,竞争度越大,也同时意味着新发布的内容,影响百度搜索结果排序的难度就越大。