头条想“刚”搜索,可能真的想多了

作者: 分类: 奇闻 发布时间: 2019-08-05 08:37

null

最擅长上头条的今日头条又把自己搞上了头条。

7 月31 日晚间,“字节跳动招聘”公众号发布了一篇题为《这里有一个打造全新搜索引擎的机会你要不要?》的推文。各大媒体的助推下,这篇推文很快被上升为了发力搜索的表态,而昨日头条官方也证实了这一说法。

很大程度上源于,头条这一篇包装成“自我介绍”的招聘释放出了多个信号。其一,头条已经将搜索定义为中台,继今日头条之后为抖音、西瓜、火山、懂车帝等多款产品提供全网搜索支持:

null

其二,头条“不经意间”秀了一下肌肉。自称“跑在NLP、推荐等技术的最前线,应用大规模机器学习等方法,同时也在研究更适合搜索的秘密武器。”更借部分员工之口曝出了诸如“项目未上线却已运作万台机器”“刚进就承担几千台机器百亿级数据后端开发”等细节。

null

看得出,经过小半年摸索后,头条搜索的底气明显更足了。而随意翻看一下各路媒体的报道,也是诸如“硬刚百度““向百度宣战”“瞄准百度铁饭碗”等提法。

不过,这条路或许并没有看上去那么简单。

我们有必要把目光拉回到三个月前,从当时闹得沸沸扬扬的“百度头条互诉”说起。4 月26 日,百度起诉今日头条并索赔9000 万元,另加30 日公开道歉。而今日头条当天便反诉百度侵权,并同样提出9000 万元赔偿要求。

有趣的是,这一天正好是世界知识产权日。

而更有趣的是双方的起诉理由。百度起诉今日头条大量窃取百度“TOP1”搜索产品的结果,而字节跳动这边则称百度在搜索中抓取了来自抖音的短视频内容被通过技术手段抹掉了水印。

双方理由看似相同,但实则不然。

TOP1 全称为“搜索结果首条直接满足搜索产品”,顾名思义,指的是在搜索结果首位,将用户所寻找的答案及介绍直接进行展示,不需要用户再点击跳转。百度表示,此功能上进行了AI 研发等人力、技术投入。

null

根据第一财经报道,百度方面向法院出事的证据显示,在今日头条搜索“1 立方厘米水等于多少升”,在首条搜索结果中通过如图的方式藏入了“抄自百度”的文字。百度表示,这是提前打好的“防伪标记”。尽管目前已无法在今日头条中复现此结果,但显然已经实锤。

null

null

而字节跳动的反诉,则绕了一圈将矛头对准了百度旗下的另一款名为“简单搜索”,称其未经授权设置了抖音专栏,用户在App 中便能直接播放短视频,违反了商业道德。

然而,细看下来却有些玩味。

一边是日活超过1 亿的国民级内容平台;另一边却是去年5 月才上线的试水产品,上次更新还要追溯到4 个月前。一个简单对比前者在App Store 评分已经多达,而后者不过2210,可谓天壤之别。

null

换言之,反诉简单搜索或许更像是一次公关回应,以期用户形成“各打五十大板”的念头。背后反映出的,则是头条面对搜索引擎的高门槛与增长目标的双重压力下的动作走形。

1

何谓“搜索的门槛”

搜索引擎可以说是最古老的互联网产品之一,也是最能满足人们对于“极客改变世界”浪漫情怀的寄托。在PC 互联网时代,搜索引擎作为连接信息的,掌握着内容分发的“总阀”。

结果如你所见,面对众多挑战者百度仍处于垄断级地位,这背后离不开两方面原因。

其一,搜索引擎极高的技术门槛。

搜索引擎不是你想做就能做。

和如今众多互联网公司以微创新的思路做产品不同,搜索引擎是不折不扣的“硬核”创新。百度诞生前,Robin 已经是搜索技术领域公认的全球TOP3 级别专家,他的“超链分析”技术专利与Google 的Pagerank 专利诞生于同一时期。

搜索的门槛有多难?简单来说,一个搜索引擎的设计,主要考察两个指标一是查全率,对于搜索内容库中所有包含了关键词的内容均返回。二是查准率,对于所有返回的结果均包含查询内容。

举个不恰当的例子,做好搜索引擎,就像你在一分钟内,在13亿人中找到你最想要的那个人一样,非常困难。

而百度在这搜索的人才储备非常雄厚,比如百度首席技术官王海峰是国际计算语言学学会(ACL)的首位华人主席,百度高级研究员赵世奇则在ACL 担任了秘书长。

百度抓住了搜索的机会后,进一步发力内容建设,也就是自己的内容生态,一个小细节,百度知道,百度贴吧,百度百科都诞生于03,05,06年,从现在的眼光来看,可以说很有建设性和远见。

换言之,百度在中文自然语言处理的做的种种积累,基本奠定了整个中文搜索引擎的基础。

而移动互联网的兴起,再度给了试图颠覆百度的新玩家希望。360、搜狗、神马,bing等玩家纷纷宣布入场但又最终纷纷折戟相当能说明问题。

提出一种尚未被百度、Google 申请专利的新技术,提供优于至少或者约等于百度、Google 们的用户体验,难度不可谓不大。

这也是众多新玩家最终只能通过产品渠道,强行植入自家产品的原因。

其二,数据的高要求。

即便是克服了专利技术的第一关,接下来还有难度更高的第二关:数据。打个比方,搜索技术的相关专利是个“人”的话,数据就是喂养其长大并最终得以提供生产力的“食物”。

一方面是数据积累,另一方面是数据样本。前者在于数量,后者看重质量。

 

但其中的悖论在于,搜索引擎必须数据“喂养”才能越用越好用,最终达到可用程度。但在冷启动期间,小数据量、良莠不齐的内容,最终呈现的初级的用户体验显然难以留住早已被成熟产品“惯坏”的用户。

此题何解?无非两种,要不然雇佣大量人工不断“调教”搜索引擎,要不然采用AI 技术不断搜索不断矫正,外加不断加码优质内容生产者。

无论哪一种,面对早已拥有海量真实用户不断“调教”产品的百度、Google 们,新玩家都是一个以数倍于前者的速度不断拉近差距的过程,这需要海量的时间与金钱成本。

可以这么说,无论是从技术实现的可能性,还是从商业的角度探讨可行性,头条这次的全网搜索并不是一桩好生意。至少,其价值并不来自搜索本身。

2

头条为何死磕搜索

看懂头条为何死磕搜索,必须从头条的处境入手。

头条崛起的这几年,看客们几乎习惯了头条的收入坐着火箭增长:2016 年的60 亿目标在当年的10 月就提前超额完成;2017 年的150 亿也是轻松愉快。

但在整体放缓的大环境下,2018 年本就首次未超预期,将将完成500 亿目标后,头条转头又提出了2019 年的1000 亿目标。

换句话说,头条在2018 年都完成得很吃力的目标,2019 年要再翻一番。

CTR 相关数据显示,去年广告大盘7.3% 的总体增幅相比2017 已经大幅下降。而进入2019 年,第一季度中国广告市场整体下滑高达11.2%,哪怕是“代表未来”的互联网媒体,广告花费也同比下滑5.6%。

null

在人口红利已经见顶的前提下,3000 亿的移动广告大盘里,头条已经拿走两成,百度更拿走了三成多,头部效应已经极其明显。

要继续保持增长,为资本讲一个好故事。要不上马新赛道,要不提升用户规模与时长。

但显然,对于头条而言后一点已经被打上了“此路不通”的标签。仰仗的算法分发的确解决了效率问题,但同时也放大了粉丝粘性不足、垂直内容缺失的问题,这使得今日头条作为内容平台的护城河难以加深加宽。

今日头条也曾尝试改变。2017 年底,张一鸣就公布了“千人百万粉计划”,即在未来1 年内,在平台上扶持1000 个拥有100 万粉丝的账号,并喊出口号“我们将从智能分发时代走向智能分发和粉丝分发相结合的”智能社交”时代。”

而在去年底的生机大会上,新任CEO 陈林如实披露,“千人百万粉计划”没有完成,超过100 万粉丝的账号只有800 个。这在头条在“垂直化”的道路上,算是阶段性失利。

但是另一边,百度App 已经开始逐步侵入今日头条的“领地”。

截止今年7 月,百度App 日活突破1.9 亿,百度智能小程序月活突破2.5 亿,另一边的头条却已经很久没有更新日活数据。

如果具体到双方对标的信息流,QuestMobile 发布的《中国移动互联网2018年度大报告》显示,百度App 已经在信息流用户规模上远超今日头条。 

null

换言之,当下的今日头条面临的困境便是:内容储备撑不起时长增长,信息流用户规模逐步被百度App 超越。

那么,通过信息流+搜索的产品组合打包,为广告主增加一个流量表现渠道,至少能在顶到天花板的广告大盘中,体现出更强的竞争力。至于搜索本身的用户体验,则并不需要放在第一位。

一个极好的例子是,上线区区数月,今日头条的搜索功能便展现出了极强的变现渴求。一个搜索页三个广告已是常规操作: 

null

搜狗有搜狗问问,360有360百科,这些内容也出现过在头条搜索里,这就很能说明问题了,头条花了这么多精力去建设内容,但在具体的搜索上,依然离不开其他搜索引擎的支撑,比如下面这张图,头条搜索抓取了搜搜问问和360问答的内容。

大家都在自建内容,但明显的是,头条的内容并没有达到“自产自足”的状态。

null

最后

显然,这背离了我们以往习惯的“新产品以优质体验沉淀用户规模再徐图变现”的常规逻辑。无论是其无视搜索引擎本身发展规律,以投机的方式试图走捷径;还是其略显急迫的商业化进度,都能看出其在谋求新的增长点时显示出的乏力。

所以,回到我们开头提到的所谓“头条宣战”,其实更多还是局限在了公关手段方面的应对。至于搜索产品本身,其实机会不大。