请选择 进入手机版 | 继续访问电脑版
360蜘蛛磁力:徐一龙:把今日头条等同于算法推荐,是四五年前的认知了
admin 发表于:2021-8-2 15:50:45 复制链接 发表新帖
阅读数:26

  文/本日头条副总编辑 徐一龙



  一、头条=算法+热门+关注+搜索



  很少人知道,现在互联网寻人非常高效的体系——头条寻人,最初就是本日头条一个一样寻常弹窗运营动作。



  本日头条的弹窗,有部分内容是针对本地用户,给本地用户弹窗本地资讯。2015年中旬,本日头条尝试将寻人启事也做本地推送——只是这个本地更精准,取走失者周边几公里。



  最初,我们预期用这个方法帮助探求走失的儿童,没想到儿童走失的案例非常少,而且即便推送出去的,也没有一例成功。到2016年春节,就在我们夷由要不要放弃的时间,我们不测发现,偶然我们推送的一条探求走失老人的信息,居然成功了。



  我记得,这是2016年大年初二的变乱。后一鸣知道了这事儿,他说,这事有价值,当成一个长期项目做吧。



  后来的变乱很多人都知道了。一个公益项目,从2016年大年初二整装出发了。头条寻人,基于LBS技术,从探求走失老人开始,渐渐扩充到神经病患者走失、探求告急住院无名患者家属、探求台海老兵遗属、探求义士遗属,三年过去,已经找到帮助超过1万个离散家庭坠欢重拾。



  我讲这件往事是想说,把头条等同于算法,至少是四五年前的私见了。写这篇文章,就是想从传统媒体人的角度,谈谈本日头条在7年时间里,是怎样搭建一个包括“算法+热门+关注+搜索”在内的通用信息平台的。



  2015年1月,我履职本日头条副总编辑,参与内容运营的工作。在此之前,我在传统媒体工作了15年。来本日头条前,我不但不相识“算法”,对“保举”这个词也很生疏——传统媒体,是很少使用“保举”这个话术来形貌业务的。



  为什么?我的明白是,“算法”、“保举”的业务场景都是处理海量资讯。我曾经在电视台、报社、杂志社工作,生产的内容实在都很有限,一份报纸最多也就千余条消息,媒体界用“头条”、“头版”、“封面”,就可以办理现在资讯APP对准的“保举”标题。而类似本日头条仅逐日新增的内容,就有几十万篇文章,假如没有“保举”,那但是彻底乱套了。



  以是,什么是“保举”呢?我的明白是:面临海量内容时,怎样帮助用户高效地选择、消耗内容。



  来本日头条后,我这个文科生也对“算法”有了粗浅的相识,对更多内容行业观察者来说,本日头条以致遍及了“算法”这个概念:通过个性化保举技术,用户可以看到本身感爱好的内容,这后来也成为了环球范围内几乎全部内容平台的标准设置。但是,本日头条的保举策略实在并不只是“算法”。



  2012年8月上线至今,本日头条历经了7次大的版本更新,并在这个过程中,演化成一款日活过亿的国民级产品。本日头条的保举策略,早已不依赖于“算法”,而是一个席卷了“算法+热门+关注+搜索”等多种功能的通用信息平台。



  热门、关注、搜索……这些功能一连推出的背后,实在是本日头条在不断完满自身的保举策略。在我印象里,有三个比较告急的节点。



  第一次,是2015年要闻区的设立。2015年1月,头条的保举频道,已经有了要闻区,但是这个要闻走的是“加权保举”的策略,不保证每个用户都能看到。当时我刚加入公司,基于传统媒体人对巨大消息的判断,我提出了入职后的第一个产品需求:“巨大消息应该让每个用户都看到”。靠算法发迹的产品司理和工程师们,也以为这个需求很合理。由于他们也发现,每当发生巨大消息,头条的DAU就会提升,算法可以让用户看到本身喜好的内容,而巨大消息则有“穿透性”,如热刀插黄油般,可以容易穿透个性化——即便不关注科技的用户,也会关注孟晚舟密斯在加拿大的遭遇。现在,“要闻”的演进更成熟了,过细观察下现在的头条首页,会发现整个页面可以分为四个地区,第一块是搜索区,第二块是频道区,可以看到各种垂类信息,第三块是要闻区,权势巨子媒体的告急消息,第四块是个性化区,用户大概感爱好的内容。我们渴望可以或许通过如许的改进,同时满足用户对于个性化资讯和相识消息热门的需求。



  360蜘蛛磁力:徐一龙:把今日头条等同于算法推荐,是四五年前的认知了



  (图说:本日头条产品内容表示图)



  第二次是2017年微头条和问答产品的推出。我们通过这两种全新的内容文体,探索智能交际,包括:上线问答频道并推出独立产品“悟空问答”,一个为全部人服务的问答社区;上线“微头条”,让全部头条用户,特殊是寻常人通过发布短内容,与人互动、建立关系。这是头条从算法分发走向交际分发的初步尝试,我们渴望用户在头条内能建立起有用的交际关系。与此同时,内容可以通过“关注”的情势来分发,而不是仅仅依赖于算法。以是我们在产品上也做了改变,本日头条客户端第一栏(最左边)就是关注频道,用户可以在这里及时查看本身关注用户的动态。此外,用户在刷保举频道时,也可以或许随机刷到本身关注的亲戚朋侪或名士明星的动态。由于工作的关系,我在头条上关注了很多名士、作关于最新百度蜘蛛访问ip的问题者和朋侪。我会发现,“关注频道”对我吸引力越来越大了,以致能媲美“保举频道”,这就是关注分发的魅力。



  第三次是2019年初条搜索的推出。迩来,我们推出了全网搜索的功能。这是本日头条“信息创造价值”理念的延伸。用户可以通过本日头条最上面的搜索框举行搜索,查询站表里的信息。我本人也不停频仍使用头条内的搜索,坦诚说,最初效果并不太好,但迩来,它越来越能满足我搜索的需求了。而热门运营工作,也延伸到搜索去。每当发生巨大消息,运营职员也会去优化搜索效果页,让人们能看到巨大消息最告急、最新的希望。



  二、算法不制造信息茧房,而是探索爱好



  在互联网期间,人通过上网获取信息,告急有四种途径:一是流派网站,二是搜索引擎,三是交际,四是算法。



  流派网站的特点是人工编辑筛选,把全部消息列在首页,缺点是容量有限,一天顶多更新几百篇稿件,用户也不会每条都看。而像本日头条,内容池是上万万篇文章,可以或许提供的信息量要丰富得多。



  搜索是人自动获取信息,但要在海量的搜索效果中,逐个过细筛选出本身想要的,占用时间比较多。即便搜索效果也不断被优化,搜索时,“找内容”的过程仍然要占据大量时间。



  交际等于关注和订阅,由本人选择,按本身需求出发。但一个人通常是信赖什么或者喜欢什么之后,才会选择关注什么。比如我家人信赖健康养生,就关注健康养生的作者,带来的标题是难以突破认知。



  360蜘蛛磁力:徐一龙:把今日头条等同于算法推荐,是四五年前的认知了



  (图说:从互联网获取信息的方式很多,融合起来是最好的方法)



  有人说算法会造成“信息茧房”。这是对算法最大的误解。


360搜索蜘蛛池
  “信息茧房”概念,来自于哈佛大学法学院传授凯斯·桑斯坦。他在《信息乌托邦——众人怎样生产知识》一书中指出,在信息传播中,因公众自身的信息需求并非全方位的,公众只注意本身选择的东西和使本身愉悦的通讯范畴,久而久之,会将自身桎梏于像蚕茧一样寻常的“茧房”中。



  为什么我说算法不会制造“信息茧房”?



  起首,算法在保举时,除了用户现有的个人爱好,还会基于使用环境、内容热度、其他用户的爱好,来给用户保举信息。这些因素可以或许让保举内容更加丰富,避免了内容越来越窄。



  其次,算法本身还包括爱好探索。



  一样寻常人对算法的熟悉:喜欢什么,就推什么。可人生是漫长的,人的爱好不但是各种各样的,也不断变化的。比如,我是英超球队阿森纳的铁杆球迷,可迩来几年阿森纳每况愈下,着实心生疲劳;在体育内容上,迩来一年我就更关心乒乓球,尤其是“日本选手张本智和和伊藤美诚多大程度上可以寻衅中国乒乓球活动员”,就比“阿森纳能不能排名英超前四”更让我关注了。



  算法怎样做如许的爱好探索呢?探求这个标题的答案,也是我来本日头条后,想要探索的一个“新爱好”。



  在向公司的技术大拿同事讨教后,我相识到,算法最有用的本领,是辨认出你最感爱好的内容和最不感爱好的内容。在二者之间,还存在一大块“你大概感爱好的内容”,这些内容绝对不会被工程师和产品司理们放弃。毕竟上,每个人的成长也是不断地将“大概感爱好的变乱”,固化为“确定感爱好的变乱”和“确定不感爱好的变乱”的过程。



  对于算法怎样辨认人们“最不感爱好的内容”,算法保举里专门有个名词叫“协同过滤”,英文术语叫collaborative filtering。“过滤”是“保举”的反义词,也是“同一个变乱的两个方面”。算法有很强的本领,过滤掉那些你显着不感爱好,跟你一点关系都没有的东西。比如我根本不关注美妆、口红方面的内容,算法没必要保举这些内容给我。



  那么算法怎样去探索那些人们“大概感爱好的内容”呢?



  用户爱好泛化和窄化,实在是保举体系中的经典标题,学界和业界不停很器重。狱蟲性活蜘蛛百度云这个标题叫EE(Exploitation Exploration):Exploitation是使用,通过已知的比较确定的用户爱好,保举干系的内容。Exploratio是探索,除了保举给用户已知的感爱好的内容,还必要不断探索用户的其他爱好,避免保举效果刻舟求剑。



  算法寻求的是,尽大概地满足用户获取有价值信息的需求,并且让用户获取信息的价值最大化。



  360蜘蛛磁力:徐一龙:把今日头条等同于算法推荐,是四五年前的认知了



  (图说:就像开宝箱一样,算法必要通过探索来发现用户的爱好)



  我们的工程师大拿说,爱好探索在短期内会减损用户使用时长,由于用户会在信息流里刷到不那么感爱好的内容,以为信息流很乱。但是假如不做爱好探索,短期内可以提升点击率,但这个提升效果会敏捷衰减,因此从长期看收益是负向的。



  以是,爱好探索并非算法的“锦上添花”,而是“必不可少”。



  这下你可以明白,“算法就是喜欢什么就推什么”是一个多么“机动”的误解了吧。



  三、人是万物的尺度,也是算法的尺度



  当然,任何事物都不是完善的,算法也有肯定的范围性。以是,必要一些其他本领,来帮助信息更好地活动。



  在本日头条,我们在内容运营方面,告急做两个变乱:一是帮助头条获取更多优质泉源;二是确保优质内容在头条上获得合理的阅读比例。



  算法再精准,爱好探索再成功,假如内容池的内容不够优质、丰富,那保举做得再好,也不会让用户感受好。以是,从一开始,我们就非常器重优质内容。2015年,头条率先推出“千人万元计划”,对1000个优质作者,给予每个月1万元的保底补贴。本年又推出了“创作者收益计划”,渴望帮助1万位创作者月薪过万,让优质创作者获得更多收益。



  公平并非等量齐观,蜘蛛侠360度特写一篇公司调查和一篇娱乐八卦,前者付出的心血多,而流量通常低于娱乐内容,而平台这时间,就该勇于去“拉偏架”。“拉偏架”不但体现在资金扶持,也体现在流量扶持上。



  有些优质内容,它们不肯定能引起全部用户的爱好,也不能单纯从用户活动风俗来判断,无法被保举体系直接有用地衡量。这个时间就必要人参与。



  一方面,我们调整机器保举权重,比如给优质泉源的优质内容更多保举权重;另一方面,我们优化产品机制,提供双标题、双封面,帮助创作者提升保举效果。此外,我们还投入专门的人力,想办法帮助优质内容获得更好的分发和阅读体验。我们专门有一个团队就叫“作者体验”。



  举个例子。2017年10月,本日头条和《三联生存周刊》达成战略合作后,我们为《三联》量身打造了封面专题的分发方式。封面专题是《三联》的特色,一个专题通常由四到六篇文章构成。在手机信息流中,专题的阅读效果实在不如单篇文章,但是,假如这些文章被拆开、打散,作为一个专题的阅读价值就会降低。后来,我们想办法让《三联》专题在头条信息流里,同时拥有两种分发方式,既可以被单条保举,也可以以专题的方式被保举。用户把每个专题收藏起来,就可以看三联周刊的全部封面报道。最新一期的封面报道《老友记》迩来上线了,在本日头条内搜索“三联生存周刊”就能找到。



  360蜘蛛磁力:徐一龙:把今日头条等同于算法推荐,是四五年前的认知了



  (图说:三联生存周刊的封面报道,在本日头条内会打包成专题保举,也在搜索中做了优化,帮助用户快速获取。)



  我入职本日头条后,常常有媒体圈的老朋侪问我:一龙,你在头条干什么啊?头条不是都靠算法吗?



  看,这两个标题,本身就是抵牾的。假如头条都靠算法,那我在头条真的没事可做了。而毕竟是,我在头条挺忙;头条除了算法,还有很多人。



  我们始终信赖人对于优质泉源和优质内容的鉴别力。人的判断不同于机器,但同样值得被器重。技超凡蜘蛛侠两部百度云资源术更快,面临海量的信息,分发服从尤其告急;但人更准,特殊是进入含糊其词的地带,人的同理心和想象力可以或许发挥告急作用。



  无论是人还是技术,实在都只是一种本领,都是渴望最优质的信息,能又好又快地触达到必要的用户手里,让人找到信息,让信息找到人,消除用户“早知道就好了”的遗憾。



  不久前,有同事发给我一个脑科学专家的言论。大意是说,要打败保举算法,必要两个因素:1. 你必要有寻求高风致内容的需求。2. 你必要随机取样人类各个范畴的知识。



  实在,算法寻求的,和这位专家寻求的,一点也不冲突。由于,说到底,算法的目的是由人设定的,算法的内核,和优质内容、多样性并不对立。这也是本日头条不停以来积极的方向。



  而这位专家所必要的“因素”,在作为通用信息平台上的本日头条上都有。



  假如只有算法,绝不会有头条寻人;假如只有算法,本日头条也不会长期保持成长。



  “让天主的归天主,凯撒的归凯撒。”人类实在没必要打败算法。肯定要和算法分个胜负,大概是人的虚荣心和傲慢在作祟。比如在围棋范畴,我们没有必要肯定要寻求打败阿法尔狗。



  算法在服从方面确实赛过人,而人的同理心和想象力高于算法。我们应该做的是,和算法相互学习,做好分工。毕竟,参差多态,乃幸福之源。



  举报/反馈
条评论
avatar
您需要登录后才可以回帖 登录 | 立即注册
高级