首页 > 互联网 > 从“算法”窥探上帝视角下的内容运营本质

从“算法”窥探上帝视角下的内容运营本质


想了解电商直播?看我们就够了

“算法”——体会规则之美

大播会——专注电商直播自媒体

illustration by Double Team


1

前言


内容电商发展如火如荼,新概念也层出不穷。大家知道的抖音“推荐算法”、淘宝“千人千面”,以及老生常谈的“赛马机制”、“去中心化”、“平台流量池”等等。


面对新概念层出不穷的当今,有行业人士认为是“概念炒冷饭”或者“炮制概念”的行为,当然也有大把热词概念追捧者。


我在日常思考中经常告诫自己,世界上很多事物的本质都是相通的,在复杂的概念背后,是最质朴的逻辑关系。如何把概念信息做为知识工具真正运用到工作生活中成为可以一直践行的方法论,这才是一个从认到知的过程。


这些商业新潮热词的概念背后到底是什么?


我们试着分析一下“千人千面”、“赛马机制”、“去中心化”、“流量池”这些概念背后,不就是平台为了系统化管理用户与内容所制定的一套游戏规则策略吗?


2

什么是算法?


“算法”这个概念一直都很热,对于大多数互联网从业者并不陌生。当今算法分发已经是各大信息平台、社交软件、搜索引擎、浏览器的标配。


释意:

算法(Algorithm)是指解题方案的准确而完整的描述,一个算法是解决一个问题的进程,我们并不需要每次出现一个问题就发明一个解决方案。而是通过一系列解决问题的清晰指令,利用系统编程有序的解决问题。


算法代表着用系统的方法描述解决问题的策略机制。


首先要思考一个问题,无论抖音、快手、淘宝,当你站在平台运营者的角度去思考,本质上平台是不是希望越来越多的人可以在平台上活跃并产生持续价值。

那游戏规则,就会按照本质上的目的去制定。


短视频内容平台主要链接两端,一为用户端,一为内容端,用户与内容的正向交互才会产生平台价值。只有更多的优质内容与更多的优质用户交互,才会持续的为平台产生正向价值。


那在短视频平台的视角去设计“游戏规则”的时候,首先就是面对庞大的用户与内容规模,平台如何解决内容找人及如何把优质内容筛选出来的问题。


如果我们了解平台的目的,并了解平台对于内容与流量的分发策略,我们是否就可以根据自己的定位制定出运营策略呢?


因为大播老师在做抖音的内容孵化,所以最近我也研究了一些抖音的内容。下文更多以对抖音的算法内容理解做基础阐述。


文中也大量引了2019年头条官方发布的《今日头条算法原理》中的内容进行提炼总结。


3

相似度匹配算法


以抖音为例,这种算法是建立在三种基础维度设计的,是从根本上解决用户、信息、环境的匹配:


第一个维度是内容;

图文、视频、UGC小视频,每种内容有很多自己的特征,需要考虑怎样提取不同内容类型的特征做好推荐。

抖音系统的内容分析有文本分析、图片分析、视频分析几种方式,而文本分析在推荐系统中最重要的作用就是数据建模。


来自《今日头条算法原理》例


如上图,是今日头条的一个文本case,有分类、关键词、topic、实体词等文本特征,来采集分析。

文本特征对于算法推荐中有独特的价值,可以解决内容冷启动的问题(第一波流量怎么获取),并且没有文本特征,推荐引擎无法工作。


所以在新内容上传中,你所选分类、上传标题、热门话题跟随、文案关键词等,也是非常重要的。

以上不再针对语音分析与视频分析的内容做更多的赘述。


第二个维度是用户特征;

包括各种兴趣标签,职业、年龄、性别等,还有很多模型刻划出的隐式用户兴趣等。


第三个维度是环境特征;

这是移动互联网时代推荐的特点,用户随时随地移动,在工作场合、通勤、旅游等不同的场景,信息偏好有所偏移。


结合三方面的维度,算法模型会给出一个预估,即推测推荐内容在这一场景下对这一用户是否合适,进行相似度匹配。


以上也就是我们经常说的打标签。

来自《今日头条算法原理》


比如,给喜欢听【音乐】的用户,打上【音乐】标签;

给喜欢【英雄联盟】的用户,打上【英雄联盟】的标签。


那这样对有什么作用呢?

a.帮助内容推荐:将某一标签下优质内容推荐给关注这一类内容的用户;

b.生成频道内容:内容进行类目/行业划分,形成平台频道,将用户推荐到对应标签频道下。


抖音频道标签-来自飞瓜数据


淘宝直播类目标签


本质上,平台想要的目的不同,设计算法模型的变量维度也不尽相同。

那以上只解决了基础维度内容匹配。


那平台的用户也会关注那些热门、同城、时效强的优质内容的,这些内容的筛选如何解决呢?

并且基础的算法会导致推荐内容窄化。越是精准的内容,匹配到精准用户,用户的行为反馈高,但是用户探索空间会越来越小。


那便会结合「典型推荐特征」的维度变量,做算法组合


来自《今日头条算法原理》


对于推荐内容窄化的问题,协同特征维度通过用户行为分析不同用户间相似性,比如点击相似、兴趣分类相似、主题相似、兴趣词相似,甚至向量相似,从而扩展模型的探索能力。


以上,也就是我们经常所说的“千人千面”,但是这种方法是存在弊端的,就是系统会经常把陈旧的过时的内容继续推荐,这个可以统称为机器系统的弊端。


那这样的弊端如何解决呢?就要讲到第二个主流推荐算法了。


4

用户投票算法


这类算法并不会去搜集平台内容标签归类,匹配。

也不去了解用户要看什么,对什么感兴趣。


他就只做一件事,搜集用户体验,汇总用户投票,依靠投票来做推荐。

那用户的投票如何来搜集,来去做量化呢?


头条系大部分推荐产品都会采用<实时推荐训练>,用户的行为信息,按照权重被算法模型快速捕捉,比如完播>点赞>评论>转发>关注。


其实就是通过用户的正向行为,对用户兴趣标签下的内容做截断,高效的从很大的内容库中筛选比较靠谱的一小部分内容。


来自《今日头条算法原理》


召回策略架构就是系统搜集用户体验

并处理再推荐的过程


那在内容运营过程中,系统着重采集的用户行为样本数据维度,完播、点赞、评论、转发、关注,也就是我们精细化运营的重心。


来自《今日头条算法原理》


5

“去中心化”的赛马机制


现在大家日常还在讨论一个问题叫“去中心化”,那究竟什么是“去中心化”的平台?


释意:

“去中心化”是在一个分布有众多节点的系统中,每个节点都具有高度自治的特征。节点之间彼此可以自由连接,形成新的连接单元。任何一个节点都可能成为阶段性的中心,但不具备强制性的中心控制功能。


节点与节点之间的影响,会通过网络而形成非线性因果关系。这种开放式、扁平化、平等性的系统现象或结构,我们称之为去中心化。



这个释意是不是有点难理解。


那大家想想,我们目前的互联网社交网络即自然系统(或者把抖音/淘宝想想成一个社交网络平台),每个用户/内容都是网络中的节点。


当用户/内容从单一节点形成群,再形成热门事件,这样就慢慢从单一节点变成了阶段性中心。

像不像达人在平台上发布内容或者直播,通过不断的产出内容,积累粉丝,然后慢慢在一定范围内产生影响力?


去中心化不是不要中心,而是中心多元化,任何人都可以成为中心。那是不是在去中心化平台,人人都是KOC?

用户投票下,优质的内容就有更多的机会与其他用户产生链接与影响,变成了一个中心。影响力越强,产生的链接与互动就会越多,产生一个正向的机制。

像不像达人的成长过程?


这样理解了吗?

那接着补充一个概念——“赛马机制”。


“赛马机制”简单的讲就是在一个公平的环境下,通过公平的竞争,然后获得合理有效的资源。


就是给用户内容提供一个公平的环境下,通过系统的考核与评估进行分层,给到不同层级的用户内容,匹配不同层级的资源。前文中提到了如何解决内容找人以及把优质内容筛选出来的问题。


一个视频发布之后,分配到一个基础流量池,这是你获得用户投票的第一个机会。

在第一轮流量池,如果你得到的选票数量触发了系统算法的一个阀值,那么ok,你晋级了。

再给你更大的流量池,进行第二轮投票,接下来还有第三轮第四轮。

如果你每一轮投票都能晋级,那么一个热门的视频就诞生了。


说直白点,在去中心化平台的赛马机制中。你的内容火了,不是平台推荐的,而是用户投票的结果。


6

小结


总结一下什么是算法,算法就是平台为了更好的运营平台上的内容与用户,制定的一套系统策略。今天主要以抖音平台做参照,提及到目前几个比较主流的推荐算法及常常谈及的概念。


简单来讲,

相似度匹配算法,解决内容找人的问题。

用户投票算法,解决了把优质内容选出来的问题。

“去中心化的赛马机制”,解决了内容分层考核,及资源匹配的问题。


那总结上文,我们可以得到一定的内容运营思路


1.内容垂直度;

那创作者在抖音创作内容的时候,所上传内容,包括视频内容、标签、分类、标题、话题等,决定了平台给你打什么标签,把你推送给什么标签的用户。

要清晰的知道,自己所在类目频道。通过持续稳定的内容,让系统持续把你推送给同一批用户,用户更容易产生正向的投票反馈。


2.内容的冷启动;


算法告诉我们,没有文本特征,推荐引擎就无法工作,那你的内容就无法获取平台的第一波流量。

那么对于内容来讲,你的文本特征要明确,所以在新内容上传分类、标题、热门话题跟随、文案关键词等也都是精细化运营的关键。


3.运营权重;


通过算法模型建模中所需要的维度,我们可以获知,系统在判定内容时候通过怎么样的思考方式。

「召回策略架构」就是搜集用户投票反馈的模型,用算法模型按照权重算法捕捉用户的行为信息,比如完播>点赞>评论>转发>关注,并快速处理,实时进行新一刷的推荐中。


4.流量资源分配;


将大的流量池分配成小的流量分桶、分包、测试包。

新的内容发布以后,系统会识别你的文本特征,给你的内容打标,并给你推送第一批测试流量。如果得到正向的用户投票,那将继续给你更大的流量包,如此循环往复。

其中,每个阶段触发的流量阀值,与内容的承接能力非常重要。


今天不对内容层面的运营做过多的赘述,但当泡沫消退,靠红利起来的那批人不再有空间,内容才进入到成熟的阶段。用户教育已经很成熟了,他们学会了筛选真正有深度、有价值的内容/产品。

所以内容即为王道。


为什么今天要提到算法,因为在系统管理运营下的平台,要知道平台的目的,与系统判定的逻辑。从上帝视角看问题,建立平台思维,制定出正确的运营策略。


千万不要用「战术」的勤奋来掩盖「战略」的懒惰,我的身边有很多开口闭口把概念、商业模式放在嘴边的人,但是这些碎片化的信息,最终无法成为他的知识体系,并且运用在切实工作中。


今天主要以抖音的流量算法作为案例,但是每个平台的底层逻辑都是相通的。


例如:淘宝直播的算法底层也是对用户做了分层,千人千面的推荐逻辑。但是算法模型不同,因为淘宝直播毕竟属于电商平台,所以要兼顾内容与成交。


在淘宝直播的流量研究,不得不提一下我们的凌空老师。他通过研究100+直播间,捕捉直播间背书数据与流量的变化。


通过「波段理论」为流量分层定义,并且给到每个波段考核的指标。

再通过「7天螺旋」的打法,精细深耕,给到系统正向反馈,来突破流量瓶颈。


文:张小野

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/hlw/345993.html