QQ泡沫乐园 · 免费提供游戏辅助,破解软件,活动资讯,喜欢记得收藏哦!
综合软件_线报活动_游戏辅助_最新电影_最优质的的辅助分享平台

ks业务自助下单平台在线- ks自助下单业务,老牛卡盟业务网

网络 2022-07-06 09:13

简介:在短视频社区中,经常会不时出现很多热门视频,在短时间内获得了大量的播放和转发关注。比如不久前出现在快手上的与冬奥会主题相关的“滑雪挑战”活动等素材玩法。在快手,如何提前监控和捕捉潜在的视频和相应的素材一直是我们工作的重点。今天给大家分享一下快手中爆炸物识别的应用与实践。

全文将重点关注以下四点:

01内容素材概览1.流行素材识别背景

在快手短视频平台上,每时每刻都有大量用户参与到短视频的制作和消费中,在此期间会产生大量高颜值视频,引起病毒式传播和复制。对于平台端,需要设计一套高效可执行的解决方案,提前捕捉具有爆发潜力的素材,并通过平台的资源,包括操作手柄和Reco,及时推送流量,提供一些支持性流量来放大爆炸。段落的马太效应。

整个现场的爆炸物监测和抓捕需要解决以下问题:

2.什么是视频内容

本次主题分享的热门素材主要指以下四种:

本次提到的爆款模型,更多是针对与以上四种情况相关的所有视频的表现。比如音乐爆炸、魔术表情爆炸、模板爆炸、事件爆炸等。

--

02 流行风格的必备元素

综上所述,流行的模型具有三个非常直接的特征:播放量的快速增长、像病毒一样的复制和传播、以及高用户参与度。下面,对这三个要素进行详细介绍。

1. 播放量快速增长

与普通材料相比,具有爆炸倾向的材料对应的播放量会明显更高。

我们如何捕捉闪点?我们可以套用播放概率的公式:将当前时间t的vv(播放量)值除以过去24小时素材的总vv值,转化为0到1之间的概率,平台端通过播放概率的增加来判断是否会出现爆点。

2.像病毒一样复制和传播

图左侧是模拟的网络结构。在这个图中,蓝点表示源视频,绿点表示很多人看到源视频后制作了类似的视频,红点表示红色组人,在观看了绿色视频后,进行了二次制作。紫色圆点表示第三次生产。在一、二、三轮传播中,随着传播范围越来越广,传播范围呈指数级增长。如果一个视频能够像病毒一样复制并推动其他视频的制作,我们将其定义为热门视频。

我们如何测量命中病毒?

这里借用了通信中一个非常经典的R0系数的定义。当 R0=1 时,视频线性传播,即每单位时间有一个人观看和复制。当R0=2时,每单位时间有两个人在看复制,这是一个指数增长。因为 R0 是动态变化的,并且随时变化,所以难点在于我们如何测量 R0 (Rt)。

我们选择使用近似估计。假设在某个时间段内产生了k个新用户,我们可以使用贝叶斯公式计算当前时刻的Rt值:使用先前Rt值的概率(在没有观察到任何数据的情况下) , Rt 值本身可能是分布的),乘以 L 分布。在实践中,我们使用泊松分布来逼近L分布:给定k的值,遍历所有可能的λ值,绘制不同λ值的泊松分布,观察曲线对应纵坐标的概率值,选择对应的概率值最大 lambda 值。估计L分布的值,乘以之前的先验分布,就可以得到最终的Rt分布。

3. 高用户参与度

所谓用户参与度高,是指平台重点观察的点赞、评论、转发、搜索四个指标的高数据。

为了总结前面提到的流行风格的所有元素,我们将它们总结成流行风格特征汇总表,并以SABC等级对流行风格材料进行评分。

S级,所有核心数据指标必须表现得非常好。 A级指标略高于大盘,有的表现不错,有的表现不佳。 B基本接近大盘的一些指标。 C在各项指标上都明显低于大盘。

我们枚举完指标后,需要将这些指标汇总成各种评分,这就需要我们整合这些指标。接下来,我们将分享我们如何整合指标。

--

03 爆炸识别模型及工程框架

为了提前预测爆款,我们搭建了爆款识别框架。流行的风格识别和推荐系统非常相似。流行风格识别的逻辑是根据点赞数、评论数、关闭数、推荐数,包括播放量等指标来选择有潜力的视频素材。推荐系统以每个视频用户的浏览记录为特征,过滤相似的视频,然后将不同的视频推荐给不同的用户。因此,我们将推荐系统用于热门物品的识别。

这里是一个最简单的推荐系统的链接框架。我把它分成两部分,粗调部分和细线部分。

粗略召回部分,包括特征输入、召回方法和召回内容。

推荐系统的特征输入将分为三个部分:

①用户画像,如用户的年龄、性别、地区等

② 内容画像,如视频时长、评论数、视频观看人数等。

③交互特征。交互特征与时间序列有关。例如,在观看此视频后,用户还观看了与此视频相关的其他视频。

推荐模型的粗略召回部分会使用协同过滤、矩阵分解、兴趣召回和关联策略等许多经典方法,通过这些方法召回一些最好的视频。

对于微调部分,在我们得到召回的视频后,我们将开始微调。召回的视频按照点击、转化、停留时间等优化目标进行重新排序,得到特征数据并发送到细化排序模型。

推荐系统与热门物品识别的具体区别在于:

快手刷粉丝量软件_快手播放量_快手怎么看访客量

下面介绍我们的热门风格识别框架。

1.粗略调用部分

在粗略的通话部分,我们设计了三种速度来衡量视频受欢迎程度:

①一阶差分,即t1时刻与某素材关联的视频播放量与t2时刻的差分,

② 加速,我们参考去年推特发表的一篇论文。假设我们定义了第一个时间段,取该时间段内vv的平均值,乘以e的负i次方(i指天数),做加权平均。然后用同样的方法计算第二个较长周期的平均值,取第一个周期的vv和第二个周期的vv之差减去第二个周期的vv,定义为加速度。我们在实际实现中做了一些微调。

③ 爆炸速度,使用某个指标在某一时刻的当前值,除以过去值的总和。例如,将某个时间的vv值除以过去24小时vv之和的比值。

但是,不同速度的性能在不同情况下差别很大,不能直接使用。

上图中红色曲线是原始增长率,深紫色曲线是它的加速度,蓝色曲线是它的一阶差分值,浅紫色曲线是爆炸概率。当原始速度增加非常缓慢时(左图),爆炸概率值趋于稳定。当一段视频的vv增长非常快的时候,比如右图,加速度的深紫色线基本符合原始数据的曲线,但是有些检测点还是有轻微的滞后,无法提前检测到。一阶差分的蓝色曲线变化非常快,难以监测。浅紫色曲线可以提前捕捉到爆炸点,但是过于敏感,概率波动很大。

在实际情况下,如果只用一种速度来判断,往往会出现错误。在这种情况下,我们设计了一个模型,将这三个速度作为三个特征,让模型学习不同速度的权重比,总结出来给出最终排名,希望既先进又准确。赶上热门。

2. 改进

在细化部分,推荐系统是直接使用大模型,而流行模型不能使用大模型。有两个原因:

我们采用的方法是将大模型拆分成小模型,并引入一个中间变量。下面描述了这是如何完成的。

我们的目标是在给定 x 的情况下返回 y,其中 y 可以是命中或非命中(0、1),或 SABC(0123)。我们输入 x 是vv值、点赞的个数、评论数、xtr指标等指标。在正样本很少的情况下,引入一个中间变量z,方便我们构建一些半监督数据。图右边一栏给出了z的推导公式:给定x的值来估计z,将z的所有可能性相加,再给出x和z的值来估计z的值y.给定一个x的值来估计z的计算,我们引入了一个高斯混合分布,ø,θi是超参数,我们需要学习的是α,不同高斯分布的联合分布的权重。我们简化每个维度使用单独的高斯分布,最后给它一个简单的做权重的线性累加。

中间变量z的作用是我们可以直接将z定义为播放量的分布,将原来的单个播放量映射成一个分布实现软着陆,这样即使当前播放量 >绝对值可能不高,但有一定概率增长到高玩。

识别热门商品的整体流程如下:

将魔术表情、模板、音乐、标签等四种素材对应的所有视频特征输入到热门内容的粗略调用部分,然后通过小时返回热门素材列表级别的粗略呼叫。将列表输入细排序部分得到原始数据(包括vv值),得到所有数据然后引入z变量,计算出z值后,通过高斯GMM混合模型,使用最小二乘法学习不同的高斯模型的权重,最后单层DNN输出概率值。

--

04 案例实践与演示