欢迎您访问广东某某机械环保科有限公司网站,公司主营某某机械、某某设备、某某模具等产品!
全国咨询热线: 400-123-4567

新闻资讯

哈希游戏| 哈希游戏平台| 哈希游戏官方网站

haxiyouxi- haxiyouxipingtai- haxiyouxiguanfangwangzhan

哈希游戏- 哈希游戏平台- 官方网站新媒体环境下的短视频推荐模型及算法研究

作者:小编2025-04-17 13:02:36

  哈希游戏- 哈希游戏平台- 哈希游戏官方网站

哈希游戏- 哈希游戏平台- 哈希游戏官方网站新媒体环境下的短视频推荐模型及算法研究

  2013年,短视频分享应用开始进入人们的视野,不同于传统“文字+图片”的社交模式,此类应用通过手机拍摄到10秒左右的视频,并将该视频进行上传和分享。因此,本文所提及的短视频是指播放时长在5-15秒的视频。相对于微电影、播客等媒体形式来说,短视频具有生产简单化、传播即时化、内容碎片化和分享社会化的突出特点。短视频的时间特性决定了其依附性,需要依靠社交网络的媒介获得庞大的观看群体。对于各大社交网络平台和媒体来说,如何对用户进行高效准确的短视频推荐,是提高自身活跃度的一个关键因素[1]。

  短视频的产生是伴随着移动联网技术产生的新媒体,更是多种价值的融合。一方面,短视频能够极大的满足人们的精神需求。在当今娱乐碎片化的时代下,文字形式的心灵鸡汤已经不能满足人们的精神世界。人们更渴望轻松娱乐和随意的分为。网络短视频正好迎合了人们娱乐和分享的心里,通过几秒钟的视频,和朋友一起娱乐消遣。另一方面,短视频在丰富人们的生活的同时,也潜在着巨大的商业价值。由于短视频的播放时间短,内容丰富而多样的特性,能够产生较大的浏览量。因此,进行广告投放将会是短视频的一大趋势,有针对性的内容植入和广告投放会是巨大的视频营销机会。最后一点,便是短视频能够满足人们的新闻需求。网络短视频的及时性和新闻的及时性具有高度一致性,其在新闻业的应用将带领新闻业走向多元化的发展。国外的NOW THIS NEWS在2012年即推出了短视频新闻应用,为政府和多种机构提供传播支持。

  在国内来看,以人民网为例。人民网是国内主流的新闻媒体之一,其新闻业务涉及到多个领域。为了更好的服务社会,人民网于2010年构建了人民电视平台。该平台是人民网的视频品牌,官方视频新闻频道,目前已经形成以新闻类视频节目为主,同时囊括文化、娱乐、体育、生活、社会等各类综合内容的业务格局。该平台的视频以三分钟以内的小视频为主,用户在查看某个视频时,会在网页上同时得到相关视频的推荐信息。这些信息方便了用户的浏览,提高了用户体验,但同时也存在推荐效率不高,同一个视频会在一个网页被多次推荐等问题。同时,人民网还推出了微视频平台,该平台的主旨是“让用户在平台在分享原创视频,帮助用户记录生活经典微瞬间”,目前已经具有很大的用户群体。这足以说明短视频已经开始在国内的多个领域崭露头角。在短视频日益普及的情况下,如何从大量的短视频中挖掘更有效的信息,提高短视频的推荐效率和准确度,将会是一个具有巨大实用价值的研究热点。

  基于内容推荐方法的优点是:1)不需要其它用户的数据,没有冷开始[4]问题和稀疏问题。2)能为具有特殊兴趣爱好的用户进行推荐。3)能推荐新的或不是很流行的项目,没有新项目问题。4)通过列出推荐项目的内容特征,可以解释为什么推荐那些项目。5)已有比较好的技术,如关于分类学习方面的技术已相当成熟。缺点是:要求内容能容易抽取成有意义的特征,要求特征内容有良好的结构性,并且用户的口味必须能够用内容特征形式来表达,不能显式地得到其它用户的判断情况。

  还有对于目前协同过滤进行改进的,比如在:”Slope One Predictors for Online Rating-Based Collaborative Filtering”[6]中,研究人员提出Slope One这种方法。它旨在利用其它用户用户对资源的评分来预测用户对资源的评分。还有些侧重于研究社交网络,从而更好地为协同过滤得出相似的用户,研究结果也表明,朋友之间的兴趣相似度较高,社交网络可以很大程度上帮助推荐系统提升性能。

  基于以上推荐方法的研究,结合视频的特点,在普通视频推荐领域已经有很多研究成果。以YouTube为例,在论文“The YouTube video recommendation system”[7]中详细介绍了相关推荐方法在YouTube视频网站上的应用,同时取得了很好的反馈效果。但是针对短视频的推荐方法的研究还比较少。由于短视频自身的生产简单化、传播即时化、内容碎片化和分享社会化的突出特点,如果只是将应用在普通视频上的方法简单的迁移到短视频上,将必然会带来效率低下的缺陷,同时推荐效果也会大打折扣。因此,需要根据短视频的真实情况进行深入研究,探索出切实可用并且高效的短视频推荐方法。

  影响推荐系统性能的一个重要因素,就是用户模型的准确建立.用户的兴趣度模型能够反映用户的兴趣偏好,然而用户的兴趣不是一成不变的,是随着时间推移逐渐积累的,因此个性化推荐系统需要不断地更新用户的兴趣度模型。值得指出的是用户的个性化信息需求是相对稳定的、时间相对长久的信息需求,与那些随机的、临时的查询有所区别.因为它是比较稳定的需求,所以需要保存这种需求,并可以根据用户对于所推荐的信息的感兴趣程度加以修改,以便于获得更好的效果。

  首先,我们的实验数据验证方式是:将视频数据集划分为两部分(90%训练数据,10%测试数据),通过对于这两部分数据的划分,用户对于视频的浏览记录也将分为两部分。对于有些用户的数据完全在训练集里,完全在测试集里或者在测试集里数目过于少,这些用户将被过滤掉。我们的训练集模拟在特定时间点用户的过去浏览历史,我们的测试集模拟用户未来将会感兴趣的电影集。视频推荐算法通过对于训练集里用户浏览记录的学习,得到用户的Profile,再经过测试集内部全部视频相似度计算,得到推荐视频,之后我们将我们产生的推荐视频与用户在测试集里实际数据进行对比,产生结果。

  1、pre预处理。首先,因为MovieLens数据格式是他们固有格式的,我们需要把这些数据导入到Matlab中,以便于后续数据处理。我们将MovieLens的原数据三个文件ratings.dat,movies.dat,tags.dat转换为ratings.mat.movies.mat,tags.mat;接着,我们将tags和movies两张表进行联合在一起,产生movies_tags表格,因为我们的标签是绑定在movie上的;再然后,我们要从电影数据里面抽取实验组所用的实验集,我们通过Matlab的随机数函数产生1000个视频id为实验组视频id。由于视频被划分为了实验组,那么用户的评分数据也就需要将对于对应电影的评分数据纳入实验组中。其余的视频以及评分数据均为训练集。

  2、step1完成用户的profile提取。首先,不是所有的用户数据都是有用的数据。比如有些用户的浏览数据全部集中在训练集或者测试集,以及有些用户的测试集数据数目过少,这些无用用户数据要全部过滤掉;接着,在有用的用户数据里,我们需要从他们的训练集浏览记录中获取所观看电影的标签,将这些标签加入用户的标签集,并且计算这些标签的TF-IDF权值。由于这个计算量过于巨大,我们将权值计算函数进行了性能优化,加入哈希算法来提升了它的时间复杂度。图3-7为我们的权值计算流程图。