1. 研究目的与意义
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。
在这个时代,作为信息消费者,如何从大量信息中找到自己感兴趣的信息是一件非常困难的事情。仅仅针对网络上的图片而言,无论是关于现实生活的写实摄影,还是反映人们抽象映射的各种插画,其数量级和纷杂性都达到了一个相当大的程度,大量无效的或者使用者不感兴趣的图片充斥在人们的视野中。
而我们的基于标签分析的图片推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现增强信息的有效性和价值。
2. 研究内容和预期目标
一、研究内容、主要功能实现:
1. 通过为图片赋予多种体现其特征的标签,量化图片之间的相似性,从而现实对相关图片的精准推荐。
2. 主要通过采用基于内容的推荐,通过信息过滤技术的延续与发展,其是建立在项目的内容信息上作出推荐的,而不需要依据用户对项目的评价意见
3. 国内外研究现状
国内,多场景Query推荐排序,在广泛应用中产生了多种研究问题,一是反馈闭环问题。搜索推荐广告中的排序模型,一般基于用户的隐式反馈 (implicit feedback)来训练: 模型上线后,推荐给用户多个item,然后用户会有点击或不点击这些item的反馈行为。这种偏向效率的训练方式,会导致排序系统展示出来的item通常具有高频的特点,很多长尾的item没有曝光的机会,马太效应严重,不利于生态的长期健康成长。二是,小场景和新场景训练数据不足。多个Query推荐场景中,很多场景属于小场景(例如频道页)、新场景(例如双11互动城活动),这些场景训练数据比较少,而排序模型参数量通常为千万级或亿级,直接用单个场景反馈数据训练,会导致过拟合问题,学习的模型效率较低。
国外,为了缓解用户-物品矩阵的数据稀疏以及冷启动问题,引入更多附加信息。比如社交信息、文本评论信息、上下文信息等。第二、为了更细粒度的抽取用户、物品的特征,引入深度学习技术。第三、在实现更精确推荐的同时,可解释性也逐渐成为研究热点。用户不仅需要精确的推荐列表,更迫切的需要给我特定推荐列表的推荐解释。第四、荐的隐私与安全问题不容忽视。一方面由于数据稀疏,我们希望获取用户的数据越多越好;相反,拿到越来越多用户的个人数据后隐私与安全问题就会显现。第五、随着用户与物品的数量急剧增加,推荐效率也被提上日程。随着移动互联的发展,用户更多的是使用移动设备,如何在大数据量面前能够实现快速模型训练与推荐,哈希技术是关键。
4. 计划与进度安排
2022年11月01日—11月25日 完成搜索文献上网查询及整理资料等论文的前期工作,并在老师的指导下撰写“开题报告”。
2022年11月26日—11月30日 提交开题报告。
2022年12月01日—12月31日 需求分析对软件项目设计规划。
5. 参考文献
[1] Convolutional Matrix Factorization for Document Context-Aware Recommendation [RecSys 2016]。
[2] Joint Deep Modeling of Users and Items Using Reviews for Recommendation [WSDM 2017]
[3] Unifying Explicit and Implicit Feedback for Rating Prediction and Ranking Recommendation Tasks [[ICTIR2019]]
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。