近年来，在线课程凭借便捷的网络变得越来越流行。

为了有更好的用户体验，在线课程平台想要给用户推荐他们所感兴趣的课程，以便增大点击率和用户黏性。

由Kaizong Ye，Kung Fu撰写

解决方案

任务/目标

× Transformer模型中的自注意力机制通过计算输入序列中不同位置间的相互依赖关系，提高了模型对序列数据的处理能力。在预测课程平台学生数据时，Transformer Self-Attention机制具有以下优势：并行化优势：自注意力机制的计算过程可以并行化，大大提高了模型的训练速度（参考文章3）。长距离依赖捕捉：与循环神经网络（RNN）相比，Transformer能够更有效地捕捉输入序列中的长距离依赖关系，这对于理解学生的学习轨迹和模式至关重要。在数据处理阶段，Transformer Self-Attention机制被用于提取学生行为数据中的关键特征，如学习时长、互动频率、答题准确率等，为后续的预测模型提供高质量的输入。

根据学生所选的历史课程，预测出学生接下来可能选择的课程。

数据源准备

数据说明：
stu_id：学员证。
时间：学生首次报名相应课程的时间。
course_index：课程 ID。
名称：课程名称。
类型：课程的类型。
type_id：类型 id。

本文分析的数据、代码、报告分享至会员群

加入会员群

作者

Kung Fu
✉ 联系我们

最受欢迎的见解

1.R语言实现CNN（卷积神经网络）模型进行回归

2.r语言实现拟合神经网络预测和结果可视化

3.python用遗传算法-神经网络-模糊逻辑控制算法对乐透分析

4.R语言结合新冠疫情COVID-19股票价格预测：ARIMA，KNN和神经网络时间序列分析

5.Python TensorFlow循环神经网络RNN-LSTM神经网络预测股票市场价格时间序列和MSE评估准确性

6.Matlab用深度学习长短期记忆（LSTM）神经网络对文本数据进行分类

7.用于NLP的seq2seq模型实例用Keras实现神经机器翻译

8.R语言用FNN-LSTM假近邻长短期记忆人工神经网络模型进行时间序列深度学习预测

9.Python用RNN循环神经网络：LSTM长期记忆、GRU门循环单元、回归和ARIMA对COVID-19新冠疫情新增人数时间序列预测

构造

这个是我所用到的数据集。在所给的数据特征中，我们需要用到的是学生的ID和课程的ID，每个学生所选的课已经按照时间顺序排列好了。

视频

R语言bnlearn包：贝叶斯网络的构造及参数学习的原理和实例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

视频

贝叶斯推断线性回归与R语言预测工人工资数据

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

视频

LSTM神经网络架构和原理及其在Python中的预测应用

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

df = pd.read_csv("data.csv", encoding="gbk")

用户选择的课程的分布

用户选择的类型的分布

划分训练集和测试集和评价指标

我们是这样划分训练集和测试集的，把每个学生选的最后一门课作为测试集，剩下的课程作为训练集。Hit rate@10（推荐10门课程的命中率）和NDCG@10（推荐10门课程的归一化折损累计增益）是我们对模型的评价指标。Hit rate是指训练集是否在推荐的10门课程里，NDCG则是更关注推荐的课程在10门课程当中的具体位置，越是靠前，NDCG越大。

建模

非个性化推荐模型

这个模型是我们的baseline，采用非个性化的方式，也就是说，所有学生会收到一样的课程推荐，在这里，推荐的课程是基于课程的受欢迎程度，我们挑选出最受欢迎的10门课推荐给所有学生。

计算并绘制命中率与推荐课程数量的关系

用户选择的类型的分布

top_course = top_course.sort_values('choosen_times', ascending = False)top_course.head(20)

【视频讲解】LSTM神经网络模型在微博中文文本评论情感分析和股市预测应用

阅读文章 ➜

计算并绘制 NDCG 与推荐课程数量的关系

plt.ylabel("NDCG")plt.show()

随时关注您喜欢的主题

贝叶斯个性化排序推荐模型

在这个算法中，我们将任意学生所选的课进行标记，如果一个用户u在选择j课程之前选择了i课程，我们得到一个三元组<u,i,j>,说明u更喜欢i。如果对于用户u来说我们有m组这样的反馈，那么我们就可以得到m组用户u对应的训练样本。然后这个算法基于矩阵分解的方式得到用户对于不同课程的排序，选出前10名。

创建稀疏学生-课程交互矩阵

def create_matrix(data, stu_col, courses_col, ratings_col):    """    creates the sparse student-course interaction matrix     """    for col in (courses_col, stu_col, ratings_col):        data[col] = data[col].astype('category')    ratings = csr_matrix((data[ratings_col],                          (data[stu_col].cat.codes, data[courses_col].cat.codes)))    ratings.eliminate_zeros()    return ratings, data

将日期拆分为训练集和测试集

通过删除每个学生的一些交互，将学生与课程交互矩阵拆分为训练集和测试集，并假装我们从未见过它们

构造 BPR 类

贝叶斯个性化排名（BPR）来源于个性化排名，为用户提供排名项目列表的项目推荐。排名项目列表是根据用户的隐式行为计算得出的。BPR 基于矩阵分解。所选课程可以看作是正数据集，而其余课程可以是负值和缺失值的混合体。通常，课程推荐人会输出个性化分数Xin和?你我（u 是学生，我是课程）基于学生对课程的偏好，课程从预测分数中排序。课程推荐器的机器学习模型通过给出对（u、i）来提供训练数据∈∈S 作为正类标签和（U × I）中的所有其他组合∖∖S 为负数。在这里，所有负用户-课程对都替换为 0。

基于自注意力的序列推荐模型

利用transformer中的self-attention机制，将其应用到序列推荐模型中。序列推荐聚焦于根据用户t时刻的交互序列进行建模，预测用户t+1时刻的交互。

在这个项目中，我们利用神经网络，一步步按照时间往下训练，神经网络的结构如上图所示。训练过程如下图所示

在这个项目中，无论是从hit rate还是NDCG，基于自注意力序列推荐模型的表现最好。在hit rate的比较上，非个性化推荐和贝叶斯个性化排序推荐表现类似，但贝叶斯个性化排序推荐在NDCG这个指标上表现更好一点。贝叶斯个性化排序推荐的这个办法的不足之处在于它不能很好的捕捉到输入中的时间序列信息，我们做过测试，如果不选最后一门作为测试集而是在所有选过的课程中随机选择一门，贝叶斯个性化排序推荐的推荐表现会更好。而自注意力序列推荐模型就是充分利用了输入的时间序列信息，从而才会预测的更好。