各公司信息科技的建设离不开三方科技公司的参与,而三方科技公司提供的开发人员能力高低不一
为提前识别高素质人员、提高后续工作效率,本文通过对现有人员基本情况、出勤情况、人员能力评分进行分析,构建相关模型,达到初选的目的。
本文对现有三方科技公司人员能力评分数据进行数据分析,提炼核心人员特征,对标签化流程、建模流程等工作流程中的分项任务进行阐述。
可下载资源
主题一
三方科技人员各维度能力评分关系
为了分析两两定量工作能力评分之间的趋势,我们将各个维度的定量变量配对,了解这些配对之间的关系。
我们有两个对应于两个不同总体评级的定量工作能力变量,并希望通过线连接成对的数据点,来查看不同定性评价的三方科技人员之间的差异。
图一
我们将在每个样本的 工作效率、工作质量和 工作态度之间制作散点图,并将来自同一工作项目、组别的样本用线连接起来。我们按评级对数据点进行了着色。我们可以看到,对于评级较高的样本,各个维度的评分较高。还要注意,优秀评级的数据与一般评级的人员工作能力大不相同。通过箭头连接同组的样本点。箭头可以帮助我们更清楚地了解随评级工作能力变化的方向。如测试工具建设组优秀人员和一般人员的差别主要在工作效率评分上。专项组优秀人员和一般人员的差别主要在工作态度评分上。
主题二
三方科技人员各维度能力评级关系
我们对评分的分布可视化。构建评分流动图,在本文中,我们选择工作能力评级为源,工作事项、组别被选为目标,各维度评分被选为值。
图二
可以看到大多数三方科技人员的工作态度和工作质量的评分是优秀,然而工作效率评分较低。三方科技人员工作效率有待提高。
工作效率优秀的三方人员中,87%工作态度优秀,75%工作质量优秀。
从总评分(定性评价)来看,数据库管理运维、基础设施管理和资产管理三方人员是评分最高的前三名。
保理信贷反洗钱、管理组、批发业务和汽金乘用车组的优秀人员比例较低,其中批发业务组的优秀人员比例最低。
随时关注您喜欢的主题
主题三
三方科技人员各维度能力聚类
为了从数据的聚类中提取更多有用的见解,根据所做的聚类来评估两个特征之间的趋势。在聚类结果上创建散点图是一种常见的做法,可以直观地验证聚类的质量和它们的决策边界。我们分析三方科技人员的工作效率、工作态度和工作质量之间的聚类趋势。
先采用系统聚类法对各指标进行聚类分析,把指标聚为一定数目的类,然后选择每一类中的代表指标作为指标,按相关系数的平方来选择代表性的指标。用系统聚类分析法进行聚类,确定类与类之间距离时,采用了最长距离法、最短距离法、类平均距离法、Ward’S法,以类平均距离法最为稳健,计算距离用计算相关系数(Pearson correlation)。
图三
我们可以看到,K-means发现了四个群组。聚类的视觉表现证实了4个聚类的结果,可以认为聚类性能比较好,聚类只有轻微的重叠,而且聚类的分配比随机的要好得多。请注意,对于所有的三方科技人员样本来说,他们的工作效率、质量和态度之间似乎都存在着线性关系。总的来说,你可以说聚类结果充分代表了不同工作评级的样本,因为第一类红色样本(最优类别)大多分布在每个维度的右上方,第四类(不合格类别)大多分布在每个维度的左下方。聚类的群组代表了实际评级之间的对应关系。
这种类型的信息对希望针对特定三方科技人员评估的公司非常有用。
例如,如果大多数UI组工作质量评分参差不齐,效率评分较高而态度评分较低,公司就可以通过提前识别高素质人员、提高后续工作效率。
可下载资源
关于作者
Kaizong Ye是拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。
本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。
非常感谢您阅读本文,如需帮助请联系我们!