R语言逻辑回归logistic对ST股票风险建模分类分析混淆矩阵、ROC曲线可视化
信用风险建模是金融领域的重要课题,通过建立合理的信用风险模型,可以帮助金融机构更好地评估借款人的信用状况,从而有效降低信贷风险。
信用风险建模是金融领域的重要课题,通过建立合理的信用风险模型,可以帮助金融机构更好地评估借款人的信用状况,从而有效降低信贷风险。
是什么让一个电影受欢迎? 也许是影片的总收入(影院条目和DVD sellings)。
随着互联网、5G时代到来,大数据横空出世,数据变得越来越重要,如何针对业务问题和需求 ,提取有效特征数据并对问题进行深入分析,最终得到可靠的结论是数据分析最核心的环节,只有得出正确的结论才能对症下药,提出正确的方案,为产品运营提供有力支撑;
本文以R语言为工具,帮助客户对汽车网站的口碑数据进行抓取,并基于文本数据分词技术进行数据清理和统计。
数据变得越来越重要,其核心应用“预测”也成为各个行业以及产业变革的重要力量。
离职率是企业保留人才能力的体现。分析预测职员是否有离职趋向有利于企业的人才管理,提升组织职员的心理健康,从而更有利于企业未来的发展。
本文使用R语言进行了贝叶斯模型预测电影评分,并对数据进行了可视化和分析。
这是一种拟合稀疏广义加性模型(GAM)的新方法。
科学技术的发展为各个领域都带来了深刻的变革,在生物学领域,随着计算机的应用,生物学与信息学的结合诞生了一门新的融合学科——生物信息学。
PLS,即偏最小二乘(Partial Least Squares),是一种广泛使用的回归技术,用于帮助客户分析近红外光谱数据。
众自20世纪80年代至今,随着改革开放的深入以及中国最终加入WTO,我国的对外贸易实现了跨越式的发展,中国已经成为世界第一大出口国和第二大进口国,中国经济对世界经济做出了重大贡献。
COVID-19对航空网络的拓扑结构和属性都有很大的影响,其影响的结果表现在网络鲁棒性、连通性和活动性的下降,以及疫情区域的航空网络状态的变化。
本文通过利用回归模型帮助客户对电影的票房数据(以及放映场数,观影人数)进行了研究,确定了决定电影的票房的重要因素。
作为中国古典文学的瑰宝,《红楼梦》具有极高的文学价值和丰富的主题内涵。
数据挖掘和分析的最核心也最重要的问题就是“预测”。
如何处理庞大的数据集,并对数据进行可视化展示。
在农业科学领域,对糯稻品种的研究一直备受关注。
关联规则挖掘作为数据挖掘的一个重要分支,对于发现数据之间的潜在关联和规律具有重要意义。
比较多种机器学习方法优劣性,分析二手车价格影响因素,训练模型预测二手车价格。
集成电路板等电子产品生产中,控制回焊炉各部分保持工艺要求的温度对产品质量至关重要。
本文使用Matlab编程语言中的决策树和模糊C-均值聚类算法,帮助客户对大学教师职称、学历与评分之间的关系进行深入分析。
近年来,环境污染问题已经成为全球性的关注焦点。
虽然中国股票市场日益完善,但还不完全是弱有效市场,因此中国股票市场存在比较明显的通过技术分析达到的套利机会。
追求信贷规模的扩张,往往会导致贷款逾期率的不断增加,如何在当今社会运用数据识别用户特征进行风险管控成为了银行放贷的重点依据。
PLS回归主要的客户来自于化学、药品、食品和塑料行业。
在常规的马尔可夫链模型中,我们通常感兴趣的是找到一个平衡分布。
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
KNN是一种非参数学习算法,这意味着它不会对底层数据做出任何假设。
这篇文章展示了自激励阈值自回归SETAR的使用,用于分析经常被客户研究的太阳黑子数据集。
WeChat Tencent QQ email print 由Kaizong Ye,Sherry Deng撰写
面板数据回归可以缓解省略变量偏误的问题,特别是当没有既与感兴趣的回归变量相关又与依赖变量相关的变量信息时,并且这些变量在时间或实体维度上是恒定的。
“失业”是 Covid-19 疫情的许多负面影响之一,几乎每个国家都受到了影响
传统时间序列模型允许包含过去观察到的系列信息,但不允许客户包含其他可能相关的信息。
混合模型是另一种生成模型,它将数据点的分布建模为多个单独分布的组合(”混合”)。
随机波动模型(Stochastic volatility models)经常被客户用来对股票价格随时间的变动性进行建模。
在这篇文章中,我将尝试介绍从简单的线性回归到使用神经网络构建非线性概率模型的步骤。
我们使用广义线性模型(Generalized Linear Models,简称GLM)来研究客户的非正态数据,并探索非线性关系。
众所周知,心脏疾病是目前全球最主要的死因。
在选择最佳拟合实验数据的方程时,可能需要一些经验。当我们没有文献信息时该怎么办?
点模式分析(点格局分析)是一组用于分析空间点数据的技术。
行为风险因素监测系统(BRFSS)是一项年度电话调查。
机器学习模型的表现不佳通常是由于过度拟合或欠拟合引起的,我们将重点关注客户经常遇到的过拟合情况。
Reaven和Miller(1979)研究了145名非肥胖成年人的葡萄糖耐量和胰岛素血液化学指标之间的关系。
生成对抗网络(GAN)是一种神经网络,可以生成类似于人类产生的材料,如图像、音乐、语音或文本。
尽管贝叶斯方法相对于频率主义方法的理论优势已经在其他地方进行了详细讨论,但其更广泛采用的主要障碍是“可用性”。
在这里,我们将帮助客户将 PyMC3 用于两个贝叶斯推理案例研究:抛硬币和保险索赔发生。
金融市场的股票价格时间序列分析一直以来都是投资者和研究者关注的主题之一。
随着全球经济的不断发展,污染物的排放和环境污染问题日益严重。
超市业已成为商业领域最具活力的商业业态,竞争也变得日益激烈。
自行车共享系统是新一代的传统自行车租赁,从会员,租赁到归还的整个过程已经自动化。
本文通过利用回归模型对天猫商品流行度进行了研究,确定了决定天猫商品流行度的重要因素。
本文通过利用回归模型对电影的票房(以及放映场数,观影人数)进行了研究,确定了决定电影的票房的重要因素。
Script Name: adjMatrix Input: n… The number of vertices in the graph p… Probablity two vertices are connected plot
The density of a finite mixture distribution has the form
Use the R environment to do data exploration and data preparation.
本文着眼普通高等学校在校学生人数,提出了不同种类学校的在校人数可能存在的影响关系从而探究教育现状的因素,建立分类模型,探求这几个因素间的数量关系。
证券及其它风险资产的投资首先需要解决的是两个核心问题:即预期收益与风险。
在现代组织管理中,员工的满意度对于组织的运行和绩效起着至关重要的作用。
在植物学和农业科学领域,理解影响植物生长和花朵产生的因素对于提高生产效率和优化栽培方法具有重要意义。
员工满意度对于组织绩效和竞争力具有重要影响,因此准确了解员工满意度的影响因素和有效管理成为管理者的关键任务。
判别分析(Discriminant analysis)是一种统计分析方法,旨在通过将一组对象(例如观察数据)分类到已知类别的组中,来发现不同组之间的差异。
本文用逻辑回归和lasso算法医学上的疾病的相关因素,帮助客户确定哪种模型可用于某种疾病的相关因素分析。
本文首先介绍了IMDb(互联网电影资料库) TOP250及其排名算法、评分机制利弊,帮助客户通过分析《黑暗骑士》、《肖申克的救赎》和《教父》三部影片在2008年7月至9月评分数据,分析排名变动的原因。
气候变化和空气污染对现代社会产生了越来越大的影响。
校园的温情关怀是智慧校园的一项重要内容。