R语言关联规则Apriori对抗肿瘤中药数据库知识发现研究

肿瘤是近年来严重威胁人类的健康的疾病,据统计,目前大部分种类的肿瘤都呈现不同程度的上升趋势,中国因患肿瘤而死亡的人数约占全球肿瘤死亡总人数的1/4左右,人类正面临着肿瘤防治的新挑战。

 

由Kaizong Ye,Liao Bao撰写

现代医学治疗肿瘤的手段和方式已经日臻完善,主要为手术配合放、化疗联合治疗。

但传统西医治疗在提高缓解率的同时易产生较强的毒副作用与耐药性。

作为传统医学主体的中医药与西医相结合辨证施治,在提高疗效、缓解不良反应等方面有其独特的优势。

本研究帮助客户在收集数据建立抗肿瘤中药数据库的基础上,运用数学模型探寻抗肿瘤中药性效关系及现代药理学研究,为抗肿瘤中医及中西医综合治疗的临证用药提供理论依据。

读取数据

image.png
siqi=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=1 )  
wuwei=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=2 )  
guijing=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=3 )  
duxing=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=4 )  
gongneng =read.xlsx("性效挖掘一列0616 2.xlsx",sheet=5 )

(一)频数统计

四气、五味、归经、有(无)毒、药理功能基础分析


(1)抗肿瘤中药四气、五味、归经、有无毒性、功能、药理作用→频数统计( or 数据分布)

(四气、五味、归经、有毒无毒考虑数字、直方图、饼图表示)


视频

关联规则模型、Apriori算法及R语言挖掘杂货店交易数据与交互可视化

探索见解

去bilibili观看

探索更多视频

绘制直方图

barplot(table(unlist(x[,2])))  
  tab1=table(unlist(x[,2]))  
  tab2=table(unlist(x[,2]))/sum(table(unlist(x[,2])))  
   
  res=cbind(tab1,tab2)  
  colnames(res)=c("频数","频率")
image.png
image.png
image.png

Insights_How-pharma-companies-can-better_1536x1536_800_Standard.jpg

R语言Apriori关联规则、K-means均值聚类数据挖掘中药专利复方治疗用药规律网络可视化

阅读文章


image.png
image.png

随时关注您喜欢的主题


image.png
image.png
image.png
a_df3=merge(siqi,wuwei,by="流水号" )  
a_df3=merge(a_df3,guijing,by="流水号" )

交叉表

药味和四气那两列要和功效分别做两张这种图


tab=table(a_df$功能,a_df$四气) for(i in 1:ncol(tab)){

导出为excel文件:

image.png
image.png
image.png

对经典的 Apriori 算法进行改进,编程实现双向强关联规则挖掘方法,采用此方法分析药  药性  功效之间的联系

(二)关联规则

将数据转换成事务类型

for(i in 2:ncol(a_df3))a_df3[,i]=as.factor(a_df3[,i])



rulesmodel=function(X){

  rules <- sort(rules, by="support")
  arules::inspect(head(rules, n=20))
  #查看最高置信度样本规则
  rules <- sort(rules, by="confidence")

(1)药性 功效关联性分析

1)药性关联性分析

①四气、五味  

rulesmodel(c("四气","五味"))

image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png

②四气、归经

image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png

2)药性**-** 功效关联性分析

①四气、功能

image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png

④四气、五味、归经、功能→综合分析

 用网络图表示。用表格?图片类似下图。

rulesmodel(c("四气","五味","归经"))
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png

四个比较有两个,一个是(性-味-归经-毒性),用频繁项集和圆圈图。

rulesmodel(c("四气","五味","归经","毒性"))
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png

(性-味-归经-功能)的做频繁项集和网络图,做成关系网

rulesmodel(c("四气","五味","归经","功能"))
image.png
1111.png
image.png
image.png
image.png
image.png
image.png


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds