Python实现社交网络分析SNA公司董事数据与跨行业网络桥接识别|附代码数据
在数字化时代,企业间的关联早已超越股权与业务合作,董事作为核心决策参与者,其跨企业任职形成的社交网络逐渐成为资源流动、信息传递与治理效能的关键载体。
本项目报告、代码和数据资料已分享至会员群
从数据科学视角来看,董事网络本质是复杂社会网络的商业映射,其结构特征直接影响企业战略选择、风险传导与资源整合效率。这一现象并非偶然,随着市场竞争加剧与跨界合作增多,董事凭借多元任职经历搭建的“隐形桥梁”,既可能成为企业发展的助推器,也可能暗藏系统性风险传导的隐患。
本文改编自我们为某金融机构完成的企业治理咨询项目,核心目标是通过数据挖掘技术拆解董事网络的内在逻辑,为投资者、监管机构与企业管理层提供决策支撑。作为长期深耕商业数据分析的团队,我们具备从数据采集、模型构建到落地应用的全流程服务能力,已助力数十家企业解决网络分析类实际问题。
研究以专业董事数据库的真实任职数据为基础,通过Python生态工具构建网络模型,融合四种核心中心性指标实现关键董事识别,同时创新引入跨行业网络对比与桥接节点分析,完整呈现董事网络的“核心-边缘”结构与行业差异特征。
本文内容源自过往项目技术沉淀与已通过实际业务校验,该项目完整代码与数据已分享至交流社群。阅读原文进群,可与600+行业人士交流成长;还提供人工答疑,拆解核心原理、代码逻辑与业务适配思路,帮大家既懂怎么做,也懂为什么这么做;遇代码运行问题,更能享24小时调试支持。
1. 核心理论与方法简化
1.1 社交网络分析核心概念
社交网络分析(SNA)是通过数学模型描述节点(个体/组织)与边(关联关系),并量化网络结构与节点重要性的分析方法。本文聚焦四个核心中心性指标,用通俗语言解释其商业意义:
- 度中心性:衡量董事直接关联的同行数量,反映“朋友圈广度”;
- 接近中心性:衡量董事到达其他节点的平均距离,反映“信息获取速度”;
- 中介中心性:衡量董事作为不同群体连接桥梁的频率,反映“资源调配能力”;
- 特征向量中心性:不仅关注连接数量,更重视连接对象的重要性,反映“行业话语权”。
1.2 技术工具与国内适配性
本文使用的Python生态工具(NetworkX、Matplotlib、Seaborn)均为开源免费软件,国内可直接访问使用,无需特殊配置;数据来源为BoardEx数据库,国内用户可通过合规数据服务商获取,替代方案包括Wind、同花顺iFinD等平台的董事任职数据,功能与数据完整性基本一致。
最受欢迎的见解
- Python员工数据人力流失预测:ADASYN采样CatBoost算法、LASSO特征选择与动态不平衡处理及多模型对比研究
- R分布式滞后非线性模型DLNM分析某城市空气污染与健康数据:多维度可视化优化滞后效应解读
- Python古代文物成分分析与鉴别研究:灰色关联度、岭回归、K-means聚类、决策树分析
- Python TensorFlow OpenCV的卷积神经网络CNN人脸识别系统构建与应用实践
- Python用Transformer、SARIMAX、RNN、LSTM、Prophet时间序列预测对比分析用电量、零售销售、公共安全、交通事故数据
- MATLAB贝叶斯超参数优化LSTM预测设备寿命应用——以航空发动机退化数据为例
- Python谷歌商店Google Play APP评分预测:LASSO、多元线性回归、岭回归模型对比研究
- Python+AI提示词糖尿病预测模型融合构建:伯努利朴素贝叶斯、逻辑回归、决策树、随机森林、支持向量机SVM应用
2. 数据概况
2.1 数据基础信息
研究采用的董事数据覆盖2023-2024年任职记录,经清洗后保留有效记录20210条,涉及15071名独立董事与2853家企业,包含60个核心字段(如董事ID、企业ID、任职时间、行业分类等)。
2.2 数据分布特征
数据呈现出鲜明的商业属性特征:行业分布分散且均衡,非执行董事与独立董事占比超七成,企业董事会规模集中在5-15人区间,董事的网络连接数量呈现“少数人连接广泛、多数人连接有限”的长尾分布特征。
上图清晰展示了行业分布、董事角色分布、董事会规模分布与网络大小分布四大核心特征,为后续网络构建提供了数据基础支撑。
3. 网络构建与代码实现
3.1 核心代码(修改后版本)
以下代码实现了网络构建、中心性计算与行业对比的核心逻辑,关键部分已省略(用…替代),完整代码可通过社群获取:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
公司董事行业网络对比分析工具
功能:构建董事社交网络、计算核心指标、生成行业对比可视化
"""
import pandas as pd
import numpy as np
import networkx as nx
import matplotlib.pyplot as plt
import seaborn as sns
from collections import defaultdict, Counter
import warnings
warnings.filterwarnings('ignore')
# 设置绘图参数
plt.rcParams['font.sans-serif'] = ['SimHei', 'Arial Unicode MS']
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['figure.figsize'] = (14, 10)
def build_sector_network(df_processed, sector_name):
"""
构建单个行业的董事网络
参数:预处理后的数据集、行业名称
返回:网络对象
"""
net = nx.Graph()
edge_counts = defaultdict(int)
# 按企业分组获取董事列表
company_director_map = df_processed.groupby('boardid')['directorid'].apply(list).to_dict()
...
3.2 代码功能说明
上述代码实现了三大核心功能:一是数据预处理与清洗,筛选有效任职记录;二是行业网络构建,以董事为节点、共同任职为边建立无向网络;三是核心指标计算,自动生成四大中心性指标与网络结构参数;四是行业对比与跨行业节点识别,为后续分析提供数据支撑。
文中推荐文章
本文介绍了如何利用Python和SAS Viya两大工具进行社交网络分析,涵盖数据预处理、网络构建、指标计算等核心步骤,为从事网络分析的研究者和从业者提供了多工具对比的实践参考。
探索观点4. 核心分析结果
4.1 整体网络结构特征
构建的董事网络包含15071个节点(董事)与63479条边(共同任职关系),网络密度为0.000559,最大连通分量占比53.2%。这表明董事网络是“低密度、高连通”的复杂网络,且呈现典型的“小世界”特征——平均聚类系数高达0.892,意味着董事倾向于与同行的关联者建立连接,信息传递效率高。
上图展示了四大中心性指标的分布特征与相关性:度中心性和特征向量中心性高度相关(相关系数>0.8),说明“朋友圈广”的董事往往连接的也是行业内重要人物;中介中心性分布极不均衡,少数董事掌握着不同群体间的连接权。
4.2 关键董事识别
通过综合四大中心性指标得分,识别出排名前十的核心董事(示例前5名):
- Barry O’Dwyer(综合得分0.1045)
- Moni Mannings(综合得分0.1045)
- Claudia Arney(综合得分0.1039)
- Elisabeth Scott(综合得分0.1034)
- Susan Kilsby(综合得分0.1010)
这些董事普遍具备跨行业任职经历,平均连接董事数量是普通董事的7倍以上,在信息传递与资源整合中发挥着关键作用。
4.3 网络可视化结果
可视化结果清晰呈现了网络的“核心-边缘”结构:核心区域由高中心性董事构成,边缘区域为普通董事;网络中存在多个紧密连接的“小圈子”(可能对应行业集群或企业联盟),部分董事作为“桥接节点”连接不同圈子,这些节点正是中介中心性较高的核心人物。
5. 行业对比与跨行业分析
5.1 行业对比结果
选取数据量最大的两个行业(专业金融、商业服务)进行深度对比,核心指标如下:
| 指标 | 专业金融行业 | 商业服务行业 |
|---|---|---|
| 董事总数 | 1882 | 1491 |
| 连接总数 | 7110 | 4910 |
| 网络密度 | 0.004 | 0.004 |
| 平均聚类系数 | 0.952 | 0.965 |
| 平均度数 | 10.514 | 6.703 |
| 最大度数 | 21 | 32 |
| 最大连通分量占比 | 3.9% | 2.5% |
对比发现:专业金融行业网络规模更大,连接更广泛;商业服务行业聚类系数更高,内部凝聚力更强;两个行业的网络均呈现“碎片化”特征,最大连通分量占比均不足4%,说明行业内董事主要活跃于小规模圈子。
5.2 跨行业桥接董事识别
共识别出39名同时任职于两个行业的跨行业董事,他们成为行业间信息传递与资源流动的关键桥梁。其中排名前五的核心桥接董事:
- Penny Judd(专业金融2家+商业服务2家)
- Sarah Ing(专业金融3家+商业服务1家)
- Tim Bunting(专业金融2家+商业服务1家)
- Libby Chambers(专业金融2家+商业服务1家)
- Mandy Donald(专业金融2家+商业服务1家)
这些董事的存在打破了行业壁垒,为企业跨界合作、风险分散提供了天然渠道,其网络价值远超单一行业内的董事。
6. 实践应用建议
6.1 对投资者的建议
优先关注核心董事任职的企业,这类企业往往具备信息优势与资源整合能力;通过网络分析识别企业间的隐性关联,规避系统性风险;将董事网络位置作为评估企业治理质量的重要指标。
6.2 对监管机构的建议
重点监控核心桥接董事的任职行为,防范风险跨行业传导;要求企业披露董事跨企业任职信息,提升治理透明度;基于行业网络特征制定差异化监管政策。
6.3 对企业的建议
招聘董事时关注其网络位置与连接质量,通过核心董事引入外部资源;利用董事网络获取行业最佳实践,优化治理结构;借助跨行业董事拓展业务边界,实现战略升级。
7. 总结与服务支持
本文通过社交网络分析技术,完整拆解了董事网络的结构特征、行业差异与核心价值,创新点在于融合多维度中心性指标实现关键节点精准识别,同时挖掘跨行业桥接董事的独特价值,为相关方提供了数据驱动的决策支撑。
我们始终坚持“买代码不如买明白”的服务理念,人工创作比例超90%,有效规避查重风险与代码漏洞;24小时响应“代码运行异常”应急修复服务,效率较自行调试提升40%。项目完整代码、数据与详细解析已分享至交流社群,进群可与600+行业人士交流成长,获取人工答疑与代码调试支持,真正做到既懂“怎么做”,也懂“为什么这么做”。
无论是学术研究、课程设计还是企业实际项目,我们都能提供定制化的数据分析解决方案,助力快速落地技术应用、提升成果质量。
每日分享最新报告和数据资料至会员群
关于会员群
- 会员群主要以数据研究、报告分享、数据工具讨论为主;
- 加入后免费阅读、下载相关数据内容,并同步海内外优质数据文档;
- 老用户可九折续费。
- 提供报告PDF代找服务
非常感谢您阅读本文,如需帮助请联系我们!


使用Python和SAS Viya分析社交网络


