供应链中断风险数据(2001-2023年)

01、数据简介

获取MD&A文本信息对MD&A文本利用Python开源“jieba”中文分词模块对 MD&A文本进行分词,为了提高文本信息挖掘的精度,整合哈工大百度等常用的停用词表(stop wordslist),对分词后的 MD&A文本进行停用词和非中文词清理,仅保留MD&A文本中有意义的有效词汇。得到了上市公司年报MD&A部分的文本语料。
构建供应链中断风险种子词集。根据供应链中断风险的定义与来源(Kleindorfe1and Saad,2005;Chopra and Sodhi,2014),[-9]本文首先找一名会计学硕博生随机选取 50份上市公司年报,进而对MD&A部分进行人工阅读以获取中文文本信息的特点,形成初步的供应链中断风险种子词集;然后再由另一名会计学博士生进行复核,由此产生20个供应链中断风险的种子词集。具体包括:“供应链”、“供应商”、“供应”、“供需”、“上游”、“下游”、“采购”、“成本”、“原材料”“价格上涨”、“减产”、“紧缺”、“囤货”、“储备”、“故障”、“经营风险”、“中断”、“停工”、“运费”、“运力”。


第三,训练模型。本文将第一步整理得到的上市公司年报 MD&A部分的文本语料输入Word2Vec 进行训练。Word2Vec 可以根据上下文词汇的语义环境将其转化成多维空间中的向量表示,进而通过向量相似度的计算获得词汇之间的语义相似性(Bengio et al.,2003)

供应链中断风险指标对于企业未来的会计业绩与市场价值具有预测能力,企业面临的供应链中断风险越高,其未来的会计业绩与市场价值越低;进一步的研究发现,在非国有企业、客户集中度越高、海外销售比重越低、以及企业所属行业竞争程度越高时,本文度量的供应链中断风险指标的上述预测能力越强;最后,当面临较高的供应链中断风险时,企业会储备更多的存货来应对。

数据名称:上市公司-供应链中断风险数据

数据年份:2001-2023年

数据整理:众鲤数据网

02、相关数据

year、stock_code、file_name、SCDRisk1、SCDRisk2、SCDRisk3。

03、数据截图

资源下载此资源仅限SVIP下载,请先
资源下载
下载价格SVIP专享
仅限SVIP下载
1
分享海报

评论0

请先

没有账号? 注册  忘记密码?

建议使用微信快速登录