还剩3页未读,继续阅读
文本内容:
第九章物流大数据文本挖掘
一、填空题.数据挖掘大部分研究主要针对O.文本挖掘的数据源是其识别和检索的模式不是从形式化的数据库记录里发现,而是从中发现.在进行数据挖掘之前,先要对数据进行、及o.数据清洗是对采集到的数据做预处理,清除及o.数据挖掘是指利用有效的算法和工具挖掘出潜在的和o
二、单选题.大数据挖掘是指从大量数据中找出对人们有用的信息的整个过程,是一个()的过程A、知识挖掘B、数据挖掘C、信息挖掘D、关系挖掘.关联规则是描述数据库中隐藏在数据间的()的一种规则A、联系B、相互关系C、关联或相互关系D、包含关系.特征分析是从数据库中的一组数据中提取出关于这些数据的特征式,这些特征式表达了该数据集的()oA、典型特征B、共同特征C、区别D、总体特征.变化和偏差分析的目的是寻找观察()之间有意义的差别A、自变量与因变量B、结果与参照量C、不同变量D、不同结果.在企业危机管理及其预警中,管理者更感兴趣的是()oA、意外规则B、预警规则C、突发规则D、差异规则
三、判断题.存放在文本数据库中的数据是半结构化数据,文档中可能包含结构化字段,也可能包含大量非结构化数据().数据转换是将数据转换为易于挖掘和分析的格式进行存储().模式评估是指根据一定的评估标准从挖掘出的结果中筛选出满足条件的数据().聚类分析的目的是使得属于同一类别的数据间的相似性尽可能小,不同类别中数据间的相似性尽可能大().回归分析方法反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到一个实值预测变量的函数,发现变量或属性间的依赖关系()
四、简答题.简述利用数据挖掘进行数据分析的常用方法.简述聚类分析的定义.简述关联规则的应用场景.简述利用大数据文本挖掘技术进行物流与供应链客户关系管理的原理.简述利用大数据文本挖掘技术在物流与供应链客户偏好分析中的应用场景
五、案例分析京东一直致力于通过互联网电商建立需求侧与供给侧的精准、高效匹配,供应链管理是零售联调中的核心能力,是零售平台能力的关键体现,也是供应商与京东紧密合作的纽带更是未来京东智能化商业体布局中的核心环节目前京东在全国范围内的运营256个大型仓库,按功能可划分为RDC、FDC、大件中心仓、大件卫星仓、图书仓和城市仓等等RDC(RegionalDistributionCenter)即区域分发中心,可理解为一级仓库,向供货商采购的商品会优先送往这里,一般设置在中心城市覆盖范围大FDC(ForwardDistributionCenter)即区域运转中心,可理解为二级仓库覆盖一些中、小型城市及边远地区,通常会根据需求将商品从RDC调配过来结合人工智能、大数据等技术,京东首先从供货商那里合理采购定量的商品到RDC再根据实际需求调配到区域转运中心(FDC)然后运往离客户最近的配送站,最后由快递员将商品带到客户手中这只是京东供应链体系中一个普通的场景,但正因为有这样的体系,使得京东对用户的响应速度大大提高,用户体验大大提升京东的预测系统主要支持三大业务销量预测、单量预测和GMV预测其中销量预测主要依据销量数据进行商品补货、商品调拨;单量预测根据拆单后的量支持仓库、站点的运营管理;GMV预测主要支持销售部门计划的定制销量预测按照不同维度又可以分为RDC采购预测、FDC调拨预测、城市仓调拨预测、大建仓补货预测、全球购销量预测和图书促销预测等;单量预测又可分为库房单量预测、配送中心单量预测和配送站单量预测等(在这里“单量”并非指用户所下订单的量,而是将订单拆单后流转到仓库中的单量例如一个用户的订单中包括3件物品,其中两个大件品和一个小件品,在京东的供应链环节中可能会将其中两个大件品组成一个单投放到大件仓中,而将那个小件单独一个单投放到小件仓中,单量指的是拆单后的量);GMV预测则支持到商品粒度借助这一套预测系统,京东在很多供应链优化问题上都已经实现系统化,由系统自动给出优化建议,并与生产系统相连接,实现全流程自动化据粗略估算,1%的预测准确度的提升可以节约数倍的运营成本问题思考1在本案例中,大数据文本挖掘技术是如何应用到京东供应链的预测系统中的2你还能联想到哪些可用于供应链优化的数据?参考答案
一、填空题.结构化数据P
168.文本集合、非结构化的数据P
168.采集、预处理、存储p
169.无效数据、与目标无关的数据P
169.知识、规则p169
二、单项选择题Ap!69Cpl71Dp171Bpl71Apl71
三、判断题Vpl68Vpl69Vpl69Xpl71Vpl70
四、简答题.简述利用数据挖掘进行数据分析的常用方法P170答利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类分析、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘.简述聚类分析的定义P171答聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中数据间的相似性尽可能小.简述关联规则的应用场景P171答在客户关系管理中,通过对企业客户数据库里的大量数据进行挖掘,可以从大量的记录中发现有趣的关联关系,找出影响市场营销效果的关键因素,为产品定位、定价与定制客户群,客户寻求、细分与保持,市场营销与推销,营销风险评估和诈骗预测等决策支持提供参考依据.简述利用大数据文本挖掘技术进行物流与供应链客户关系管理的原理pl71答:客户客户的在线口碑评价与反馈等情感信息可以帮助物流与供应链企业管理者以及电子商务平台管理者及时发现客户对于当前产品及服务的负面情感,更好地对在线销售的前、中、后等各个环节中出现的问题进行危机管理,尽可能地及时消除客户在体验产品和服务时产生的不满情绪,增加客户综合体验.简述利用大数据文本挖掘技术进行物流与供应链客户偏好分析的原理P172答客户通常还没有对某种产品或服务的产生具体的购买需求,但已经形成比较鲜明的消费偏好信息那么通过大数据文本挖掘就可以根据这些偏好信息对客户进行产品或者服务的个性化推荐,激发出用户对物流与供应链产品或服务的购买欲望
五、案例分析提示1利用订单信息、商品信息、库存信息、客户地址等信息制定商品补货和调拨方案,并支持销售计划的制定和各级仓库、站点的运营管理2商品销售页面的客户评价信息,可用于分析客户对该商品的主观情感态度,从而支持相关销售计划和营销策略的制定。