还剩30页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
SQLServer2008r2实践报告SQLServer2008r2的数据挖掘实践报告
一、SQLServer2008r2的__过程
1.1下载SQLServer2008r
2.网址为http://care.dlservi__.microsoft.com/dl/download/1/E/6/1E626796-588A-495C-917B-321093FB98EB/2052/SQLFULL_x86_CHS.exe(32位)http://care.dlservi__.microsoft.com/dl/download/1/E/6/1E626796-588A-495C-917B-321093FB98EB/2052/SQLFULL_x64_CHS.exelcid=2052ptype=pcare(64位)SQLServer2008R2序列号数据中心版PTTFM-X467G-P7RH2-3Q6CG-4DMYBDDT__-8W62X-P9JD6-8MX7M-HWK38企业版R88PF-GMCFT-KM2KR-4R7GB-43K4BGYF3T-H2V88-GRPPH-HWRJP-QRTYB标准版CXTFT-74V4Y-9D48T-2DMFW-TX7CYB68Q6-KK2R7-__WGB-6Q9KR-QHFDW__版MC46H-JQR3C-2JRHY-XYRKY-QWPVMFTM__-B2J97-PJ4QG-V84YB-MTXX8工组版XQ4CB-VK9P3-4WYYH-4HQX3-K2R6QWEB版FP4P7-YKG22-WGRVK-MKGMX-V9MTM本次实验中装的为企业版,cpu字长为32位
1.2__
(1)解压缩后__setup.exe后开始__,出现下面的界面
(2)选择右边的第一个,全新__或向现有的__添加功能检查成功后会出现下面的页面此时只需添上面给出的序列号就行,这次试验装的是企业版,所以选了如图所示的序列号
(3)接下来会出现这个界面,问你是否接受许可条款选择接受后点下一步
(4)__支持文件,____即可等待__
(5)__支持文件完成后会__支持规则,它是确定您在__SQLServer__程序支持文件时可能发生的问题必须更正所有失败,__程序才能继续如下图,下图显示全部通过,若出现问题,则需根据实际问题进行更改
(6)设置角色,选SQLServer功能__,点下一步
(7)功能选择选择你要使用的功能,在这里我点了全选然后进入下一步
(8)__规则没有错误则进行下一步
(9)实例配置这不基本不用更改什么东西,除非你对数据库很熟练并且有更高的要求
(10)磁盘空间要求选择你要__的磁盘即可本次试验中选择了D盘然后进入下一步
(11)服务器配置这里需要注意一下账号名的选择,起初账户名为空,进入不到下一步,选择账户名后就行了
(12)数据库引擎配置这里最好是选混合模式,为以后编程方便,否则会出现很多问题,设置混合模式后可以用两种身份登录,一种是windows身份验证模式,一种是server身份验证模式,指定__即可(__有要求)然后选添加当前用户即可然后进入下一步
(13)__配置规则这里遇到问题,可能是原来__过sqlserver2008,卸载时没卸载干净可进行以下步骤进行清除,清除后页面有重新检测按钮,__即可若还是清除不了,则建议重装系统i)卸载--删除C:\ProgramFiles\MicrosoftSQLServer这整个文件夹,--regedit打开注册表--删除[HKEY_LOCAL___CHINE\SOFTWARE\Microsoft\MicrosoftSQLServer]主键--删除[HKEY_CURRENT_USER\Software\Microsoft\MicrosoftSQLServer]主键--windows服务如果还在,还需要删除服务.--HKEY_LOCAL___CHINE\SYSTEM\CurrentControlSet\Servi__s直接删除相关的键值便可--重新启动计算机ii)如果机器上装有VS的话,要把VS自带的SQL**EXPRESS卸载;同时删除XML4和MSXML6,到控制面板/添加删除程序iii)关闭所有杀毒软件,尽量关闭防火墙
(14)__完成,关闭即可
二、数据挖掘
2.1相关知识介绍这次实验用SQLServer2008r2进行数据挖掘在进行实验之前先了解下相关的术语i)OLAP(online____yticalpro__ssing)联机分析处理它表示为了分析活动而设计和优化的数据结构ii)MicrosoftBI解决方案的核心组件aSSAS(SQLServer____ysisServi__)它为数据仓库提供了存储和查询OLAP__数据集数据的机制还提供了精密的OLAP__数据集__人员和管理人员界面bBIDS(BusinessIn____igen__DevelopmentStudio)SSAS的__界面它是在Visualstudio环境中打开的__SSAS__数据集并不需要__完整的VisualStudio环境如果__机上没有visualstudio环境,那么__SSAS时,BIDS会将其作为__组件__如果__机上有VisualStudio环境,那么BIDS会作为现有VisualStudio实例的组件__(注意如果要在使用SSAS的计算机上运行完整版的VisualStudio2008,则必须__visualstudio2008的Servi__Pack1)下面开始我们的实验,此次实验此次实验用了两个数据集一个是northwind,一个是癌症信息第一个是很多书的测试数据集,从网上可以下载第二个也是书上的范例,可从http//___.w__ookshow.com下载
2.2实验步骤及内容
2.
2.1聚类分析首先将数据集导入到SQLServer2008数据库中,SQLserver2008中配有专门的导入数据工具__后进入如下界面__下一步会进入以下页面这是选择要导入的数据源,数据源那有很多格式,本实验就这两种数据格式进行展示;i)若实验数据存储形式为xsl(癌症),则选择MicrosoftEx__l,截图如下接下来的执行为ii)Northwind本身为sql数据,只需打开执行即可,执行前先建立一个Northwind的数据库到此数据导入完毕,下面进行数据挖掘在____ysisServi__s中__数据挖掘解决方案时,应首先创建____ysisServi__s项目在该项目中,定义将用于分析的数据源,然后建立包括处理数据所使用的算法和自定义指令的模型您还可以继续在该项目中测试和完善模型对解决方案感到满意之后,可以将它部署到其他服务器或者在应用程序中使用它,以便提供预测和分析具体步骤如下
(1)创建____ysisServi__s项目__数据挖掘解决方案时,先使用BIDS创建____ysisServi__s项目每个数据挖掘项目都包含以下4种对象数据源;基于数据源的数据源视图;定义如何在模型中使用数据的挖掘结构;以及创建和存储模式的挖掘模型
(2)添加数据源在数据源上__右键,建立新的数据源会出现如下界面__下一步,进入如下界面点新建按钮,新建一个数据连接确定后进入下面的界面(注意要选第二个)__下一步后进入下面的界面
(3)建立数据源视图主要目的是当有多个表时可直观的看到各表之间的__步骤截图如下结果如下
(4)创建挖掘结构__右键选择新建挖掘结构会出现下面的画面我的实验是用癌症的数据库来做聚类分析,所以挖掘技术选聚类分析接下来选择要挖掘的数据源下面开始进入指定表类型本次分析模型的建立是使用癌症表因此,我们在表癌症建模数据集的后面勾选事例选项而嵌套选项的意义是,若表间存在关联性,即要利用索引键或主键等使窗体相互连接,则可在主表后勾选【事例】,而在附表后勾选【嵌套】,使两张窗体字段可以同时进入模型本实例只分析一张表,只勾选事例即可如下图下一步进入指定定型数据在这个步骤中,我们要指定本次分析模型建立所需要的依变量Y以及自变量X下图显示,每个列个属性有键,输入,可预测这三种情况,根据你要分析的情况选择键该列用作行的唯一标识符输入此设置表示将列作为模型的源数据可预测此设置表示此列仅作为模型的输出当选择键和可预测后,可__建议来选择输入如图所示__下一步后进入指定数据行的内容和数据类型对话框在这个步骤下确认数据属性是否正确无误i)数据类型是一种数据挖掘类型的匹配,可能的值有Text、Long、Boolean、Double、Date在创建数据挖掘结构的时候会自动检测并分配数据类型ii)内容类型是数据的附加属性,挖掘模型算法通过它来理解数据的行为可能的值有Continuous(连续型变量)、Cyclical(循环型变量)、Discrete(离散型变量)、Discretized(由连续型经过切割而成的离散型变量)、Ordered(顺序型变量)注意先确定数据类型,然后在模型中确定合适的内容类型接下来进入创建测试集,【测试数据百分比】是指定位测试集保留的事例百分比,【测试数据集中的最大事例数】限制测试集中的事例总数最后一步进入完成向导在挖掘结构名称输入挖掘结构的名称和挖掘模型的名称
(5)处理模型建立完成最后要执行模型的处理鼠标右键__挖掘结构的模型,__处理处理模型后,程序会询问是否建立和部署项目点【是】进入处理挖掘结构癌症如下图点选【运行】后如下图若处理成功界面如下BIDS挖掘结构设计器的下共有5个选项卡在对癌症进行聚类分析后内容分别为i)挖掘结构ii)挖掘模型iii)挖掘模型查看器下面又四个选项卡分别为a分类关系图展现各分类间的关联性的强弱最左边有个滑动条,越往上,链接越多,最下面就是关联性最强b分类剖面图__每个变量的分类,会出现相应的挖掘图例如下图c分类特征主要呈现每一类的特征如下图d分类对比主要呈现出两分类间特征的比较
2.
2.2关联规则下面简单再演示一下关联规则的过程这次对northwind数据库进行挖掘前面的步骤都一样,下面只展现一下结果在指定表类型时选取Customers表为事例,挖掘模型结构如下CustomerID为键,contactTitle为预测列,其他为输入挖掘模型查看器中的内容为a规则查看Apriori算法中生成的关联规则用户可通过此查看器了解关联规则内容b项集可了解各个对象的内容、支持度、项集大小c依赖关系网络关联规则的依赖网络呈现出产品之间的相关性,用户可以通过单击,并通过图形颜色了解产品之间的相关性当单击的产品对外连接越多蓝__块,则代表此项商品或能促销其它商品
三、总结这次实验我学会了利用SQLServer2008r2进行数据挖掘,并用真实数据进行了试验,看到了各种挖掘算法得出的结果,更深的理解了数据挖掘及其算法的应用期间遇到了一些问题,但通过查阅资料得到了解决积累了很多宝贵的经验。