还剩65页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
《数据仓库与数据挖掘》大作业院(系)名称信息技术学院专业年级10级电子商务学号101144054学生姓名张泽果目录TOC\o1-4\h\z\u第1章数据仓库和数据挖掘简介
11.1数据仓库的概念
11.2数据挖掘引论
11.
2.1数据挖掘的作用
11.
2.2数据挖掘对企业的影响
21.
2.3数据挖掘概念
31.3数据挖掘与数据仓库的关系
41.4 数据仓库与数据挖掘的区别5第2章创建数据仓库
62.1数据仓库的来源
62.2数据表的结构6第3章关联规则挖掘
83.1案例背景
83.2数据来源
93.3关联规则的应用
93.
3.1MicrosoftSQLServer2005AnalysisServices操作步骤
93.
3.2模型解释
173.4小结19第4章分类挖掘
204.1案例背景
204.2数据来源
204.3分类挖掘的应用
214.
3.1MicrosoftSQLServer2005AnalysisServices操作步骤
214.
3.2模型解释
264.4小结28第5章聚类挖掘
295.1案例背景
295.2数据来源
295.3聚类挖掘的应用
305.
3.1MicrosoftSQLServer2005AnalysisServices操作步骤
305.
3.2模型解释
325.4小结36第1章数据仓库和数据挖掘简介
1.1数据仓库的概念什么是数据仓库,目前有一下不同的看法定义1W.H.Inmon在《BuildingtheDataWarehouse》中定义数据仓库为“数据仓库是面向主题的、集成的、随时间变化的、历史的、稳定的、支持决策制定过程的数据集合”即数据仓库是在管理人员决策中的面向主题的、集成的、非易失的并且随时间而变化的数据集合定义2“DW是作为DSS基础的分析型DB,用来存放大容量的只读数据,为制定决策提供所需的信息”定义3“DW是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的即与企业定义的时间区段相关,面向主题且不可更新的数据集合”定义4数据仓库是一种来源于各种渠道的单一的、完整的、稳定的数据存储这种数据存储提供给可以允许最终用户的可以是一种他们能够在其业务范畴中理解并使用的方式定义5数据仓库是大量有关公司数据的数据存储定义6仓库提供公司数据以及组织数据的访问功能,其中的数据是一致的(consistent),并且可以按每种可能的商业度量方式分解和组合;数据仓库也是一套查询、分析和呈现信息的工具;数据仓库是我们发布所用数据的场所,其中数据的质量是业务再工程的驱动器(driverofbusinessreengineering)定义的共同特征首先,数据仓库包含大量数据,其中一些数据来源于组织中的操作数据,也有一些数据可能来自于组织外部;其次,组织数据仓库是为了更加便利地使用数据进行决策;最后,数据仓库为最终用户提供了可用来存取数据的工具综合对数据仓库的各种理解以及其特征,我们可以定义数据仓库是一种为信息分析提供了良好的基础并支持管理决策活动的分析环境,是面向主题的、集成的、稳定的、不可更新的、随时间变化的、分层次的多维的集成数据集合
1.2数据挖掘引论
1.
2.1数据挖掘的作用数据挖掘解决诸如欺诈甄别(frauddetection)、保留客户(customerretention)、消除摩擦(attrition)、数据库营销(databasemarketing)、市场细分(marketsegmentation)、风险分析(riskanalysis)、亲和力分析(affinityanalysis)、客户满意度(customersatisfaction)、破产预测(bankruptcyprediction)、职务分析(portfolioanalysis)等业务问题提供了有效的方法例如,数据挖掘运用于客户行为分析,企业从中受益体现在以下四个方面
1.可以方法顾客和访问者的爱好、生活模式等
2.可以解决怎样来争取新顾客,怎样使产品适销对路,怎样给产品定价,怎样吸引单个顾客,怎样优化Web站点等问题即可以通过顾客定制和指定的产品和服务交换信息,对Web上的商业模式建模,预测、了解影响销售的各种因素,以便迅速调整其市场、价格、存货等;通过页面访问情况,分析出的客户生活和购物模式,根据客户的爱好等来定制个性化Web界面
3.可以利用相应的信息确定顾客消费的生命周期,针对不同的产品定制相应的营销策略
4.可以却东客户细分,为每一个顾客的独特需求设计“量身定制”的产品有些问题的产生是显然的,如开辟新产品的市场;为现存的产品和服务定价;了解客户流失的原因同时和各种人员的交流也是很重要的,当他们了解了数据挖掘之后,就有可能提出更好的问题
1.
2.2数据挖掘对企业的影响诺贝尔奖得主Penziad博士在1999年1月的《计算机世界》上发表评论认为“数据挖掘将变得更加重要,因为数据挖掘如此有价值,以至于企业将不再会丢失与其客户有关的任何信息如果你不在这方面做些什么,那么你将会失去你的生意”如果数据挖掘能够对改善商务过程起到明显的作用,则它就是一种能够赢得竞争的武器表
1.1给出的3个例子清楚地说明数据挖掘可以对企业的盈利能力产生直接影响这3个例子中,企业的销售收入都受到通过数据挖掘所收集到的信息数据量的影响当然,在某些领域(如股票市场),数据挖掘产生预测的准确性要比其他领域差一些例如,在零售业中对于直接信函而言,采用数据挖掘,从有可能对直接信函做出响应的人当中识别出其中10%为可能性最高的人就是一件比较容易的事情很多企业都在利用数据挖掘技术帮助管理客户生命周期的各个阶段,包括争取新的客户、在已有客户的身上赚更多的钱和保持优质客户如果能够确定优势客户的特点,那么就能提供针对性的服务如此,已经发现了购买某一商品的客户的特征,那么就可以向那些具有这些特征但还没有购买此商品的客户推销这个商品;找到流失的客户的特征就可以对那些具有相似特征的客户还未流失之前进行针对性的弥补,因为保留一个客户要比争取一个客户容易得多表2-1图书借阅登记表零售业业务问题增加对直接信函(directmail)的响应率解决方案销售人员通过数据挖掘建立的预测模型以了解哪些人最有可能对直接信函作出响应获得的收益由于将直接信函发送给正确的客户而增加了销售额保险业业务问题减少保险欺诈案件的发生数量解决方案业务人员通过数据挖掘建立预测模型识别出哪些赔偿要求最可能具有欺诈性获得的收益由于减少欺诈造成的费用而增加了利润金融业业务问题改进预测市场波动的能力,在金融市场建模中得到广泛应用如何采用神经网络方法提高金融增益和在采用数据挖掘技术建立股票市场模型解决方案金融分析员通过数据挖掘建立预测模型以识别出历史上曾引起过市场被动的因素所具有的模式获得的收益由于投资更加准确而增加了收入数据挖掘可以应用在各个不同的领域电讯公司和信用卡公司就是用数据挖掘检测欺诈行为的先行者保险公司和证券公司也开始采用数据挖掘来减少欺诈零售商则更多的使用数据挖掘来决定每种商品在不同地点的库存量,通过数据挖掘更灵活地进行商品促销和优惠活动
1.
2.3数据挖掘概念数据挖掘在1989年8月美国底特律市召开的第十一界国际联合人工智能学术会议上正式形成从1995年开始,每年举行一次知识发现国际学术会议,把对数据挖掘和知识发现的研究推入高潮数据挖掘还有被译为数据采掘、数据开采和数据发掘等,但数据挖掘还未有一致的定义对数据挖掘有如下定义定义1G.PiatetskyShapiorW.J.Frawley等定义数据挖掘为从数据库的大量数据中揭示出隐含的、先前未知的、潜在有用的信息的非平凡过程定义2有人简单认为,数据挖掘就是数据库中知识的发现定义3有人认为,数据挖掘为发现数据中隐藏的模式和关系的过程定义4有人认为,数据挖掘就是从大量数据中提取或挖掘知识定义5Fayyad等在“知识发现96国际会议上”认为,知识发现是从数据库中发现知识的全部过程,而数据挖掘则是此全部过程中一个特定的关键一步这种观点将数据挖掘的对象局限于数据库定义6数据挖掘广义的定义为在一些事实或观察数据的集合中寻找模式的决策支持的过程综上所述,我们定义数据挖掘为在不同的数据源中包括结构化的数据、半结构化的数据和非结构化的数据,即既可以是数据库,也可以是文件系统,或其他任何组织在一起的数据集合,通过一定的工具与方法寻找出有价值的知识的一类深层次的数据分析方法
1.3数据挖掘与数据仓库的关系数据挖掘和数据仓库作为决策支持新技术在近十年来迅速发展数据仓库和数据挖掘二者既相互结合、共同发展又相互影响、相互促进二者的联系概括如下
1.数据仓库为数据挖掘提供了更好更广泛的数据源数据仓库中集成和存储着来自异质的信息源的数据而这些信息源本身就可能是一个规模庞大的数据库同时数据仓库存储了大量长时间的历史数据这可以进行数据长期趋势的分析为决策者的长期决策行为提供了支持数据仓库中数据在时间轴上的纵深性是数据挖掘不能回避的又一个新难点
2.数据仓库为数据挖掘提供了新的支持平台数据仓库的发展不仅为数据挖掘开辟了新的空间更对数据挖掘技术提出了更高的要求作为数据挖掘对象数据仓库技术的产生和发展为数据挖掘技术开辟了新的战场提出了新要求和挑战数据仓库的体系结构努力保证查询和分析的实时性数据仓库一般设计成只读方式数据仓库的更新由专门一套机制保证数据仓库对查询的强大支持使数据挖掘效率更高
3.数据仓库为更好地使用数据挖掘工具提供了方便数据仓库的建立充分考虑数据挖掘的要求用户可以通过数据仓库服务器得到所需的数据形成开采中间数据库利用数据挖掘方法进行开采获得知识数据仓库为数据挖掘集成了企业内各部门的全面的、综合的数据数据挖掘要面对的是关系更复杂的企业全局模式的知识发现而且数据仓库机制大大降低了数据挖掘的障碍一般进行数据挖掘要花大量的精力在数据准备阶段:数据仓库中的数据已经被充分收集起来进行了整理、合并并且有些还进行了初步的分析处理这样数据挖掘的注意力能够更集中于核心处理阶段另外数据仓库中对数据不同粒度的集成和综合更有效地支持广多层次、多种知识的开采
4.数据挖掘为数据仓库提供了更好的决策支持企业领导的决策要求系统能够提供更高层次的决策辅助信息而基于数据仓库的数据挖掘能更好地满足高层战略决策的要求数据挖掘对数据仓库中的数据进行模式抽取和发现知识从数据仓库中揭示出对企业有潜在价值的规律知识形成知识发现为知识管理提供了内容在知识管理中起到中流砥柱的作用这些正是数据仓库所不能提供的
5.数据挖掘对数据仓库的数据组织提出了更高的要求数据仓库作为数据挖掘的对象要为数据挖掘提供更多、更好的数据其数据的设计、组织都要考虑到数据挖掘的要求
6.数据挖掘还为数据仓库提供广泛的技术支持数据挖掘的可视化技术、统计分析技术等都为数据挖掘提供了强有力的技术支持总之数据仓库在纵向和横向都为数据挖掘提供了更广阔的活动空间数据仓库完成数据的收集、集成、存储、管理等工作数据挖掘面对的是经初步加工的数据使得数据挖掘能更专注于知识的发现又由于数据仓库所具有的新特点对数据挖掘技术提出了更高的要求另一方面数据挖掘为数据仓库提供了更好的决策支持同时促进了数据仓库技术的发展可以说数据挖掘和数据仓库技术要充分发挥潜力就必须结合起来
1.4 数据仓库与数据挖掘的区别数据仓库是一种存储技术它的数据存储量是一般数据库的100倍它包含大量的历史数据、当前的详细数据以及综合数据它能为不同用户的不同决策需要提供所需的数据和信息数据挖掘是从人工智能机器学习中发展起来的它研究各种方法和技术从大量的数据中挖掘出有用的信息和知识第2章创建数据仓库
2.1数据仓库的来源在本次实验中,我建立了MedicalDW数据库,其中包含了三张表baby、disease、students表下边分别介绍这三张表students表是从某校门诊体检系统中导出了乙肝病毒检查数据的表;baby表使用的数据集是某地区医院新出生婴儿信息的一个样本数据集;disease表是对某城市年龄范围为25岁~55岁的中青年人群进行调查,调查数据项包括年龄、性别等项对表的详细介绍将在下面各章节中显示
2.2数据表的结构baby表的各列信息如表2-1所示表2-1新生儿信息列名数据类型可否为空IDintNotnullAGEnvarcharMAXNullFMFSnvarcharMAXNullBABYSUMnvarcharMAXNullBABYSEXnvarcharMAXNullYZSnvarcharMAXNullYYJGnvarcharMAXNullPXnvarcharMAXNullWEIGHTnvarcharMAXNullstudents表的各列信息如表2-2所示表2-2乙肝病毒检查数据表列名数据类型可否为空student_nonvarchar255Notnullstudent_sexnvarchar255NullHBsAgnvarchar255Null抗HBsnvarchar255NullHBeAgnvarchar255Null抗HBenvarchar255Null抗HBcnvarchar255Nulldisease表的各列信息如表2-3所示表2-3中青年人群调查表列名数据类型可否为空IDintNotnullsexnvarchar255NullagefloatNullprofessionnvarchar255NullMaritalStatusnvarchar255Nullowncarnvarchar255Nullemotionnvarchar255Nulltirednessnvarchar255Nullexercisenvarchar255Nulldietnvarchar255Nullsitting-upnvarchar255Nullpettingnvarchar255Nulldrinknvarchar255Nullsmokingnvarchar255Nullfamilialmedicalhistorynvarchar255Nullfatnessnvarchar255Nullhypertensionnvarchar255Nullbloodsugarnvarchar255Nullbloodfatnvarchar255Nulldiabetesnvarchar255Nullcoronaryheartdiseasenvarchar255Null第3章关联规则挖掘
3.1案例背景病毒性肝炎是我国最严重和最常见的传染病之一,特别是乙型病毒性肝炎,目前我国仍有约
1.2亿人持续携带乙型肝炎病毒,3千万例慢性乙肝患者中部分演变成了肝硬化,进而引发肝癌,每年死于肝炎及其并发症的患者达四十万人,医疗费用达数百亿元所以如何预防和治疗乙型肝炎已经成为一个重要的课题,对学校每年新生入学体检乙型肝炎病毒的检验是一个重要的检查对象目前多采用微生物学检查法,即乙型肝炎抗原、抗体检测目前主要用血清学方法检测HBsAg、抗HBs、HBeAg、抗HBe、抗HBc(俗称“两对半”)HBcAg仅存在于肝细胞内,也不用于常规检查HBsAg的检测最为重要,可发现无症状携带者,是献血员筛选的必检指标“两对半”各项指标的意义如下1乙型肝炎表现抗原HBsAg是感染了乙肝病毒的一个特异性标志血清内HBsAg为阳性表示急性乙肝的潜伏期和急性期;慢性乙肝病毒感染状态,包括无症状HBsAg携带者、慢性乙型肝炎、与乙肝病毒有关的肝硬化和原发性肝癌2乙型肝炎表面抗体抗HBs是一种保护抗体,表示曾经感染过乙肝病毒,不论临床上有无肝炎的表现,均表示患者现已恢复,并对乙肝病毒具有免疫力;注射乙肝疫苗后,产生抗HBs表示具有免疫力3乙型肝炎核心抗体抗HBc包括抗HBc总抗体、核心抗体免疫球蛋白M抗HBc-lgM和核心抗体免疫球蛋白G抗HBc-lgG抗HBc出现于急性乙型肝炎的急性期,恢复后可持续数年或更长,滴度则逐渐下降慢性乙肝病毒感染者,抗HBc持续阳性单项抗HBc阳性表示过去可能感染过乙肝病毒,其临床意义需与其他指标结合而判断分别测抗HBc-lgM和lgG更有意义急性乙肝病人抗lgM呈高滴度阳性,特别对于HBsAg已转阴的病人,抗HBc-lgM下降的速度与患者病情相关,下降快预后好,1年内不降至正常或滴度高低呈反复现象者均提示转为慢性肝炎的可能慢性乙肝活动期抗HBc-lgM呈中滴度阳性,并可区分活动期和非活动期抗HBc-lgG出现时间较迟于HBc-lgM,主要见于恢复期和慢性感染4乙型肝炎e抗原HBeAg由于HBeAg是核心抗原的成分,其阳性和滴度常反映乙肝病毒的复制及判断传染性的强弱急性乙肝时HBeAg呈短暂阳性,如持续阳性则提示转为慢性,在慢性乙肝病毒感染时,HBeAg阳性常表示肝细胞内有乙肝病毒活动性复制,当HBeAg转阴,伴有乙型肝炎e抗体抗HBe转阳,常提示乙肝病毒停止复制5乙型肝炎e抗体(抗HBe)出现于急性乙肝的恢复期,可持续较长时间慢性乙肝病毒感染时,如抗HBe阳性,HBeAg常为阴性,表示乙肝病毒无明显活动性复制,传染性较弱,临床上慢性肝病的活动性较低
3.2数据来源从某校门诊体检系统中导出了乙肝病毒检查数据表,得到了5170条检验数据记录部分数据如下图3-1所示,数据表名是students图3-1students表
3.3关联规则的应用
3.
3.1MicrosoftSQLServer2005AnalysisServices操作步骤关联规则算法的具体步骤如下
1.打开AnalysisService集成环境界面依次执行“开始”→“所有程序”→“MicrosoftSQLServer2005”→“SQLServerBusinessIntelligenceDevelopmentStudio”命令,打开AnalysisService集成环境界面
2.新建项目
(1)执行菜单栏的“文件”→“新建”→“项目”命令,打开如图3-3所示的“新建项目”对话框
(2)选中“AnalysisServices”项目,分别在“名称”、“解决方案名称”文本框中,填写项目名称(students)和解决方案名称;在“位置”下拉文本框中,单击右侧的“浏览”钮,选择解决方案的保存路径如图3-2所示图3-2“新建项目”对话框
(3)单击“确定”按钮,返回集成环境的起始界面
3.创建数据源
(1)在解决方案资源管理器中,右击“数据源”文件夹,在弹出的快捷菜单中选择执行“新建数据源”命令,进入欢迎界面在欢迎界面上单击“下一步”按钮,进入“选择如何定义连接”界面(见图3-3)
(2)单击“新建”按钮,系统将打开“连接管理器”对话框,在“连接管理器”的“提供程序”列表中,选择“本机OLEDB\MicrosoftOLEDBProviderforSQLServer”选项;在“服务器名称”文本框中,输入“.”;选择“使用Windows身份验证”单选按钮;在“选择或输入数据库名称”列表框中,选择MedicalDW选项;单击“确定”按钮图3-3“选择如何定义连接”窗口
(3)单击“下一步”按钮,进入“模拟信息”窗口,选择“默认值”单选按钮
(4)单击“下一步”按钮,进入“完成向导”页对话框数据源的默认名称为MedicalDW单击“完成”即完成了数据源的创建,新的数据源MedicalDW将显示在解决方案资源管理器的“数据源”文件夹中如图3-4所示图3-4解决方案资源管理器
4.创建数据源视图
(1)在解决方案资源管理器中,右击“数据源视图”选项,选择“新建数据源视图”命令系统将打开数据源视图向导“选择数据源”窗口,在“关系数据源”区域下,系统将默认选中刚才创建的MedicalDW数据源
(2)单击“下一步”按钮,打开“选择表和视图”窗口
(3)选择dbo.students表,单击右箭头键,将dbo.students包括在新数据源视图中如图3-5所示图3-5创建数据源视图
(4)单击“下一步”按钮,进入“完成向导”对话框,默认情况下,系统将数据源视图命名为MedicalDW
(5)单击“完成”按钮,系统将打开数据源视图设计器,显示MedicalDW数据源视图
5.创建关联规则挖掘结构
(1)在解决方案资源管理器中,右击“挖掘结构”选项并选择“新建挖掘结构”命令,系统将打开数据挖掘向导窗口
(2)单击“下一步”按钮,进入“选择定义方法”窗口,选中“从现有关系数据库或数据仓库”选项
(3)单击“下一步”按钮,进入“选择数据挖掘技术”窗口,在“您要使用何种数据挖掘技术?”区域下,选择“Microsoft关联规则”选项如图3-6所示图3-6选择Microsoft关联规则作为挖掘技术
(4)单击“下一步”按钮,进入“选择数据源视图”窗口,已默认选中students在数据源视图中
(5)单击“下一步”按钮,进入“指定表类型”窗口,选中students表旁边“事例”列中的复选框如图3-7所示
(6)单击“下一步”按钮,进入“指定定型数据”窗口,具体各复选框的选择情况如图3-8所示
(7)单击“下一步”按钮,进入“指定列的内容和数据类型”窗口
(8)单击“下一步”按钮,进入“完成向导”对话框
(9)在“挖掘结构名称”和“挖掘模型名称”文本框中输入“Students”
(10)选中“允许钻取”复选框
(11)单击“完成”按钮,进入数据挖掘设计器界面,如图3-9所示图3-7事例表图3-8指定关联分析中所用的属性图3-9MedicalDW关联规则挖掘结构视图6.部署项目并处理挖掘模型
(1)单击数据挖掘设计器中的挖掘模型查看器选项卡,AnalysisServices数据库将部署到服务器上,处理挖掘模型首先会弹出两个提示框,均单击“是”按钮,打开“处理挖掘模型-Students”窗口,如图3-10所示图3-10处理挖掘结构
(2)单击“运行”按钮,打开“处理进度”窗口,显示有关模型处理的信息模型处理需要的时间取决于计算机及数据量的规模
(3)处理完毕后,在“处理进度”和“处理挖掘结构”窗口中单击“关闭”按钮,Students挖掘模型即已生成
7.查看挖掘结果处理完成以后,选择“挖掘模型查看器”,第一个页面是挖掘到的频繁集,如图3-11所示,或者打开第二个页面,查看挖掘出来的规则,如图3-12所示,或者打开第三个页面,查看挖掘出来的依赖关系网络,如图3-
13、3-14所示图3-11挖掘项集的结果图3-12挖掘关联规则的结果图3-13依赖关系网络所有较强链接图3-14依赖关系网络最强的两个链接
3.
3.2模型解释Microsoft关联规则通过其查看器来解释,Microsoft关联查看器包含三个选项卡项集、规则、依赖关系网络图3-11所示的“项集”选项卡显示了关联规则算法发现的频繁项集,显示了一系列频繁项集以及它们的支持度(发生项集的事务的数量)和大小(项集中项的数量)以及项集的实际构成若要仅查看包含有关HBeAg的项集,可在“筛选项集”中输入HbsAg然后回车我们将在查看器中看到,只有包含“HBsAg”字样的项集被显示,查看器中返回的每个项集都包含有关HBsAg的信息图3-12所示的“规则”选项卡显示满足要求的关联规则、这些规则的概率和重要性分数重要性分数的目的是用于测试规则的有效性重要性分数越高,则规则的质量越好与项集选项卡相似,该选项卡也提供“最低支持选项”的选择在规则选项中,可以发现一些比较有价值的规则例如HBsAg=HBsAg+=抗HBs=抗HBs-这条规则表示HbsAg为阳性,则抗HBs为阴性根据医学知识可知,HbsAg为阳性时候,一般抗HBs是不可能阳性的如果我们想知道有多少检验结果支持该规律,则可以使用“钻取”来快速得到支持这个规律的原始数据关联规则查看器的第三个选项卡是“依赖关系网络”(如图3-13所示),该查看器中的每个节点表示一个项;例如,HBsAg=HBsAg+节点表示事务中存在HbsAg为阳性通过选择节点,可以使用选项卡底部的彩色图例来确定模型中的项与其他的项的相互确定关系滑块与规则的概率关联,上下移动滑块可以筛选出强弱关联例如,在“显示”框中,选择“仅显示属性名称”,再单击HBsAg=HBsAg+节点查看器显示,HBsAg=HBsAg+预测了HBeAg=HBeAg+抗HBs=抗HBs-和抗HBc=抗HBc+而抗HBe=抗HBe+和HBeAg=HBeAg+也预测了HBsAg=HBsAg+这意味着,这些项有可能同时在事务中出现也就是说,如果某个同学HbsAg为阳性,则HbeAg也有可能为阳性,抗HBs是阴性的可能性比较大图3-13表示依赖关系网络所有较强链接,图3-14表示依赖关系网络最强的两个链接从图3-13可以看出,该关联规则被分为两类,一类包含HBsAg=HBsAg+,另一类包含HBsAg=HBsAg-从图3-14可以看出所有关联规则中“HBsAg=HBsAg+=HBeAg=HBeAg+”和“HBsAg=HBsAg-=抗HBs=抗HBs+”的置信度最大这说明HBsAg是非常重要的指标,即HBsAg的检测对病毒性肝炎的诊断最为重要由医学知识可知,HBsAg=HBsAg+表明急性乙肝的潜伏期和急性期;慢性乙肝病毒感染状态,包括无症状HBsAg携带者、慢性乙型肝炎、与乙肝病毒有关的肝硬化和原发性肝癌HBeAg=HBeAg+表明肝细胞内有乙肝病毒活动性复制该最强规则表明当急性乙肝处于潜伏期和急性期或者慢性乙肝病毒处于感染状态时,肝细胞内有乙肝病毒活动性复制通过查看“规则”选项卡发现,HBsAg=HBsAg+=HBeAg=HBeAg+的置信度为
0.535,重要性为
3.116,由关联规则的基本原理可以知道,关联规则由重要性和置信度共同决定,此最强关联规则的概率虽然不大,但重要性很大,说明该关联规则的关联性很强,这与临床经验相符抗HBs=抗HBs+表明病人有乙肝抗体;由“HBsAg=HBsAg-=抗HBs=抗HBs+”可以看出如果HBsAg显阴性,则抗HBs=抗HBs+,即病人很有可能具有抗体由此可得,HBsAg的检测对乙肝的诊断最为重要,当HBsAg为阳性时,病人很有可能有乙肝病毒;当HBsAg为阴性时,病人很有可能有乙肝病毒抗体,这与临床经验相符
3.4小结关联规则反映一个事物与其他事物之间的相互依存性和关联性如果两个或者多个事物之间存在一定的关联关系,那么,其中一个事物就能够通过其他事物预测到关联规则挖掘分为产生频繁集和产生规则两个步骤经典的关联规则挖掘算法包括由候选集产生频繁集的算法Apriori和不产生候选集的算法FP-tree关联规则可以分为一维和多位关联规则,单层和多层关联规则,以及布尔型和数值型的关联规则在SQLSever中,可以使用AnalysisServices服务进行关联规则模型的建立和处理,以可视化的方式查看模型结果第4章分类挖掘
4.1案例背景MicrosoftSQLServer2005AnalysisServices(SSAS)提供了Microsoft决策树算法,用于对离散和连续属性进行预测性建模对于离散属性,该算法根据数据集中输入列之间的关系进行预测对于连续属性,该算法使用线性回归确定决策树的拆分位置本节将利用Microsoft决策树算法,为新出生婴儿的体重是否正常建立一棵决策树,旨在为妇幼保健工作提供一些数值依据因为婴儿出生体重不仅反映了宫内胎儿的生长发育情况,对产后的生长发育、成年期心血管疾病、高血压、糖尿病等慢性疾病的发生也有着一定的影响一般来说,新出生的婴儿体重如果低于2500克,则认为是低出生体重儿
4.2数据来源本实例使用的数据集是某地区医院新出生婴儿信息的一个样本数据集整个数据集由100个实例组成,其中21个实例的婴儿出生体重属于低出生体重,其余的实例婴儿体重正常数据集中共有9个属性,其中第9个属性表示婴儿出生体重是否正常部分数据如图4-1所示,数据表名是baby各属性取值描述如下ID主键AGE:孕妇年龄,划分为三个区间,分别是≤
20、20~
30、>30BABYSUM胎数1表示单胎,2表示双胎FMFS分娩方式,取值为“阴道分娩”、“剖宫分娩”YZS:孕周数,取值为≥
37、<37(即早产)YYJG取值为“合理”、“不良”PX:是否贫血,1表示无贫血,2表示贫血BABYSEX:婴儿性别,1表示男,2表示女WEIGHT:婴儿出生体重是否正常,取值为“低出生体重”、“正常出生体重”图4-1某地区医院新出生婴儿信息的部分样本数据集
4.3分类挖掘的应用
4.
3.1MicrosoftSQLServer2005AnalysisServices操作步骤分类挖掘的具体步骤如下
1.打开AnalysisService集成环境界面
2.新建项目
3.创建数据源上述3个步骤与第三章
3.
3.1节中的步骤1~3相同,这里不再赘述
4.创建数据源视图
(1)在解决方案资源管理器中,右击“数据源视图”文件夹,在弹出的快捷菜单中选择执行“新建数据源视图”命令,打开数据源视图向导“选择数据源”界面,在“关系数据源”下,系统将默认选中刚才创建的MedicalDW数据源
(2)单击“下一步”按钮,打开“选择表和视图”界面
(3)在“选择表和视图”界面中,选择dbo.baby表,单击右箭头键,将dbo.baby包括在新数据源视图中如图4-2所示图4-2创建数据源视图
(4)单击“下一步”按钮,进入“完成向导”对话框,将数据源视图命名为MedicalDW
(5)单击“完成”按钮,系统将打开数据源视图设计器窗口,显示MedicalDW数据源视图
5.创建用于婴儿体重的挖掘结构
(1)在解决方案资源管理器中,右击“挖掘结构”文件夹,在弹出的快捷菜看重选择执行“新建挖掘结构”命令,打开“数据挖掘向导”窗口
(2)在“欢迎使用数据挖掘向导”界面中,单击“下一步”按钮,进入“选择定义方法”界面
(3)选中“从现有关系数据库或数据仓库”选项,单击“下一步”按钮,进入“选择数据挖掘技术”界面
(4)在“您要使用何种数据挖掘技术?”下拉列表框中,选择“Microsoft决策树”选项,如图4-3所示图4-3选择Microsoft决策树作为挖掘技术
(5)单击“下一步”按钮,进入“选择数据源视图”界面,已默认选中MedicalDW在数据源视图中
(6)单击“下一步”按钮,进入“指定表类型”界面,选中baby表旁边“事例”列中的复选框;单击“下一步”按钮,进入“指定定型数据”界面,如图4-4所示
(7)“键”列表示唯一可识别的字段,选中相应复选框即可,本例中选择字段“ID”
(8)“可预测”列用来选择类标号,本例中选择字段“WEIGHT”
(9)“输入”列表示分类的依据,根据所选的列构造决策树,本例中选中除主键和可预测列外的所有属性,选择的结果如图4-5所示
(10)单击“下一步”按钮,进入“指定列的内容和数据类型”界面
(11)单击“下一步”按钮,进入“完成向导”界面,如图4-6所示在“挖掘结构名称”和“挖掘模型名称”中输入baby,选中“允许钻取”复选框,单击“完成”按钮,进入数据挖掘设计器界面,如图4-7所示图4-4选择baby作为事例表图4-5指定决策树分析中所用的属性图4-6完成决策树挖掘结构向导图4-7数据挖掘编辑器界面
6.部署项目并处理挖掘模型
(1)单击数据挖掘设计器中的挖掘模型查看器选项卡,AnalysisServices数据库将部署到服务器上,处理挖掘模型首先会弹出两个提示框,均单击“是”按钮,打开“处理挖掘模型-baby”窗口
(2)单击“运行”按钮,打开“处理进度”窗口,显示有关模型处理的信息
(3)处理完毕后,在“处理进度”和“处理挖掘结构”窗口中单击“关闭”按钮,baby决策树模型即已生成
4.
3.2模型解释AnalysisServices为每个算法提供单独的查看器在本例中,对于决策树模型,使用的是Microsoft树查看器此查看器包含两个选项卡,即“决策树”和“相关性网络”图4-8显示了Microsoft决策树查看器的屏幕快照,该图显示了baby-weight分类树模型在该图中树是按水平的方式布局的,根节点在最左边树中每一个节点包含一个柱状条,并且用不同的颜色来代表不同的状态节点的底纹颜色越深,表示节点中的事例越多选中树中的节点,可通过挖掘图例显示下列信息节点中按可预测属性的状态划分的事例的数目节点的可预测属性的各种事例的概率一个直方图,其中包含可预测属性的各种状态的数目图4-8决策树查看器访问某个特定节点所需的条件,也称为“节点路径”本例中,选中“babynum=2”节点,挖掘图例显示如图3-15所示,表明在条件“babynum=2andYZS=>=37”情况下,婴儿低出生体重占正常孕周样本的
24.31%由于在创建数据挖掘结构时选择了“允许钻取”选项,即可访问支持某个节点的定型事例右击树中的某节点,在弹出的快捷菜单中选择执行“钻取”命令如“YZS<37”的节点钻取的数据如图4-9所示(部分数据)图4-9钻取结果图4-10是决策树算法的“依赖关系网络”选项卡显示了模型中的输入属性和可预测属性之间的依赖关系查看器左侧的滑块可起到与依赖关系强度相联系的筛选器作用如果向下拉动滑块,查看器中显示的链接强度逐渐加大,本例中显示了“WEIGHT”与“YZS”之间弱相关关系的联系将滑块拉到最下面,系统显示强相关,如图4-11所示图4-10决策树查看器的依赖关系网络窗格图4-11最强依赖关系通过上述分析,发现早产(孕周小于37周)和双胎是发生低出生体重儿的主要原因之一,其中以早产更为显著因此应加强孕期检查,指导孕期卫生,对可能引起早产的因素给予充分重视,并予以纠正,以减少早产的发生,对孕期保健的指导具有重要意义
4.4小结分类的主要目的是分析输入数据,通过在训练集中的数据表现出来的特性,为每一类找到一种准确的描述或模型这种描述常常用谓词表示由此生成的类描述用来对未来的测试数据进行分类尽管这些未来的测试数据的类标签是位置的,我们仍可以由此预测这些新数据所属的类,但不能肯定我们也可以由此对数据中的每一个类有更好的理解也就是说,我们获得了关于这个类的知识分类方法典型应用于信用卡系统中的信用分级、市场调查、疗效诊断、寻找店址等第5章聚类挖掘
5.1案例背景MicrosoftSQLSever2005AnalysisServicesSSAS提供了Microsoft聚类分析算法该算法使用迭代技术将数据集中的事例分组为包含类似特征的分类在浏览数据、标识数据中的异常及创建预测时,这些分组十分有用Microsoft聚类分析算法提供下列两种方法来计算点在分类中的适合程度ExpectationMaximizationEM和k-means对于EM聚类分析,该算法使用一种统汁方法来确定分类中存在数据点的概率对于k-means,该算法使用距离度量值将数据点分配给其最接近的分类下面以“某城市年龄范围为25岁-55岁的中青年人调查数据样本”为例讲解Microsoft聚类分析的详细过程,且使用EM算法Microsoft聚类分析算法的默认算法
5.2数据来源对某城市年龄范围为25岁~55岁的中青年人群进行调查调查数据项包括年龄、性别等项部分数据如图5-1所示,数据表名是disease图5-1部分调查数据集各属性的含义如表7-1所示表5-1各属性的含义属性含义属性含义属性含义ID主键Tiredness熬夜familialmedicalhistory家族心血管病史Sex性别Exercise运动锻炼习惯fatness肥胖情况Age年龄Diet个人饮食偏好hypertension血压Profession工作压力状况sitting-up早期习惯bloodsuger血糖MaritalStatus婚姻状况petting养宠物bloodfat血脂Owncar是否有车drink喝酒diabetes糖尿病Emotion情绪状态smoking吸烟coronaryheartdisease冠心(心脏)病
5.3聚类挖掘的应用
5.
3.1MicrosoftSQLServer2005AnalysisServices操作步骤分类挖掘的具体步骤如下
1.打开AnalysisService集成环境界面
2.新建项目
3.创建数据源上述3个步骤与第三章
3.
3.1节中的步骤1~3相同,这里不再赘述
4.创建数据源视图
(1)在解决方案资源管理器中,右击“数据源视图”文件夹,在弹出的快捷菜单中选择执行“新建数据源视图”命令,打开数据源视图向导“选择数据源”界面,在“关系数据源”下,系统将默认选中刚才创建的MedicalDW数据源
(2)单击“下一步”按钮,打开“选择表和视图”界面
(3)在“选择表和视图”界面中,选择dbo.disease表,单击右箭头键,将dbo.disease包括在新数据源视图中
(4)单击“下一步”按钮,进入“完成向导”对话框,将数据源视图命名为MedicalDW
(5)单击“完成”按钮,系统将打开数据源视图设计器窗口,显示MedicalDW数据源视图
5.创建聚类分析挖掘结构1)在解决办案资源管理器中,右击“挖掘结构”项并选择“新建挖掘结构”命令,系统将打开数据挖掘向导2单击“下一步”按钮,进入“选择定义方法”窗口,选中“从现有关系数据库或数据仓库”选项3单击“下一步”按钮,进入“选择数据挖掘技术”窗口,在“您要使用何种数据挖掘技术?”下,选择“Microsoft聚类分析”单选按钮4单击“下一步”按钮,进入“选择数据源视图”窗口,已默认选中MedicalDW在数据源视图中5单击“下一步”按钮,进入“指定表类型”窗口,选中disease表旁边“事例”列中的复选框6单击“下一少”按钮,进入“指定定型数据”窗口,ID列选为键其他各列都选中“输入”和“可预测”复选框,如图5-2所示图5-2“指定定型数据”页面7单击“下一步”按钮,进入“指定列的内容和数据类型”窗口8单击“下一少”按钮,进入“完成向导”对话框在“挖掘结构名称”和“挖掘模型名称”文本框中输入“Disease”选中“允许钻取”复选框9单击“完成”按钮,进入数据挖掘设计器界面,如图5-3所示图5-3挖掘结构
6.部署项目并处理挖掘模型
(1)单击数据挖掘设计器中的挖掘模型查看器选项卡,AnalysisServices数据库将部署到服务器上,处理挖掘模型首先会弹出两个提示框,均单击“是”按钮,打开“处理挖掘模型-disease”窗口
(2)单击“运行”按钮,打开“处理进度”窗口,显示有关模型处理的信息
(3)处理完毕后,在“处理进度”和“处理挖掘结构”窗口中单击“关闭”按钮
5.
3.2模型解释Microsoft聚类分析通过其查看器来解释,SQLServerAnalysisServer提供的聚类分析查看器有4个选项卡聚类之问是相互联系的,通过单独的某一个视图难以理解挖掘模型,但可以同时使用这些视图本小节将采用如下策略来理解模型,并最终给每一个聚类进行标识1获得聚类的顶层视图2选择一个聚类.并且决定该聚类与其它的聚类有哪些地方小同3确定所选择的聚类与相邻的聚类的不同点4验证判断是否正确5对聚类进行标识6为所有剩余的聚类重复前面的步骤下面对这些步骤进行详细讲述1获得顶层视图第一个视图提供了聚类的顶层视网分类剖面图和分类关系图,这两个视图结合起来提供了聚类模型的拓扑结构在分类剖面图视图中,每一列对应于模型中的每一个聚类,每一行对应于一个属性根据这样的设置,可以很容易的看出这些聚类之问的不同点使用这个视图,可以选择一个感兴趣的属性,并且可以通过水平扫描来查看该属性在所有聚类中的分布当对某一项感兴趣,可以查看该项相邻的单元或者统一聚类的其它单元,将会发现有关该聚类含义的更多信息图5-4在分类剖面图视图中显示连续值属性和二进制属性图5-4显示了Disease分类模型的分类剖面图视图的部分通过该视图可以看出,分类1的血脂较高的人多,有冠心心脏病的人多;而分类6的血脂普遍正常,且都没有冠心病分类剖面图视图以表格的形式显示模型中的所有信息,这样很容易理解模型二值型属性或者具有连续值的属性很容易辨别,对于具有连续值的属性,可以把该属性的值离散化为一组状态如果想进一步浏览聚类,则通过分类剖面图视图来浏览是一个很好的方式浏览了模型细节之后,可以利用其它的视图来浏览该模型在分类关系图视图中,每一个聚类用一个节点表示这些节点是分散在某个区域中,可以基于这些聚类的相似性对他们进行分组该视图以图形方式显示了哪一些聚类相似或者不相似,并且显示了它们相似性的相对程度通过使用分类关系图视图,可以在通过分类剖面图视图来浏览模型时获得的信息的基础上,进一步了解模型比如在分类剖血图视图中发现分类1中有冠心病的比重很高,在分类关系图视图中可以查看哪些与分类1相似,并且可以通过向下移动滑动条来隐藏弱的连接,留下强的连接,这样就可以确定哪一些聚类极为相似(参见图5-5)通过以上分析可以发现分类1与其他分类相似性不大,这说明其它聚类中冠心病的比重不高继续使用分类剖面图和分类关系图视图可以对模型的整个布局有比较清晰的认识图图5-5显示聚类之间强(较黑)连接的分类关系视图2选择一个聚类并且找出与其它聚类之问的区别选择一个聚类做进一步分析这时,选择哪一个聚类进行分析没有关系,一种选择聚类的方法是选择与其它聚类有较强关联关系的某个聚类,或者选择一个看起来与其它聚类有很大区别的聚类,或者选择感兴趣的聚类本例选择聚类1单击分类特征视图,该视图通过以递减概率显示属性来描述聚类事例的特征图5-6显示分类1最重要的特征图5-6分类特征视图这个聚类的成员喜欢早起,工作强度大等,然而这些信息还不能作为该类的标识,因为可能其它类也喜欢早起和工作强度大,下面通过与其它类迸行比较来确定对于类1什么是最重要的点击分类对比选项卡,图5-7将分类1与它的补充进行了比较在这里可以看到冠心病才是类1最重要的特征图5-7聚类辨别和聚类的补充3确定一个聚类如何区别于相邻的聚类现在有了足够的信息来精确地标识这个聚类然而,这个聚类可能非常相似于其它的聚类,并且在这个时候所做的标识适用于所有这些聚类因此,必须认真比较所选择的聚类与其相近的聚类为了进行比较,进入分类关系图视图,看哪些聚类与感兴趣的聚类很接近对于任何相邻的聚类,都必须回到分类对比视图中一个一个的比较这些聚类(如果与其它类相似性非常小,则可以不用比较)本例中与聚类1相似的聚类强度都不大,相对来说,与类8和类10相似性大点通过比较类1和8,可以看出这两个聚类的重要差异是劳动强度和是否早起;通过比较类1和10,可以看出这两个聚类的重要差异是是否养宠物4验证判断是否正确此时,对所选择的属性已经有了比较好的理解在分类特征视图中,可以确保其它视图不会误导你对聚类的理解通过比较聚类与其相邻的聚类,并且对聚类进行改进的时候,就有可能出现误导的情况两个聚类之间的差别可能是由一个属性引起的,该属性在这两个聚类中都不常见,但是在其中一个聚类中更少见本例中,通过对聚类1进行进一步验证,发现可以用“冠心病”标识”聚类1”,即聚类1的主要特征是有“冠心病”5对聚类进行标识对聚类进行标识是一种非常简单的技术,只要在分类关系视图中,右击聚类节点,然后选择“重命名分类”模型的标识对理解该模型和将来使用该模型有重要的性质本例中类1可以命名为“冠心病”通过以上分析发现,冠心病高发人群有如下特点高血脂,高血压,很少运动,经常熬夜,工作压力大,有家族新血压或心脏病病史,都不养宠物同时发现男性比例显著高于女性的发病率等可以对这些因素进一步进行分析,对冠心病的预防、治疗及其医疗保健等有重要的指导作用
5.4小结聚类是一种强人的工具聚类可用来理解数据,也可以用来做数据分析的关键步骤聚类分析可以按相似性对数据进行分组,并且可以对数据进行深入的分析,扶得其它方法不可能获得的信息一旦数据聚类完之后,聚类的结果就可以应用于市场竞争、异常检测、趋势分析或者进一步分析等本章
5.3的案例分析中,可以对每一类进行标识,然后对感兴趣的类作进一步分析比如类1,当发现冠心病高发人群具有的特点时,可以对“高血脂,高血脏,很少运动,经常熬夜,工作压力大,有家族新血压或心脏病病史,都不养宠物”进行关联分析和回归分析,从而可进一步得出降低冠心病的预防策略聚类分析是数据挖掘应用的主要技术之一,它将给定的数据集合划为多个类别,同一个类别的数据样本之间具有较高的相似度,而不同类别的数据样本之间具有较低的相似度参考毕业论文(设计)工作记录及成绩评定册题目学生姓名学号专业班级指导教师职称助理指导教师职称年月日实验中心制使用说明
一、此册中各项内容为对学生毕业论文(设计)的工作和成绩评定记录,请各环节记录人用黑色或蓝色钢笔(签字笔)认真填写(建议填写前先写出相应草稿,以避免填错),并妥善保存
二、此册于学院组织对各专业题目审查完成后,各教研室汇编选题指南,经学生自由选题后,由实验中心组织发给学生
三、学生如实填好本册封面上的各项内容和选题审批表的相应内容,经指导教师和学院领导小组批准后,交指导教师;指导老师填好《毕业论文(设计)任务书》的各项内容,经教研室审核后交学生签名确认其毕业论文(设计)工作任务
四、学生在指导老师的指导下填好《毕业论文(设计)开题报告》各项内容,由指导教师和教研室审核通过后,确定其开题,并将此册交指导老师保存
五、指导老师原则上每周至少保证一次对学生的指导,如实按时填好《毕业论文(设计)指导教师工作记录》,并请学生签字确认
六、中期检查时,指导老师将此册交学生填写前期工作小结,指导教师对其任务完成情况进行评价,学院中期检查领导小组对师生中期工作进行核查,并对未完成者提出整改意见,后将此册交指导老师保存
七、毕业论文(设计)定稿后,根据学院工作安排,学生把论文(打印件)交指导老师评阅指导老师应认真按《毕业论文(设计)指导教师成绩评审表》对学生的论文进行评审并写出评语,然后把论文和此册一同交教研室
八、教研室将学生的论文和此册分别交两位评阅人评阅后交回教研室保存
九、学院答辩委员会审核学生答辩资格,确定答辩学生名单,把具有答辩资格学生的论文连同此册交各答辩小组
十、学生答辩后由答辩小组记录人填好《毕业论文(设计)答辩记录表》中各项内容,然后把学生的论文和此册一同交所在答辩小组,答辩小组对其答辩进行评审并填写评语后交教研室
十一、学院答辩委员会进行成绩总评定,填好《毕业论文(设计)成绩评定表》中各项内容,然后把论文(印刷版和电子版(另传))和此册等资料装入专用档案袋中,教教研室后由实验中心统一保存目录1.毕业论文(设计)选题审批表
2.毕业论文(设计)任务书3.毕业论文(设计)开题报告
4.学生毕业论文(设计)题目更改申请表5.毕业论文(设计)指导老师工作记录6.毕业论文(设计)中期检查记录7.毕业论文(设计)指导教师成绩评审表8.毕业论文(设计)评阅人成绩评审表
9.毕业论文(设计)答辩申请表10.毕业论文(设计)答辩记录表11.毕业论文(设计)答辩成绩评审表12.毕业论文(设计)成绩评定表毕业设计(论文)选题审批表题目名称基于单片机的超声波测距题目性质□工程设计 □理论研究□实验研究 □计算机软件□综合论文 □其它题目来源□科研题目 □生产现场□教学 □其它□自拟题目选题理由由于超声波指向性强,能量消耗缓慢,在介质中传播的距离较远,因而超声波经常用于距离的测量利用超声波检测距离,设计比较方便,计算处理也较简单,精度也能达到使用要求,超声波测距应用于各种工业领域,如工业自动控制,建筑工程测量和机器人视觉识别等方面超声波作为一种检测技术,采用的是非接触式测量,由于它具有不受外界因素影响,对环境有一定的适应能力,且操作简单、测量精度高等优点而被广泛应用这些特点可使测量仪器不受被测介质的影响,大大解决了传统测量仪器存在的问题,比如,在粉尘多情况下对人引起的身体接触伤害,腐蚀性质的被测物对测量仪器腐蚀,触电接触不良造成的误测等此外该技术对被测元件无磨损,使测量仪器牢固耐用,使用寿命加长,而且还降低了能量耗损,节省人力和劳动的强度因此,利用超声波检测既迅速、方便、计算简单,又易于实时控制,在测量精度方面能达到工业实用的要求指导教师意见签名年月日院(系)领导小组意见签名年月日注此表由学生填写毕业论文(设计)任务书
1、毕业论文(设计)应达到的目的
(1)能对学生在学期间所学知识的检验与总结,培养和提高学生独立分析问题和解决问题的能力,使学生受到科学研究、工程设计和撰写技术报告等方面的基本训练
(2)提高学生对工作认真负责、一丝不苟,对事物能潜心观察、用于开拓、用于实践的基本素质;
(3)培养学生综合运用所学知识,结合实际独立完成课题的工作能力
(4)对学生的知识面、掌握知识的深度、运用理论结合实际去处理问题的能力、实践能力、计算机运用水平、书面及口头表达能力进行考核
2、毕业论文(设计)的内容和要求(包括原始数据、技术要求、工作要求等)以单片机为核心设计了基于激光测距的防撞预警系统,采用TDC-GP2芯片作为激光飞行计时单元给出激光发射及回波接收放大电路,基于模块化思想设计、完成系统软件设计流程;最后通过实验测试,系统要能很好测出前方车辆距离及运行状态,并能及时发出报警,利用Matlab对其测试结果进行验证,修正
3、对毕业论文(设计)成果的要求〔包括图表、实物等硬件要求〕设计完成后,要提供电路图,实验电路版,控制原始程序,实验要保存大量的原始数据完成设计论文
4、毕业论文(设计)工作进度计划序号论文(设计)工作进度日期(起止周数)1根据所出题目,结合自身所学知识,选择合适课题,确定毕业设计论文题目13-14-1第16周止2根据所定题目,全面搜集素材,列出各种设计方案,并一一比较,选择出最好的设计方案13-14-1第18周止3联系指导老师,将自己的设计方案与老师沟通、交流,得到指导老师的认同与指点,开始设计13-14-1第19周止4根据方案,确定所要用的器材设计总体框架结构,分出各大的模块,并将其展开,以得到比较细的设计模式13-14-2第1周止5根据所列框图,结合自己所学知识,开始各分支电路模块的设计13-14-2第2周止6完成初稿,将所做的模块给指导老师查阅,看是否有不当之处,再进行改进并将大电路的设计方案告之老师,得到老师更好的建议13-14-2第3周止7大胆进行设计,将每一个小的电路,大的模块,都精心设计好,完成整个硬件和软件部分的设计过程13-14-2第6周止8将所有设计整理结合,形成设计论文,交与指导老师检查,并经老师指点,做进一步的改进工作13-14-2第7周止9改进毕业设计论文,得到自己及老师认为满意的论文13-14-2第10周止指导教师日期年月日教研室审查意见签字年月日学院负责人意见签字年月日学生签字接受任务时间年月日注任务书由指导教师填写毕业论文(设计)开题报告题 目基于单片机的超声波测距
1、本课题的研究意义,国内外研究现状、水平和发展趋势近年来,随着电子测量技术的发展,运用超声波作出精确测量已成可能随着经济发展,电子测量技术应用越来越广泛,而超声波测量精确高,成本低,性能稳定则备受青睐超声波是指频率在20kHz以上的声波,它属于机械波的范畴超声波也遵循一般机械波在弹性介质中的传播规律,如在介质的分界面处发生反射和折射现象,在进入介质后被介质吸收而发生衰减等正是因为具有这些性质,使得超声波可以用于距离的测量中随着科技水平的不断提高,超声波测距技术被广泛应用于人们日常工作和生活之中一般的超声波测距仪可用于固定物位或液位的测量,适用于建筑物内部、液位高度的测量等随着科学技术的快速发展,超声波将在测距仪中的应用越来越广但就目前技术水平来说,人们可以具体利用的测距技术还十分有限,因此,这是一个正在蓬勃发展而又有无限前景的技术及产业领域展望未来,超声波测距仪作为一种新型的非常重要有用的工具在各方面都将有很大的发展空间,它将朝着更加高定位高精度的方向发展,以满足日益发展的社会需求,如声纳的发展趋势基本为研制具有更高定位精度的被动测距声纳,以满足水中武器实施全隐蔽攻击的需要;继续发展采用低频线谱检测的潜艇拖曳线列阵声纳,实现超远程的被动探测和识别;研制更适合于浅海工作的潜艇声纳,特别是解决浅海水中目标识别问题;大力降低潜艇自噪声,改善潜艇声纳的工作环境无庸置疑,未来的超声波测距仪将与自动化智能化接轨,与其他的测距仪集成和融合,形成多测距仪随着测距仪的技术进步,测距仪将从具有单纯判断功能发展到具有学习功能,最终发展到具有创造力在新的世纪里,面貌一新的测距仪将发挥更大的作用
2、本课题的基本内容,预计可能遇到的困难,提出解决问题的方法和措施利用单片机控制超声波测距,发射器发出的超声波以速度υ在空气中传播,在到达被测物体时被反射返回,由接收器接收,其往返时间为t由即可算出被测物体的距离预计可能遇到的问题是受温度的影响,测量精度不高,则应通过温度补偿的方法加以校正报告人签名2015年3月20日
3、本课题拟采用的研究手段(途径)和可行性分析由于超声波指向性强,能量消耗缓慢,在介质中传播的距离较远,因而超声波经常用于距离的测量利用超声波检测距离,设计比较方便,计算处理也较简单,并且在测量精度方面也能达到农业生产等自动化的使用要求超声波发生器可以分为两大类一类是用电气方式产生超声波,一类是用机械方式产生超声波电气方式包括压电型、电动型等;机械方式有加尔统笛、液哨和气流旋笛等它们所产生的超声波的频率、功率、和声波特性各不相同,因而用途也各不相同目前在近距离测量方面常用的是压电式超声波换能器根据设计要求并综合各方面因素,本文采用AT89C51单片机作为控制器,用动态扫描法实现LED数字显示,超声波驱动信号用单片机的定时器
4、进度计划序号日期进度安排113-14-1第16周止根据所出题目,结合自身所学知识,选择合适课题,确定毕业设计论文题目213-14-1第18周止联系指导老师,将自己的设计方案与老师沟通、交流,得到指导老师的认同与指点,开始设计313-14-1第19周止联系指导老师,将自己的设计方案与老师沟通、交流,得到指导老师的认同与指点,开始设计413-14-2第1周止根据方案,确定所要用的器材设计总体框架结构,分出各模块,并将其展开,以得到比较细的设计模式513-14-2第2周止根据所列框图,结合自己所学知识,开始各分支电路模块的设计613-14-2第3周止完成初稿,将所做的模块给指导老师查阅,看是否有不当之处,再进行改进并将大电路的设计方案告之老师,得到老师更好的建议713-14-2第6周止大胆进行设计,将每一个小的电路,大的模块,都精心设计好,完成整个硬件和软件部分的设计过程813-14-2第7周止将所有设计整理结合,形成设计论文,交与指导老师检查,并经老师指点,做进一步的改进工作913-14-2第10周止改进毕业设计论文,得到自己及老师认为满意的论文
10115、指导教师意见(对本课题的深度、广度及工作量的意见和对设计结果的预测)指导教师签字年月日
6、教研室意见教研室主任签字年月日说明开题报告应根据教师下发的毕业设计(论文)任务书,在教师的指导下由学生独立撰写,在毕业设计开始后两周内完成学生毕业论文(设计)题目更改申请表原毕业论文(设计)题目基于单片机的激光测距现毕业论文(设计)题目基于单片机的超声波测距更改原因理由首先激光测距仪成本较高,且制作的难度大,测量距离较短,需要注意人体安全,光学系统需要保持干净,否则影响测量精度而且单片机与激光测距仪的连接很复杂,我主要是利用单片机控制测距仪器,目的是对单片机的知识进行巩固和进一步学习,从而完成毕业设计学生签名日期
2015.
3.2指导教师意见指导教师签名日期教研室意见教研室主任签名日期院系意见论文负责人签名日期毕业论文(设计)指导教师工作记录由指导老师填写与学生见面、电话、网上指导的主要内容,原则上一周填写一次指导记录到中国知网和西南财经大学图书馆查阅资料,学习关于超声波的知识,弄清楚超声波测距的原理,然后搞懂各个模块的电路填写时间2015年2月28日教师签名学生签名指导记录大概弄懂各个模块的电路图及工作原理,选出一个最好的方案进行设计,有问题赶快问,不能等,在毕业设计中学到知识填写时间2015年3月8日教师签名学生签名指导记录根据自己设计的方案,完成毕业论文的初稿填写时间2015年3月18日教师签名学生签名指导记录填写时间年月日教师签名学生签名毕业论文(设计)指导教师工作记录由指导老师填写与学生见面、电话、网上指导的主要内容,原则上一周填写一次指导记录填写时间年月日教师签名学生签名指导记录填写时间年月日教师签名学生签名指导记录填写时间年月日教师签名学生签名指导记录填写时间年月日教师签名学生签名毕业论文(设计)指导教师工作记录由指导老师填写与学生见面、电话、网上指导的主要内容,原则上一周填写一次指导记录填写时间年月日教师签名学生签名指导记录填写时间年月日教师签名学生签名指导记录填写时间年月日教师签名学生签名指导记录填写时间年月日教师签名学生签名毕业论文(设计)指导教师工作记录由指导老师填写与学生见面、电话、网上指导的主要内容,原则上一周填写一次指导记录填写时间年月日教师签名学生签名指导记录填写时间年月日教师签名学生签名指导记录填写时间年月日教师签名学生签名指导记录填写时间年月日教师签名学生签名毕业论文(设计)中期检查记录学生填写前期工作小结完成的主要工作及质量,存在的问题和拟解决的方法指导情况□指导教师坚持每周指导,认真负责,要求严格□指导教师指导不够,要求欠严格学生签名年月日指导教师填写对学生完成任务情况的评价□按计划完成预定的工作内容完成质量□好□一般□差□未按计划完成预定的工作内容,主要原因指导情况□坚持每周指导,学生积极寻求和接受指导□学生寻求和接受指导主动性不够教师签名年月日院(系)中期检查领导小组填写对学生学习的评价□按计划完成预定的工作内容完成质量□好□一般□差□未按计划完成预定的工作内容对指导教师工作的评价□坚持每周指导,认真负责,要求严格,指导记录填写详实、规范□坚持每周指导,认真负责,指导记录填写不详实、欠规范□未坚持每周指导整改意见检查小组负责人签字年月日毕业设计(论文)指导教师成绩评审表评分项目分值得分评价内涵工作表现20%01学习态度6遵守各项纪律,工作刻苦努力,具有良好的科学工作态度02科学实践、调研7通过实验、试验、查阅文献、深入生产实践等渠道获取与毕业设计有关的材料03课题工作量7按期圆满完成规定的任务,工作量饱满能力水平45%04综合运用知识的能力15能运用所学知识和技能去发现与解决实际问题,能正确处理实验数据,能对课题进行理论分析,得出有价值的结论05应用文献的能力5能独立查阅相关文献和从事其他调研;能提出并较好地论述课题的实施方案;有收集、加工各种信息及获取新知识的能力06实验(设计)能力15能正确设计实验方案,独立进行装置安装、调试、操作等实验工作,数据正确、可靠07计算机应用能力5能运用计算机进行资料搜集、加工、处理和辅助设计等08对实验结果的分析能力(或综合分析能力、技术经济分析能力)5具有较强的数据收集、分析、处理、综合的能力成果质量35%9插图(或图纸)质量、篇幅5符合本专业规定要求10论文(或设计说明书)撰写水平10综述简练完整,有见解;立论正确,论述充分,结论严谨合理;实验正确,分析处理科学11论文(或设计)的实用性与科学性5具有科学性,有一定的实用价值12论文(或设计)规范化程度5文字通顺,技术用语准确,符号统一,编号齐全,图表完备、整洁、正确;用语格式、图表、数据、各种资料的运用及引用都要规范化13创新10对前人工作有改进或突破,或有独特见解是否达到答辩要求成绩评阅人评语评阅人(签名) 年 月 日毕业论文(设计)评阅人成绩评审表评分项目分值得分评价内涵工作表现20%01学习态度6遵守各项纪律,工作刻苦努力,具有良好的科学工作态度02科学实践、调研7通过实验、试验、查阅文献、深入生产实践等渠道获取与毕业设计有关的材料03课题工作量7按期圆满完成规定的任务,工作量饱满能力水平45%04综合运用知识的能力15能运用所学知识和技能去发现与解决实际问题,能正确处理实验数据,能对课题进行理论分析,得出有价值的结论05应用文献的能力5能独立查阅相关文献和从事其他调研;能提出并较好地论述课题的实施方案;有收集、加工各种信息及获取新知识的能力06实验(设计)能力15能正确设计实验方案,独立进行装置安装、调试、操作等实验工作,数据正确、可靠07计算机应用能力5能运用计算机进行资料搜集、加工、处理和辅助设计等08对实验结果的分析能力(或综合分析能力、技术经济分析能力)5具有较强的数据收集、分析、处理、综合的能力成果质量35%9插图(或图纸)质量、篇幅5符合本专业规定要求10论文(或设计说明书)撰写水平10综述简练完整,有见解;立论正确,论述充分,结论严谨合理;实验正确,分析处理科学11论文(或设计)的实用性与科学性5具有科学性,有一定的实用价值12论文(或设计)规范化程度5文字通顺,技术用语准确,符号统一,编号齐全,图表完备、整洁、正确;用语格式、图表、数据、各种资料的运用及引用都要规范化13创新10对前人工作有改进或突破,或有独特见解是否达到答辩要求成绩评阅人评语评阅人(签名) 年 月 日毕业论文(设计)评阅人成绩评审表评分项目分值得分评价内涵工作表现20%01学习态度6遵守各项纪律,工作刻苦努力,具有良好的科学工作态度02科学实践、调研7通过实验、试验、查阅文献、深入生产实践等渠道获取与毕业设计有关的材料03课题工作量7按期圆满完成规定的任务,工作量饱满能力水平45%04综合运用知识的能力15能运用所学知识和技能去发现与解决实际问题,能正确处理实验数据,能对课题进行理论分析,得出有价值的结论05应用文献的能力5能独立查阅相关文献和从事其他调研;能提出并较好地论述课题的实施方案;有收集、加工各种信息及获取新知识的能力06实验(设计)能力15能正确设计实验方案,独立进行装置安装、调试、操作等实验工作,数据正确、可靠07计算机应用能力5能运用计算机进行资料搜集、加工、处理和辅助设计等08对实验结果的分析能力(或综合分析能力、技术经济分析能力)5具有较强的数据收集、分析、处理、综合的能力成果质量35%9插图(或图纸)质量、篇幅5符合本专业规定要求10论文(或设计说明书)撰写水平10综述简练完整,有见解;立论正确,论述充分,结论严谨合理;实验正确,分析处理科学11论文(或设计)的实用性与科学性5具有科学性,有一定的实用价值12论文(或设计)规范化程度5文字通顺,技术用语准确,符号统一,编号齐全,图表完备、整洁、正确;用语格式、图表、数据、各种资料的运用及引用都要规范化13创新10对前人工作有改进或突破,或有独特见解是否达到答辩要求成绩评阅人评语评阅人(签名) 年 月 日毕业论文(设计)答辩申请表学生姓名 学号专业 论文(设计)题目 设计论文申请理由申请人(签名)年月日指导教师意见指导教师(签名)年月日教研室意见负责人(签名)年月日说明此表打印后用黑色或蓝色钢笔(或签字笔)手工填写专科毕业设计(论文)答辩记录表(由记录人使用)答辩小组名单姓名性别职称职务其他答辩记录记录人(签字)年月日专科毕业设计(论文)答辩成绩评审表(答辩小组用)评分项目分值得分评价内涵01答辩准备5准备充分02陈述表达10思路清晰;语言表达准确,概念清楚,论点正确;03选题5符合本学科的发展和培养目标,体现学科、专业特点和教学计划中对能力知识结构的基本要求,达到毕业设计(论文)综合训练的目的04设计(论文)思路10分析归纳合理,方案论证充分,实验方法科学05主要完成情况30圆满完成规定任务,工作量饱满,难度较大,具备综合运用所学知识和技能,有分析、解决实际问题的能力,论文(设计)有应用价值06回答专家提问20回答问题有理论根据,基本概念清楚,主要问题回答准确、深入,有逻辑性07论文书写质量5条理清楚,文理通顺,用语符合技术规范;图表完备、整洁、正确,书写格式规范08文献查阅5合理使用各种检索工具,能独立检索文献资料09创新10对前人工作有改进或突破,或有独特见解,有一定的应用价值成绩答辩小组评语组长签字年 月 日专科毕业设计(论文)成绩评定表(答辩委员会用)题目名称姓名学号专业评分项目评定成绩各项成绩所占比例实际得分指导教师评分30%评阅人评分评阅人130%评阅人2答辩小组评分40%成绩等级结论是否同意毕业设计(论文)通过□同意□不同意(□重新修改□重新答辩)院(系)答辩委员会主任签字年月日院(系)公章说明
1.毕业设计(论文)的成绩应由指导教师、评阅人、答辩小组三部分的评分组成
2.成绩折算标准优→=90分、良→=80分、中→=70分、及格→=60分、不及格→60分。