还剩16页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
数据挖掘公司和产品以下介绍分别按公司、数据挖掘工具及其特点、应用行业案例三个方面
1、ANGOSS软件公司KnowledgeSTUDIO平台NT,Windows9X功能CHAID算法,支持PMML,留有与SAS、S-Plus的接口,能够灵活地导入外部模型和产生规则,包含神经网络建模的能力优点响应快,模型、文档易于理解,决策树分析直观/性能良好,SDK中容易加入新的算法缺点决策树不能编辑打印,SDK缺乏数据预处理阶段的函数,没有示例代码,不支持AIX应用行业案例
1.Frost National银行CRM收益率、客户满意度、产品功效
2.SASI公司利用SDK开发行业数据挖掘应用软件零售行业
3.Montreal银行客户分片、越区销售模型、市场站的准备、抵押支付的预测、信用风险的分析
2、Business ObjectsBusinessMiner
4.1平台Windows平台,支持多数据源功能直观的决策树技术,提供所有的分类数据挖掘功能,包括建模、发现、可视化、假设分析和分片支持RDB、DW、OLAP、文件优点易于使用,价格便宜5,文档齐全缺点只具有决策树功能应用行业案例DJ WADEASSOCIATES是一个数据仓库和商业智能咨询公司,利用BO公司的产品做商业智能解决方案国际上大约有7000多公司在使用Business Objects
3、Cognos公司Cognos Scenario平台Windows平台功能Scenario是基于树的高度视图化的数据挖掘工具,决策树的基本功能是创立一系列标准,预测记录中目标市场的价值Scenario的分类树分阶展现各种因素;最终用户通过挖掘或展开树的分支来探察数据特点Scenario的抽样技术可以用最少的处理开销和最短的响应应用行业案例企业经理们可以利用Scenario的统计方法,深入挖掘影响商务趋势的因素的潜在含义,根据风险特性将个体与群体客户归类;将商务因素分门别类,辨清商务目标所受的主要影响;探察与通常数据模式不符的异常情况等Northwood公司利用该产品发现影响树木死亡率的模式和因素时间得出最精确的结果给各种因素定级
4、Comshare,Inc.Comshare Decisionand DecisionWeb CommanderFDC/EIS Decision平台LAN-客户端Windows9X,服务器NT,Internet-Web服务器功能具有强大的分析能力,包括grids,钻入,旋转,图表,映射,特殊计算,等内置引导分析功能,交互式分析多维数据优点易于使用,安装简单缺点ICE智能组件扩充按钮在DecisionWeb中不可用,文档不全面应用行业案例VDK冷冻食品公司利用COMSHARE DECISIONAND DECISIONWEB进行决策分析Welch Allyn公司利用FDC/EIS Decision进行金融决策分析
5、DataMind CorporationDataCruncher平台Pentium PC功能特殊的报表优点响应时间快,能将数据挖掘报表转化成HTML格式缺点图形界面不友好,难操作应用行业案例ADP集团利用Data Cruncher分析客户定单及交易数据,提高客户满意程度
6、DBStar DBStarMigration Architect平台Sun Sparc20/Solaris,HP/UX IBM/AIX功能数据分析工具,发现数据质量问题以及数据元素和其它内在的数据驱动的商业规则之间互相依赖的关系在多个源数据与统一的目标数据之间建立映射数据仓库的数据抽取和转化功能优点可靠地决定数据质量,实时跟踪数据的改变并维持数据的一致性不是使用元数据,而是利用实际数据进行细节数据分析缺点Motif用户界面使用不直观应用行业案例某零售、投资、以及代理服务的金融服务公司利用DBStar的Migration Architect进行数据仓库项目的开发
7、Group1Software MODEL1平台Windows NT,Windows9X Indiana大学的Kelley商学院使用MODEL1作为MBA数据挖掘教学软件教学生如何分析客户数据库得出新的建议、保留老客户、最功能灵活的数据抽取能力,数据编辑器能够创建新的数据变量,扫描无效数据产生基本的线图、柱状图、稀疏图表、均值、和频率分布、以及lift图表具有客户分片模型、响应模型、交叉销售分析和客户评估适合多种预言模型包括RFM,Bayes,线性和logistic回归,神经网络,CHAID andCART模型优点易于使用,广泛的模型具有友好的wizard建模过程询问数据的格式和希望分析的层次可以定制建模过程非常适合直接市场应用缺点不适合纵向数据的时序分析,不能创建Script自动执行用户经常使用的一系列命令,价格昂贵,用户不能直接编辑报表,数据转化复杂,用户必须将外部数据转换为固定格式的文本文件才能进行挖掘应用行业案例大化客户的生命周期价值,从而作出一对一的市场学生分析人口统计数据、POS交易数据、商品目录和经常购买的数据利用MODEL1做客户分片,分析过去推销的商品的有效性,定位将来的市场,增加交叉销售,标记最有价值的客户Fort WorthStar-Telegram是新闻单位,利用MODEL1进行数据库营销DRG集团是出版公司,利用MODEL1进行MAIL战略
8、Hitachi DataSystemsHDSHDS5780Nucleus ExplorationSeries平台64-bit UNIX,32-bit Windows NT,个人版本-Windows9X功能数据仓库建模优点简化了数据仓库的逻辑和服务模型设置,性能高,能够查询压缩数据缺点1小时装载
1.5G数据,速率慢,可能由于压缩的原因First CitizensBank利用该产品建设数据仓库应用行业案例Canadian NationalRailwayCN加拿大国家铁路局利用该软件产品构建数据仓库H
9、NC Software,Inc.Falcon Retail平台IBM mainframe或UNIX功能神经网络优点减少人工分析的劳动力缺点分析过程难以理解应用行业案例Sears,Roebuck andCo.公司是大的服饰、家庭和汽车零售商,利用该产品分析其忠诚卡交易的欺诈行为
10、IBM Intelligent Miner平台AIX,Window NT,OS/390,Sun Solaris功能自动实现数据选择、数据转换、数据发掘和结果呈现这一整套数据挖掘操作具体算法包括典型数据集自动生成、概念性分类、聚集人口统计分析demographic、神经网络、分类树归纳和神经归纳、估值、关联规Decision Edgefor Finance--专门为金融行业设计的综合解决方案Decision Edgefor Finance不仅仅是简单的报告工具,它提供了行销经理所需的全部技术,以制定战略业务决策并开展行销活动Decision Edgefor Insurance--端到端的解决方案,包括硬件、软件、顾问和服务,其设计目的是帮助保险业行销经理制定战略业务决策并开展行销活动则、序列模式、预言模型,以及结果可视化呈现优点Intelligent Minerfor Text可以提供一定程度的定制,具有可扩展性,索引的速度很快,具有先进的语言分析能力、聚集和过滤能力Intelligent Miner有强大的API函数库,可以创建定制的模型能够处理巨大的数据量,同时支持并行处理,查询速度很快缺点IntelligentMinerfor Text图形界面GUI不友好,spider和indexing管理需要对UNIX非常熟悉对一个挖掘对象将多个挖掘操作一起执行批处理比较困难元数据不开放,结构复杂文档缺乏错误代码的详细解释没有对算法的详细说明IBM DiscoverySeries forBanking--为满足客户至上的银行业需求而设计的应用程序套件IBM Discoveryfor telecommunications--为电信行业提供完美的客户服务的应用程序套件Business AnalysisSuite forSAP--适用于下列公司已经安装SAP事务处理系统,并需要建立数据仓库,以充分利用日常运作中收集的所有事务数据Surf-Aid--数据采集应用程序,用于分析Web站点利用率Info PrintBusiness IntelligenceSolution--允许企业将自定义消息、姓名及地址同图形和条形码相结合,向客户提供有独特个性的行销资料Global ServicesBI Offering--包含不同角度行业、业务功能、技术的战略和规划功能,以及帮助客户理解和解决业务困难、管理数据仓库项目、开发和实现先进分析功能的方法Insurance UnderwritingProfitability Analysis-将数据仓库和数据采集技术相结合,帮助保险业执行人员处理保险业过程
11、Information Discovery,Inc.PatternWarehouse Retail Sales Forecasting System平台Solaris,Retail SalesForecasting System运行在Intranet的Web服务器上功能PatternWarehouse提供商业用户迅速访问已经获得的模式客户行为,product usageaffinities,生命周期,等等PatternWarehouse提供PQL-模式查询语言,查询模式,就象用SQL语言查询数据一样操作循环如下数据挖掘在每周/月定时执行,发现的模式存储在模式库中,模式周期性增加组合和趋势分析,用户查询已经挖掘的模式库,而不是关系数据库基于Java技术,在、查询通过Intranet的Web浏览器接口优点模式存储起来,对于紧迫的问题不需重新计算数据挖掘是对整个数据库,不是抽样或抽取部分数据模式存储在一个中心仓库,确保了统一的视图报表用浅显的语言和图形自动产生缺点较难向用户解释PatternWarehouse和数据仓库框架的区别,在从事数据挖掘项目没有一个好的顶层的体系结构应用行业案例E*TRADE是一个网上投资服务公司,随着基于Web的金融服务竞争的加剧,数据挖掘技术构成了制胜的资本,E*TRADE利用patternwarehouse数据发现系统对客户行为进行分析,制定合适的市场策略DeereCompany是农业工具零售公司,利用RetailSalesForecastingSystem成功地预测了其拖拉机产品的第二年的销售
12、John GaltSolutions,Inc.ForecastX Wizard平台Windows,UNIX,可以和Microsoft Websolutions,Windows95,Windows NTand ArborEssbase,SQL Server,Oracle等集成,开发工具VB,Java.功能ForecastX包括核心的预测技术和统计分析有广泛的应用金融计划、风险分析、销售预测、需求计划、生产计划,以及统计建模ForecastX是一个分布式对象,可以和运行在UNIX或Windows上的应用程序集成具有强大的预测引擎,包括30多个统计功能优点没有数据量的限制,量的大小处决于运行的计算机即使没有统计知识也能进行复杂的分析对象模型易于导航,性能显著缺点产品文献只有HTML格式,没有易于操作的帮助对于同一个问题有多种解决方法,很难判断哪一种解决方法好应用行业案例HITechnologies公司是一个市场咨询公司,利用ForecastX的预测控件组件ActiveX开发HITools EnterpriseSuite,该软件提供供需链管理,制定供需计划,增加管理one-to-one市场的能力GTE是一个电信公司,整个市场分为四个部分无线、ISP、长途和本地电话,GTE利用ForecastX预测各项产品和服务的增长和收入
13、Magnify.com PATTERN平台Windows NT/9X功能软件包括数据预处理、预言建模、以及模型配置和打分建模组件能够分析T级别的数据和支持多种数据挖掘算法pattern能够将许多不同的模型的最好的因素连接成一个全体的模型有特定行业的模型模板模型配置和打分组件能够对模型进行修改,同时也能配置SAS和其他流行的建模工具构造的模型优点精确性高,能处理T级别的数据缺点GUI不友好,命令行接口比GUI容易使用目前版本只支持Windows,今后会支持Unix应用行业案例Polk是一个多媒体智能信息解决方案提供商有超过111million个家庭的人口统计和生活方式的数据库,利用pattern预言对一个直接MAIL营销的响应
14、MapInfo CorporationTargetPro平台Windows NT,Windows9X功能将人口统计demographic数据按照地图的格式可视化,Meineke是一个汽车销售和修理的连锁公司,利用TargetPro分析demographic数据,作市场决策能够创建高质量的地图,帮助决策制定和增强报表和表达方式优点能够分析超过600个变量,响应速度很快缺点操作手册不详细
15、Market MinerFormerlyAbTech Corp.ModelQuest Expert平台Windows NT.功能用C语言表达预言方程equation,这些方程能够和数据仓库集成,用于计算预言值,然后用这些预言值来作为数据仓库选择数据的条件优点预言功能可靠性高,模型开发的速度快缺点预言变量类型的转换对用户是非常麻烦的应用行业案例ASC公司为客户提供数据库营销服务开发和实现客户的预言模型,以提高其营销的效率ASC公司需要一种快速有效的方式构建预言模型,并且已经运行神经网络很多年,在对ModelQuest Expert测试后,发现它缩短了预言模型开发的速度,并且其有效性在实际的营销策略得到了验证
16、MathSoft,Inc.StatServer S-PLUS
4.5Professional for Windows S-Plus forUnix
5.1平台StatServer只能运行在Windows NT,其它产品能够运行在UNIX、Windows NT/9X功能StatServer是一个数据挖掘引擎和事务服务器,用户能够通过多种客户端浏览器,MS Excel等等进行统计分析和信息可视化对于StatServer而言,客户统计模型和数据挖掘程序固定在S-PLUS语言内,存储在中心服务器上分析通过S-PLUS引擎运行在服务器端,结果返回给客户端StatServer能够通过多个数据源抽取数据,也能通过客户端上载数据StatServer能够让组织开发、维护、配置定制统计分析和可视化方法StatServer适合NT体系结构,提供了一个强壮的报表环境和MS ASP引擎相互补充服务器端工具的组合MS IIS,MS ASP,COM businessobjects,MS TransactionServer,StatServer,以及关系数据库,比如MS SQLServer、Oracle和简单的客户端构成了一个灵活的、强壮的、可扩展的远程数据挖掘和图形报表系统S-PLUS是一个包括S语言、SQL和统计包混合的系统,能够用可视化的方式勘探数据具有import/export的功Waratah公司提供统计、数据挖掘、数据仓库、以及软件开发服务在为一个健康中心开发应用的时候,利用StatServer开发定制的基于浏览器的客户端应用,以分析和可视化病人的数据另外也为一个制药公司分析其实验数据Waratah主要利用StatServer进行二次开发,因为其客户端是浏览器或者MS Excel,用户能够方便地使用Federal CommunicationsCommission为了利用信息进行决策分析,该单位的经济学家利用S-Plus解决统计和经济分析问题Maple PartnersFinancial Products利用S-PLUS创建和测试定量的贸易模型应用行业案例Cereals是一个食品公司,其基因研究利用S-PLUS软件的数据挖掘功能分析大米基因数据使用了mapping和sequencing技术Pillsbury是一个食品公司,利用StatServer和S-PLUS创建基于Web的数据分析环境能S-PLUS既具有基于Windows的图形接口,又有命令行接口支持多种数据库的数据格式S语言专门用于向量编程和分析,已经和Windows风格的界面集成强大的图形功能包括画刷brushing,旋转spinning,plotting amatrixof pairs,contour maps,heat maps、interpolated surfaces优点StatServer COM对象模型是一个很好的编程接口S-Plus非常精确图形、数据对象、分析结果都能和微软的程序集成,比如PowerPoint、Word、ExcelImport/export的功能缩短了数据移动的时间和开销缺点StatServer需要充分的资源和一台专门的服务器StatServer不是一个service,需要登录进入StatServer这台计算机启动程序,有时会象NT一样出现问题,需要重新启动S语言的灵活性使得有时很难指出如何写一个特定的程序整个系统过于复杂,目前不支持Linux
17、Maximal InnovativeIntelligence Ltd.Max平台Microsoft NT,Microsoft SQLServer
7.0OLAP Services.功能可视化的多维分析功能具有友好的wizards导航优点Max自动地汇总数据,易于使用Find Similar分析特别有用,因为它能迅速地发现异常情况缺点MAX是一个客户端程序,客户端开销很大报表能力应该被提高,2000年的产品和MS Office能够集成应用行业案例Afek InformationSystem EngineeringLtd是一个计算机咨询公司提供多方面的解决方案,包括计算机系统分析,信息系统开发,ERP系统实施,以及物流项目管理和实施利用Max进行图形化的多维分析,而不需要分析专家Spiritus TradingLtd.是PC机及外围设备贸易公司利用Max分析客户和供应商的数据
18、Megaputer Intelligence,Inc PolyAnalyst Pro TextAnalyst平台Windows NT功能PolyAnalyst提供下列功能数据访问、数据操纵和清洗、机器学习、可视化和报表直接访问与ODBC兼容的各种数据源,数据和挖掘结果能够与MS Excel集成提供构造数据子集和变量转换的功能数据分析自学习引擎包括PolyNet预言器,GMDHGroup MethodData Handling和神经网络混合的方法,基于演化编程技术-Wisconsin-Madison大学UW MedicalSchool和School ofNursing的Research Designand StatisticsUnitRDSU为生物医药研究提供高层的统计和设计支持典型的生物统计技术过于复杂,神经网络难于理解,所以利用PolyAnalystPro基于符号知识技术发现规则和结构目前该软件在肾脏学nephrology,小儿科pediatrics以及phonology/communicative disorders运行的非常成功Boeing公司是世界最大的航空公司将多个复杂的系统集成在一起是其成功的基础之一,工程组希望找到一种工具,能够迅速地构建非线性过程的模型作为内置实时系统的一部分传统的曲线配置curve发现规律,发现依赖关系的勘探引擎,分类引擎,聚集引擎,以及多参数线性回归以发现数据中的线性关系PolyAnalyst具有集成的GUI环境发现规律引擎,利用了符号知识获取技术SKAT,自动化地发现数据中的依赖关系和规则,并且用清晰的数学语言表达PolyAnalyst是一个多策略的数据挖掘解决方案能够处理数字、种类、布尔型变量任何一个引擎都能作为一个单独的COM组件,COM组件能够和其他软件集成TextAnalyst在一个知识库上使用,包括问题的文本描述,内容分析、创建语义网络优点图形接口友好,各种建模技术易于掌握发现的规则用一种标准符号表达,适合在其他平台编程,增加了产品的可用性缺点PolyAnalystPro
3.5缺乏将表达式剪切并且粘贴在其他软件中的能力打印不方便、不灵活,需要增加数据和模型的编辑以及清洗的功能基本的统计功能不够强大TextAnalyst不能和其他软件集成fitting和神经网络技术开发需要很多时间,并且代价昂贵PolyAnalyst的符号知识获取技术发现规律算法提供了一种很好的性能和复杂性的平衡LLC公司的仙人掌策略Cactus Strategies是一个咨询解决方案,该方案集中在创建启发式预言商业工具和模型、商业开发和电子商务解决方案和应用Cactus Strategies提供的商业工具最关键的一个特点是能够从通常的人口信息和合同信息以及客户描述信息中精确地选择最有可能响应的客户PolyAnalyst是工具启发能力的核心,它能周期性地从数据中建模和给记录打分应用行业案例BioVisioN是一个生物研发公司,目标是使药物发现和诊断方面的技术商业化,对标识peptides缩氨酸和蛋白质proteins有很高的技术,由研发产生了大量数据BioVisioN利用PolyAnalyst分析各种疾病在人体血液和尿液中的模型发现疾病的关联,以寻找诊断方法
19、MIS AmericaformerlyMIS AGMIS Alea andMIS DeltaMiner平台Windows功能DeltaMiner是一个激活的搜索代理,专门用于异常报告、控制和分析MISAlea是一个多维应用/服务,在Microsoft Excel的环境内处理商业模型优点维度非常灵活,具有定制的功能wizard和menu驱动非常友好缺点需要一定的专业技能才能掌握该工具的各种功能应用行业案例HP公司利用该软件发现对中小企业的销售趋势,发现问题,作出预测
20、Oracle Corporation/datawarehouse/products/datamining Darwin平台Windows NT/95client/server,UNIX Sun Solaris,HP-UX支持单个或多处理器环境功能通过ODBC访问ASCII和RDBMS数据构造模型的过程有wizards引导Darwin
3.5支持数据挖掘算法神经网络,分类和回归树,K-最近邻居、遗传算法、基于记应用行业案例Two Crows公司是专门的数据挖掘和数据仓库市场分析和咨询公司Two Crows和财富1000强公司合作,帮助他们开发数据挖掘策略、选择产品和实施数据挖掘解决方案,同时也和数据挖掘软件商合作帮助他们理解客户需求公司需要理解客户,使得能够有效地获取新的客户、在原有客户上获得更多赢利、防止客户流失行业研究表明获得一个新的客户必须花费维持一个老客户的5-6倍开销,公司目前都想求助于数据挖掘来提升客户关系管理海量数据和成百个变量忆的推理memory-based reasoning、聚集和贝叶斯算法Darwin使用MS Excel作为可视化数据挖掘结果和基于MS IE在线帮助Oracle选择TMCThinking MachinesCompany最为合作伙伴Darwin的模型探索器Model Seeker和关键领域导航Key Fieldswizards,交互式的树显示interactive treedisplay,lift charts,灵敏度分析sensitivity analysis,ROI和margin graphs,error tables和决策树规则decision treerules是非常直观和可靠的模型能够作为C,C++and Java代码导出,从而将customer scoring,campaign management和real-timeintelligent agents与企业其他应用程序集成,比如Call Center等模型探索器能自动构建多个模型,并且为用户选择最好的一个工作流Workflow和scripting的特点提供了一个数据挖掘步骤的可视化描述和自动的数据挖掘过程优点三个关键强势高度的可扩展性,由于能够使数据挖掘算法并行实现,所以能够挖掘海量数据;第二,模型能够容易导出,和其他应用集成;第三是Windows风格的客户端易于使用缺点缺乏在数据挖掘之前对数据的可视化探索工作流不能可视化编辑对数据挖掘软件是一个挑战Two Crows公司对Darwin进行测试,结果如左所示Cabletron SystemsNYSECS公司是提供基于intranet网络解决方案LAN、ATM和软件,SPECTRUM EnterpriseManager是该公司的网络管理平台软件,24小时收集网络数据事件、警告、统计信息,然后上载到一个离线的数据仓库供分析使用,由于200个左右的应用软件收集数据,所以数据量非常大利用Darwin发现各个网络端口的相关性以及事件相关性,以发现网络故障诊断模型,提高网络的有效性Nautilus Systems,Inc.是数据仓库和数据挖掘咨询公司,构建11的市场和客户关系管理解决方案,针对行业包括医疗健康、金融、电信、政府应用Darwin作为数据挖掘软件
21、Pilot Softwareacquiredby AccrueSoftwarePilot DecisionSupport Suite平台Windows NT功能基于Web的商业智能解决方案PDSS能够执行时序分析,作假设what-if分析,通过建立地区、时间、产品和其他种类的维度获得详细的信息-多维分析工具优点公司不仅在技术上,在商业上也有很深入的理解报表能够定制缺点多层次功能在第二层次上不能按条件排序Combe公司是家用和宠物商品的生产销售商为了理解客户购买模型,利用PDSS作时序分析也有利于很好地管理库存,有助于定制生产计划利用时序分析跟踪每年客户购买模型的改变
22、Quadstone,Inc.Decisionhouse平台UNIX,NT功能Decisionhouse是一个客户行为建模的软件集,能够发现关Liverpool VictoriaFriendly Society是一个金融协会,对2百万个客户提供投资、存款和保险服务利用Decisionhouse进行客户关系管理,使合适的客户购买他们需要的商品,一个结果是直接MAIL项目响应率比原先提高了35%键的特征,比如标记可能有defect的客户、或者哪些客户有较高的可能性购买特定的商品Decisionhouse是CRM策略的关键部分功能包括查询、报表、数据挖掘、OLAP和可视化Decisionhouse将数据转换成易于理解的3-D图形表示根据目标对象比如响应率或预言值可能值标记高的和低响应率的客户分组和客户定级通过OLAP的功能,Decisionhouse提供一种机制报告在实际的响应之后标记和理解详细的行为模式的成功率和机会功能还包括客户分片和定位,客户行为的多维可视化,交叉表格报表cross-tabulated reports,决策树分片和响应模型,mailing andcontrol celllists优点实时、高速的客户分片和描述易于使用的可视化界面缺点没有使用神经网络技术,以避免黑盒问题没有内置的方法协助执行典型的分析,比如mailing response,campaign creation.Decisionhouse创建了大量文件,这些文件需要专门培训过的人员才能熟练掌握CA是欧洲出名的零售商,成立于1841,公司在12个欧洲国家有579个商店CA每年有两个主要的direct mailcampaigns使用Decisionhouse和Quadstone公司的应用行业案例咨询,提高响应率目前,响应率增加2倍左右,赢利率提高了20倍California SanFrancisco的CustomerLinx是一个基于知识的市场服务公司,提供多模式的客户分析,包括inbound andoutbound fax,IVR andInternet responseservices基于各个渠道的客户分析,为不同的行业提供以客户为中心的市场解决方案,包括电信、零售和电子商务为了定位客户获取和流失问题customer acquisitionand churn,CustomerLinx开发了客户中心解决方案面向客户市场的核心是the abilityto tailorthe offer,message orchannel toindividual customerneeds,这些需要有效的客户分片技术利用Decisionhouse来解决上述问题,使得CustomerLinx近来campaign responserate从
0.8增长到4%
23、Salford SystemsCART Decision-Tree Suite平台Windows NT,UNIX功能桌面型CART和Unix版本两种都能产生cut-and-paste模型的源代码CART能够处理脏数据TreeCoder自动产生SAS代码优点精确的模型能够迅速地开发和实施缺点分类问题涉及yes/no或A orBor C的种类目标变量,回归定位连续型目标变量,比如花费的金额等CART或任何其他决策树在回归问题上都处理得不好为了克服这个缺陷,Salford Systems近来开发了MARS,一个数据挖掘工具以解决回归问题American Express是全球旅游、金融网络服务提供商利用CART进行数据分类,构建决策树,以提高赢利
24、SAS Enterprise Miner平台Windows NT功能EnterpriseMiner为所有的模型开发产生全部的记分代码,这些记分代码能够立即应用到新的数据中一个评Vermont CountryStore是一家面向家庭的零售公司利用数据挖掘工具EM定位target-mail和marketing strategy估工具将数据挖掘结果转换成商业术语,结果能够通过Web共享SAS的数据挖掘方法论称作SEMMA抽样、探索、修改、建模、评估SAS/EM集成了数据获取工具;数据取样工具;数据筛选工具;数据变量转换工具;数据挖掘数据库;数据挖掘过程;多种形式的回归工具;为建立决策树的数据剖分工具;决策树浏览工具;人工神经元网络;数据挖掘的评价工具可利用SAS/EM中具有明确代表意义的图形化的模块将这些数据挖掘的工具单元组成一个处理流程图,并依此来组织用户的数据挖掘的过程这一过程在任何时候均可根据具体情况的需要进行修改、更新并将适合用户需要的模式存储起来,以便此后重新调出来使用优点图形化的界面,可视化的操作,可导引即使是数理统计经验不太多的使用者也能按照SEMMA的原则成功的进行数据挖掘对于有经验的专家,SAS/EM也可让用户一展身手精细的调整分析处理过程缺点临时文件花费了许多空间,打印决策树比较困难
25、Seagate Softwaredivisionof SeagateTechnologySeagate Holos平台Unix,Windows,RDB,MDB功能将关系数据库中的数据转换成OLAP cubes,然后装载到Seagate Holos客户端分析可以定制支持ROLAP和non-ROLAP数据可以周期性的装载到系统有自己开发的语言,使得客户能构造和定制复杂的企业商业智能系统优点混合的OLAP结构缺点培训该软件需要时间和专业技能应用行业案例Charles Schwab利用该软件进行多维分析,创建报表和模型,预测趋势
26、Search SoftwareAmerica Data Clustering Engine平台AIX,Unix功能产生ASCII文件,可以定制开发将输入文件增加clustering key然后输出,为其标记打分,然后产生报表不管数据质量如何,该软件都能将记录分组IBM Brazil是一个计算机公司,用IBM的产品构建解决方案使用DataClusteringEngine将公司合同的副本转换成外部文件,导入marketing系统的数据库优点易于使用缺点不能访问关系数据库,不能执行scrubbing.
27、Silicon GraphicsInc.SGIMineSet平台Unix,OpenGL功能将可视化方法和数据挖掘技术联合起来有灵活的定制可视化报表的功能,产生预言模型,将结果以可视化方式表示优点数据可视化将数据转换成易于理解的图形图形用户接口非常优美缺点是一个通用的数据挖掘工具,没有针对特定行业定制的应用对RAM非常敏感,至少需要1G的内存运行在多线程的模式应用行业案例ProcterGamble是制药企业,用MineSet分析由临床药物试验产生的数据库,以理解药物和人类疾病之间的关系,提高药物试验的有效性Incyte是一个生物软件公司,Incyte的基因数据库、生物分析软件、生物学试剂和microarray服务被全世界19家顶尖的制药和生物技术公司使用为了挖掘基因数据库,以理解基因和疾病的关系,发现新的基因模式和克隆新的基因,将MineSet作为公司开发的LifeTools3D的一部分New York,RGI Informaticsspecializes使用MineSet分析各种healthcare数据集claims-based encounterand drugdata,hospital dischargedata,data residingin aclinicalinformation database.
28、SLP InfoWare,Inc.Churn/CPS平台HP,SUN,IBM RS
6000.OSWindows95,Windows NT,UNIX.功能对客户分片和记分,构建模型预言客户流失,计算客户生命周期值,推荐最佳解决方法Churn/CPS自动分析客户行为信息,决定在客户流失背后的原因,分析的结果用来创建最有可能流失的客户的行为模型对这些客户提供更经济的服务或者cross-sell和upsell这一类附加服务Churn/CPS标记最有价值的客户,输出有可能流失的客户列表,并说明最有可能的原因优点灵活地创建客户行为模型,易于使用缺点少量的bugse应用行业案例Bouygues Telecom是电信公司,具有超过300,000个客户,利用Churn/CPS分析客户流失,作出相应的市场营销策略Cellular One是cellular供应商,占有超过50%的市场目前还经营cellular,beeper,long distance,prepaid cellular,prepaid longdistance和CAP servicesRetention部门使用Churn/CPS作客户流失分析,以保留现有客户
29、SpeedwareVisionize.comVisonyze Televyze平台客户端Win
3.11,Win95,NT.服务器AIX,HP-UX,Sun,NT.GTE公司是世界最大的电信公司之一,在28个洲有21million电话客户利用Televyze跟踪从部门到单个员工的provisioning/maintenance activity成绩市场部门利用该软件为特功能Televyze的图表和图形的格式称作a briefing board在这种格式的图表或图形上可以钻入了解更细节的层次drill-down可以定制个人的briefing board简报板,并且有突出和自己相关的数据和模型的功能优点从多个数据源抽取数据,briefingboard格式的结果易读,各种报表有标准的模板,用户可以自己定制简报板缺点遗留文件必须每天装载,不能实时处理定的客户分片和区域定制offerings
30、SPSS,Inc.Clementine SPSSfor Windows平台Server Windows NT,Novell,UNIX.Client Windows95,Windows NT.功能SPSS是数据清洗、数据挖掘、统计分析工具Missing ValueAnalysis分析大数据集内的模式和内部关系,然后估算遗失的值在SPSS Base中实际的数据挖掘产品AnswerTree,Clementine andGoldMiner具体技术Kohonen神经网络,回归,因子分析,决策树,聚集,关联规则,规则归纳,单调回归,OLAP环境SPSS分析也产生数据库记分database scoresSPSSforWindows将多个数据源的数据迁移到一个通用的数据集用于分析,分析功能包括basic frequencydistributions tocorrelations,regression和the moreadvanced econometricmodelingSPSS能够创模型的图形描述,并导出到PowerPoint Clementine发现的模型能够转换成C语言代码,方法论-数据挖掘流方法stream approach优点界面友好,不需要编程,统计功能强大缺点有两个环境SPSS DataEditor是主要分析数据的电子数据表环境;SPSS OutputNavigator是所有的输出的仓库用户很难知道选择存储时存储的是什么信息,即存储输出和存储数据比较容易混淆应用行业案例American CenturyInvestmentsACIis多方位的金融服务商客户数据交易数据transactional data,人口统计数据demographic,从数据提供商购买的行为数据behavioral datapurchased fromdata providers先创建数据仓库,然后利用SPSS软件进行挖掘,分析客户行为,作出智能决策Meridian ResourceCorporation是一个多方位的健康咨询公司利用SPSS分析healthcare数据解决以下问题1确保数据的正确完整;2决定数据中是否存在关系3决定这些关系是否有意义美国HSBC Bank有多于
1.4million个人银行客户,另外还有商业和公司客户使用SPSS的数据挖掘工具分析客户,发现模型三年内增加了15%的销售量,50%的客户有cross-selling的机会,留住了更多的客户GfK是欧洲最大的市场研究机构四个策略商业单元consumer shoppingbehavior,consumer mediabehavior,retail trackingand adhoc research.最近提供数据挖掘服务称GfK ConsumerConsult,Clementine是核心软件BT,英国电信使用Clementine作客户分析,定位direct mailcampaign
31、SRA InternationalKDD Explorer平台Sun SparcStationworkstations.功能KDD Explorer工具集提供了一个构建欺诈检测和知识发纳斯达科NASDNASD Regulationanalysts使用KDD Explorer作为for股票市场潜在欺诈的监督软件现的环境欺诈检测通过规则和序列匹配算法,检测数据库中的实例,匹配那些有可能是欺诈的模式用Java开发,可以定制可视化界面知识发现组件包括决策树,关联规则优点在大数据集上高性能、可以定制的数据挖掘和欺诈检测能力算法能够在并行机上运行用户接口用Java开发,能够运行在多个平台上,模式用自然语言表达易于理解缺点不能嵌入其他应用程序,没有数据预处理的能力
32、thinkAnalytics CorporationK.Wiz平台Windows NT
4.0功能作为back-office关键工具定期自动分析客户交易数据构建预言和商店的概要信息这些信息和零售报表环境集成基于Java的API优点可视化的编程环境,基于java的API缺点由于基于Java的解决方案,GUI响应较慢Triversity公司是brick-and-mortar和click-and-mortar零售商,有400员工,32个国家的350个客户,25,000个商店,120,000terminals和每年1忆笔交易Retailers公司使用K.wiz理解和管理客户忠诚度程序,分析客户购买行为和人口统计信息
33、Unica CorporationAffinium ModelformerlyModel1平台Windows9X/NT功能包括4个模块响应模型,交叉销售,客户评估,分片和概貌算法的参数能够手工设置也能自动生成记分wizard自动做所有的数据转换和预处理工作,能够对整个客户数据库迅速并且精确的记分Model1是一个为市场营销应用的数据挖掘软件Response Modeler模块基于客户历史响应结果预言客户响应,;Customer Segmenter将相似客户分成组,并且解释组间的不同;Customer Valuator预言一个客户的生命周期值;Cross-Seller预言客户可能会购买与定单上相关的商品Model1产生模型和分数,能以un-time library或C语言代码输出模型优点运行快速,界面直观,导入数据、建模、报表、和记分的wizards非常友好,易于使用缺点模型不能直接导出到Microsoft Excel报表标签在系统中不能定制Custom Research,Inc.CRI为财富500强企业提供市场营销、客户满意程度、和数据库分析服务利用Model1提供1统计方法,2cross-validation DMW是一个Top TenDirect ResponseAgency,为不同行业的客户开发direct responsesolutions,包括financial services,healthcare,insurance,utilities,telecommunications,business-to-business andnot-for-profit.应用行业案例DMW Worldwide使用Model1帮助客户理解他们的顾客数据中的模式分片和描述分析segmentation andprofile analysis理解各组顾客的属性和区别;响应模型预言市场营销offers的响应;客户流失模型预言顾客磨损attrition,;cross-sell模型决定什么商品销售给哪些客户;lead conversionmodels决定公司应该在什么地方追加投资
34、Urban ScienceApplications Inc.GainSmarts平台Windows NT,SunSolaris,Compaq True64,IBM AIXand HP-UX.功能是SAS基础上进行二次开发的数据挖掘软件能够在一个抽样数据集上构建模型,然后导出scoring code为整个数据库使用GainSmarts提供的建模方法binary logisticregression,神经网络,决策树在建模前执行变量转换,interaction checking,统计测试开放式体系结构,提供基于文本的报表,包括gains tables和graphs.优点易于使用,可扩展,logistic模型功能强大缺点建模过程没有可视化,不能在一个项目中创建多个模型,不能合并多次运行的结果Australia-based MorrisInternational业务包括direct marketing,property,manufacturing,information technology,venture capital.direct marketing传统的方法是RFMrecency,frequency andmonetary,现在利用GainSmarts数据挖掘的方法,构建预言模型
35、Visible Decisions,Inc.In3D,C++Edition
2.0平台最小需求Pentium DesktopPC功能Visible DecisionsIn3D是一个创建3维商业可视化解决方案的开发的工具从多个数据源的数据迅速地映射成直观的3-D可视化表示能够嵌入其他应用3-D图形可以和数据进行交互优点3-D图形表示直观,易于理解缺点离散地映射数据,极耗内存应用行业案例SABRE Groupis为旅游和运输行业提供信息技术解决方案,包括定制软件开发和软件产品,交易处理,咨询和整个信息技术外包VantagePoint公司旅游管理的决策支持工具利用In3D来设计开发VantagePoint的3D图形显示
36、Visual InsightsADVIZOR平台WindowsNT,Windows9X,持多个数据源功能关联associationsor affinities被可视化表示data constellation组件没有使用传统的3-D图表,有效地将线,点,稠密度和颜色联合起来,提供用户快速、简单地了解数据之间关系和它们相对的强度可以和其他数据挖掘软件和应用集成所有的可视化都和数据有联接,当数据改变时,能自动刷新图形表示优点全面的、强壮的、快速的、通用的应用,数据装载很快缺点可视化组件缺少一个高层的概述和描述`应用行业案例Stores AutomatedSystems,Inc.SASI集成POS系统、checkout系统和定位忠诚度和市场营销程序SASI的定位客户市场营销商业部门开发完全定制的商业智能系统,使用ADVIZOR在零售行业中发现客户交易数据的趋势和模式
37、WhiteCross SystemsCall Detail Analysis SystemHeatSeeker WhiteCross Data ExplorationServer平台WhiteCross CallDetail AnalysisSystem是一个硬件和软件集成的解决方案,支持大规模并行处理服务器和ANSI-标准SQL数据库,以及其他RDBMS,分析工具和网络功能分析呼叫细节数据的能力,不是依赖数据抽样和其他数据操纵技术CDR抽取CDR数据直接转换进入WhiteCrossDataExploration ServerWX/DES.使用第三方的查询工具,分析WX/DES中包括CDR的数据可以定期抽取数据进行分析HeatSeeker包括决策树算法;对客户交易历史记录进行,抽取模式,决定哪些客户可能响应特定的商品;对客户分成不同的赢利组;基于以前客户购买模式,发送响应的mailHeatSeeker提供segmentation,profiling andpredictive miningsupport forone-to-one marketinginitiatives.另外,HeatSeeker能够评估商业活动是否成功优点最大的强势在于灵活性、可靠性、性能高HeatSeeker数据分析不是基于抽样数据缺点对数据库的操作是纯SQL,没有类似SYBASE、ORACLE一样的操纵工具HeatSeeker只能运行在WhiteCross平台应用行业案例Mercury CommunicationsCableWireless是一家电信公司,电信公司成功的一个因素是理解你的客户每个电话呼叫都产生数据i.e.,the originatingand terminatingnumbers,start timeand duration.客户的记录告诉电信公司客户是如何使用电信的服务的由于数据库太大,很难对整个数据库进行特殊查询WhiteCross CallDetailAnalysisSystem能够对一个月的记录进行特殊的调查,identify trafficpatterns anddevise andtest pricingpackages basedon real-world data.Telefonica LargaDistanciaTLDof PuertoRico是一个新的电信公司使用WX/DES分析CDR数据ECI包括在西班牙有60个分店的欧洲零售集团;同时还具有35,000个员工的食品商店、旅游代理和保险集团ECI每年运行多次专门的promotions和使用direct marketingcampaigns吸引客户.ECI有海量的客户购买历史数据,HeatSeeker使ECI能够在几秒内从海量数据中获得查询结果,挖掘整个数据库,发现有价值的模式
38、WizSoft,Inc.WizWhy平台WindowsNT功能发现规则,根据规则制定预言能够计算每个规则的可能性和有意义的程度在发现规则的基础上预言新的cases,新case的数据能够手工加入,也能从一个特定的文件读取输出是规则和包含预言的text文件整个建模过程装载数据;选择重要参数;产生规则;存储模型;应用模型到一个确认数据集数据定期装载,不需要用户干预标记关键的预言变量用于logistical regressionanalysis,发现数据分片应用行业案例ACNielsen是市场研究公司,利用WizWhy来决定区分不同消费者分组的规则,以利于市场调研MEDai,位于Orlando,Florida,使用人工智能和统计分析技术为healthcare行业提供解决方案解决方案包括临床决策支持过程;高风险预测和供应商描述provider profiling也使用人工智能技术预测movement of stocks,在这个方面取得巨大的成功MEDai为了预测stock market,使用chart patternrecognition indicators神经网络技术不能产生太多的模式,因为they occurredwith averylow frequency,the patternswere verysubtle andthe returnsofstockshad suchahigh standarddeviation.所以使用WizWhy,find thesepatterns andgenerate asignificantreturn onour stockportfolio.优点速度,发现所有规则的能力,为规则分配可能性和评估其价值易于使用,预言结果比神经网络能被解释理解then-not规则很有用缺点不能同时自动执行多个数据挖掘任务,每个二值预言都必须单独执行;软件需要用户自己选择参数值Experian Corporation是一个信息咨询公司,提供direct marketingindustry withlists ofaddresses andphone numbers,and analysisof theirdirect marketingofferings.利用WizWhy发现基于规则的模型特别声明1资料来源于互联网,版权归属原作者2资料内容属于网络意见,与本账号立场无关3如有侵权,请告知,立即删除。