还剩1页未读,继续阅读
文本内容:
数据挖掘分析《红楼梦》背景介绍生活的真谛是什么?是从每个人自己不同爱好、不同擅长、不同的品味中,感受对于生活的独特理解和个性化发现所谓赌徒的生活的真谛就是下注时的快感;作家的生活的真谛就是用文学作品解剖生活;数学家生活的真谛就是探索和欣赏数学里的奥秘;舞女的生活真谛就是在灯红酒绿中体会人性的另一面;万法归宗呀,芸芸众生只有看问题的角度不同,没有绝对的对错和高低就象本文即将分享的一个用数据分析方法部分解密《红楼梦》的前后作者一样,《红楼梦》后40回作者到底是曹雪芹还是另有其人?这个论题作为红学研究最热烈的话题当然并不是完全可以用纯粹的数学推理来解决的,但是这里分享的数学分析方法和思路,却是实实在在可以让有缘之人当作休闲的小食,不求充饥,但求有趣,从不同的角度和不同的视线观察生活,就是人生的好享受xx年10月10日南京“现代快报”报道,南京林业大学汤庚国教授另辟鼷径,从海棠文化出发,分析《红楼梦》前80回与后40回的差异汤教授主要从人文花卉方面进行分析,发现《红楼梦》前80回有16回涉及海棠,而后40回只有4回涉及海棠,以此说明前后差距明显受汤教授的启发,东南大学数学系的韦博成先生(博导)从数学统计的专业角度对汤先生的发现进行数学证明,通过两个独立二项总体等价性检验,经过渐近正态公式计算,有92%的把握认为“前80回对于海棠花的关注程度大于后40回对于海棠花的关注程度”根据该统计方法,韦博成先生再接再厉,对于《红楼梦》中的若干重要的情景描述进行量化,得到相应的数据集有了数据集就可以进行数理统计分析,比较前80回与后40回在文风上的差异,结果表明,《红楼梦》前80回与后40回在某些重要的情景描述上确实有非常显著的差异研究者韦博成先生再三再四强调,他只是从数据分析的角度指出两者的差异,尚不能说明《红楼梦》前80回与后40回作者的不同,因为“这涉及到许多人文与社会方面的问题,这是数理统计方法所无能为力的”本数据分析的目的用数理统计的方法(具体来说是两个独立二项总体等价性检验)来分析《红楼梦》前80回与后40回在几个重要的情景指标(包括饮食描写、医药描写、诗词描写、花卉描写、树木描写,这里“描写”主要指出现的频率)的差异,并据此反映的文风来判断《红楼梦》前后两大部分的差异的显著性至于这种显著性是否能推导出作者的不同,并不是本研究的目的,说白了,本数...。