还剩10页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
第二课地质数据及其统计分析讲5个方面的问题
一、地质数据的概念、类型及属性
二、地质数据的选择和整理
三、地质数据的预处理
四、地质数据的统计分布特征
五、与油气地质有关的分布函数
一、地质数据的概念、类型及属性1概念地质信息的数、字母和符号的集合2类型按地质数据的特点分为观测、综合和经验数据三大类◆观测数据——对研究对象直接进行观测和度量所获得的数据又分为定性和定量数据
①定性数据——用代码或字符等来表示某一地质特征及其相互间关系的一种“数据”又分为名义型和有序型两种名义型数据通过鉴别区分不同的对象或个体并赋予不同代码后形成的数据如岩石的颜色、结构、构造等有序型数据有次序的数码或代码并用次序来表示数码或代码间的一种单调升降关系的数据如生油岩的干酪根分成I,II,III级又如油气储量的级别等
②定量数据——具有数量概念的数据分为间隔型和比例型数据间隔型数据特点不仅能比较其大小,而且能定量地表示数据间的差异;无自然零值,但有负值比例型数据特点具有绝对零值而没有负值的间隔型数据大多数定量数据都属比例型数据◆综合数据——由观测数据经有限次算术或代数运算后,并具有明确地质意义的数据如甲烷系数、时间—温度指数值、平均值、均方差、相关系数等◆经验数据——根据大量实际观测值归纳出来或根据公式计算而得出的经验值如单储系数、排烃系数等3属性
(1)统计规律性随机变量的性质,一次观测具有偶然性,多次重复观测,则具有规律性
(2)函数规律性当自变量给定,函数就完全确定了,如原子核发生衰变时,即子元素数量公式为式中——衰变开始时原子核的总数——衰变时间——时间后母元素的数量——系数
二、地质数据的选择和整理1地质数据选择时应注意的问题◆根据研究目的和要求选择数据◆选择的数据反映指标的地质意义明确◆数据的水平要一致,可靠性要强◆能对数据的统计和函数规律性作出描述、◆数量应能满足数学模型的要求◆数据的分布均匀、合理2数据的处理
(1)原始数据矩阵,即
(2)方法数据矩阵对原始数据矩阵按一定的方法进行变换,使其满足数学模型的要求,这种经变换后形成的数据矩阵称为方法数据矩阵如对数变换、正规化变换等3结构数据模型通常把表示实体及实体之间联系的模型叫做结构数据模型结构数据模型包括层次模型——用树形结构来表示实体之间联系的模型网络模型——用丛结构来表示实体之间联系的模型关系模型——用表格数据表示实体之间联系的模型
三、地质数据的预处理1可疑数据的鉴别和处理方法
(1)肖维纳chauvent检验法步骤a.计算观测数据的平均值b.计算单次观测的概率误差其中——标准差c.计算可疑数据与平均值之偏差,并求其与的比值d.根据所观测次数()以及其对应的之比值决定数据的取舍如下表所示
5101520501002.
52.
93.
23.
33.
84.2e.若,则舍去这一观测值
(1)格罗伯斯grubps检验法前提当按小到大排列且服从正态分布时,构建检验统计量式中当时,则为外来值,舍去其值2数据的简缩均匀化、缺值插补和删点
(1)数据网络化方法公式为式中——第个网格内的网格化值——第个网格内某地质变量第个观测值——第个网格内的观测次数
(2)缺值插补和删点删点随机删去一些点,保持数据分布均匀插值数据平均值或统计方法进行插值3数据变换
(1)目的和要求目的统一地质变量的量纲使地质变量呈正态分布使变量间的非线性关系转换为线性关系由一种新的独立变量代替原有相关关系的变量要求变换前后变量间的相关程度不变防止数据产生有偏估计,丢失信息
(2)数据变换方法
①统一量纲的变换a标准化变换公式式中(标准差)性质变量的量纲一致服从正态分布,服从标准正态分布b极差变换公式性质数据量纲一致c均匀化变换公式性质数据量纲一致,数据都在1附近变化
②使数据成正态分布的变换a对数变换公式式中—常数性质使数据服从正态分布b广义幂变换
③线性变换方法a幂函数方程方法两边去对数令,,则b指数函数方程方法两边去对数令,,则c指数函数方程方法两边去对数令,,则d对数函数方程令,则e双曲线函数方程方法令,则f抛物线函数方程方法在曲线上取一点令,则
四、地质数据的统计分布特征1概念数据的统计分布使指经频率曲线拟合后得到的样本频率曲线,称之为统计分布2统计分布曲线的特性
(1)曲线的峰数样本的统计分布曲线有三种类型,即单峰、双峰和多峰
(2)曲线的偏度按曲线的对称形态可分为两类,即对称、偏态曲线a对称曲线单峰对称曲线、双峰对称曲线b偏态曲线单峰、双峰或多峰,按主峰的位置确定为正偏或负偏正偏主峰位于均值的左侧,在大于均值的一侧有一长尾负偏主峰位于均值的右侧,在小于均值的一侧有一长尾偏态系数式中——三阶中心矩当对称当轻微不对称当不对称当负不对称
(3)曲线的峰度曲线的峰度使指统计分布曲线的陡峭程度,常用峰态系数来表示峰态系数式中——四阶中心矩当,则为正态分布曲线当,比正态曲线较尖峭当,则较平坦
(4)曲线的统计特征数a平均值公式b中位数c众数频率分布曲线中具有最大频率的变量值称为众数d极差公式e方差和标准差方差标准差f变异系数公式g偏态系数公式h峰态系数注平均数、中位数、众数反映数据的集中程度,称为整体代表性特征数;方差、标准差、极差、变异系数反映数据分散性特征,称之为离散型特征数
五、与油、气地质有关的分布函数1正态分布(高斯分布)函数随机变量(取值为)的密度函数正态分布的分布函数为当时,称之为标准正态分布密度函数为分布函数为2对数正态分布函数密度函数为式中3服从正态分布的油气地质变量
(1)有机地球化学指标a干酪根中的碳、氮元素b饱和烃及其馏分正烃含量
(2)沉积学中负正态分布的变量a粒度(单位),即式中——颗粒直径,以为单位b圆度(单位)c球度d斜层理的倾角
(3)物性参数孔隙度4服从对数正态分布的油气地质变量
(1)有机地球化学指标a有机碳b氯仿沥青“A”c干酪根中的氧和硫元素
(2)沉积学中负正态分布的变量a粒度(以为单位)b岩石或矿物中的微量元素,如等c沉积岩层的厚度d河流的流量
(3)含油盆地内的油田容积频率
(4)物性参数渗透率。