




如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
统计总结 第一篇:统计总结(一)概念1变量与变量值:被观察和测量单位的特征称变量。对变量的测得值称变量值2同质与变异:被研究指标的影响因素相同或具有相同性质的事物称为同质。在同质的基础上各观察单位之间的差异或同质事物之间的差别称为变异。3总体:根据研究目的确定的同质的研究对象(观察单位)的全体(无限总体、有限总体)4样本:从总体中按照一定的目的随机抽取的有代表性的部分观察单位(随机性、可比性、可靠性)。5系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造次观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。6随机测量误差:由于非人为的偶然因素所致误差。对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,这种误差叫随机测量误差7抽样误差:在抽样过程中由于个体差异所致的统计量与参数之间的差异。8概率:是描述随机事件发生可能性大小的一个度量。医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。9计量资料:用定量的方法测得某项指标量的大小所得到的资料成为计量资料。10计数资料:将观察单位按属性或类别分组,然后清点各组观察单位的个数所得到的资料。11等级资料:是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。12中位数:将一组观察值从小到大按顺序排列,位次居中的数值即为中位数。13众数:原指总体中出现机会最高的数值。样本众数则是在样本中出现次数最多的数值。14调和均数:先求原始数据倒数的算术均数。该算术均数的倒数便称为原数据的调和均数。15自由度:计算某个统计量,取值不受限制的变量的个数成为自由度。16用样本统计量估计总体参数称参数估计,是统计推断的一个重要内容。常用的估计方法有两种:点估计和可信区间估计。点估计是指用样本统计量直接作为总体参数的估计值。可信区间估计亦称置信区间估计,是指按预先给定的概率(1-α)称可信度,估计未知总体参数的可能范围。17偏度系数:偏度指分布不对称的程度和方向,理论上总体偏度系数为0时,分布是对称的;取正值时,分布为负偏峰;取负值时分布为正偏峰。18峰度系数:峰度指分布与正态曲线相比的冒尖程度或扁平程度指理论上,正态分布的总体峰度系数为0;取负值时,其分布较正态分布的峰平阔;取正值时,其分布较正态分布的峰尖峭。19医学统计学:将概率论和数理统计的原理和方法应用于医疗卫生实践和医学科研,研究其数据的搜集、整理与分析的一门科学。它是认识人群健康与疾病数量特征的重要工具,是进行医药卫生科学研究的重要手段。20统计工作基本流程:设计,搜集资料,整理资料,分析资料。21.95%可信区间:作100次抽样,获得100个样本,可算得100个可信区间,其中,有95个可信区间包含μ(估计正确),可能只有5个可信区间不包含μ(估计错误)。(二)计量资料的统计描述:一统计表1含义是指如下一种格式的统计表:即先根据观察个体的数量大小进行分组,然后计算每组的观察值出现的次数,并用表格形式表达。2制做过程:(1)找出数据的极差,极差又称为全距,是指全部数据的最大值与最小值之差,其可以描述数据的变异程度。(2)确定组数,k表示组数,组数通常选择在8-15之间。(3)确定组距(4)划分组段(5)编制表将数据划归各组3频数分布表的用途:(1)作为表达资料的形式,可以代替繁杂的原始资料,便于进一步分析。(2)便于观察数据的分布类型。医学研究中常见的资料分布类型可分为对称分布和偏态分布两大类。在对称分布资料中有一种非常重要的分布类型即正态分布,偏态分布,正偏态分布,负偏态分布。(3)便于发现资料中某些远离群体的特大或特小的可疑值。二,集中趋势的描述(均数是描述一组观察值集中趋势或平均水平的统计指标体系,它常作为一组数据的代表值用于分析和进行组间的比较)1.算数均数:应用于对称分布,尤其适用正态分布(近似正态分布)资料。2几何均数:可用于描述一组资料数据经对数转换后呈现为对称分布或正态分布的变量值的平均水平。在医学研究领域多用于血清学和微生物学中;有些呈轻度偏态分布的资料经过对数变换后呈对称分布资料。3中位数和百分位数:将一组观察值从小到大按顺序排列,位次居中的数值即为中位数。百分位数可用来描述资料的观察值序列在某百分位置的水平。4众数与调和均数三,离散趋势的描述1极差2四分位数间距3平均偏差4方差与标准差5变异系数四,正态分布(是以均数为中心对称的钟型分布)1特征:(1)对称性正态分布是以均数为中心,表现为左右对称(2)集中性正态曲线在横轴上方均数处为最高,频数集中于中等大小数据的附近(3)正态分布有两个参数一个是位置参数。当恒定后,越大,正态曲线沿横轴向右移;否则反之。一个是形态参数,当恒定后,越大则数据越分散,曲线显现越平阔;越小,曲线显现越尖峭。而且曲线的变动

是你****枝呀
实名认证
内容提供者


最近下载