首页 > 自考本科 > 自考本科医学统计学重点会考什么

自考本科医学统计学重点会考什么

发布时间:

自考本科医学统计学重点会考什么

医学统计学重点知识如下:

1、医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。

2、医学多元统计方法:多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。

3、变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。

4、截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/终止(研究时限已到而终止观察)。

5、总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。

医学统计学重点知识归纳如下:

1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。

2、研究对象:具有不确定性结果的事物。

3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。

4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。

5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。

6、医学统计学中的基本概念

(1) 同质与变异

同质,指根据研究目的所确定的观察单位其性质应大致相同。

变异,指总体内的个体间存在的、绝对的差异。统计学通过对变异的研究来探索事物。

(2) 变量与数据类型

变量,是反映实验或观察对象生理、生化、解剖等特征的指标。

变量的观测值,称为数据,分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等)

定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)

有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。统计方法的选用与数据类型有密切的关系。

(3)总体与样本

总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。参数,指描述总体特征的指标。

统计量,指描述样本特征的指标。

(4)误差

误差,指观测值与真实值、统计量与参数之间的差别。可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。

抽样误差,是抽样引起的统计量与参数间的差异。抽样误差主要来源于个体的变异。统计学主要研究抽样误差。

(5)概率

概率,是描述某事件发生可能性大小的量度。

必然事件,事件肯定发生,概率P(U)=l。

随机事件,事件可能发生,可能不发生,概率介于0_P(A)≤ 1;不可能事件,事件肯定不发生,概率P($)=0。

小概率事件,事件发生的可能性很小,概率P(A)≤0.05、或P(A)≤0.01。

医学统计学重点知识归纳u分布是标准正态分布,均数为0,标准差为1的正态分布,t分布当自由度足够大的时候近似与u分布,n→∞时,t 分布与标准正态分布完全一致。

1)求极差(Range)R=Xmax-Xmin (29.64-7.42=22.22)。

2)确定组数和组距、划分组段组数确定需根据样本大小决定,一般取10组左右。(22.22/12=1.85)。

3)频数统计,列频数表。

图形特征:

集中性:正态曲线的高峰位于正中央,即均数所在的位置。

对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。

关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,形状呈现中间高两边低,正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。

医学统计学自考重点

医学统计学重点知识归纳u分布是标准正态分布,均数为0,标准差为1的正态分布,t分布当自由度足够大的时候近似与u分布,n→∞时,t 分布与标准正态分布完全一致。

1)求极差(Range)R=Xmax-Xmin (29.64-7.42=22.22)。

2)确定组数和组距、划分组段组数确定需根据样本大小决定,一般取10组左右。(22.22/12=1.85)。

3)频数统计,列频数表。

图形特征:

集中性:正态曲线的高峰位于正中央,即均数所在的位置。

对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。

关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,形状呈现中间高两边低,正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。

1.u分布是标准正态分布,均数为0,标准差为1的正态分布,t分布当自由度足够大的时候近似与u分布,n→∞时,t 分布与标准正态分布完全一致。2.单样本或两样本时用t检验,3样本或者3组以上用方差分析。两样本t检验与方差分析等效,F=t^2。3.卡方检验一般有2*2,2*C,R*C和配对资料卡方检验。注意理论频数不能太小,如有小于1或者1/5以上的格子小于5,则要考虑合并,或者采用fisher确切概率检验。配对资料b+c>40时,卡方=(b-c)^2/(b+c),当b+c<=40时,用(|b-c|-1)^2/(b+c)。4.非参数检验对数据的分布没有要求5.假设检验基本思想就是小概率事件在一次抽样中不会发生。建议你还是参考相关的书籍吧,回答的不够准确

医学统计学重点知识如下:

1、医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。

2、医学多元统计方法:多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。

3、变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。

4、截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/终止(研究时限已到而终止观察)。

5、总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。

医学统计学自考重点内容

医学统计学基础概念整理2017

统计学是研究数据的收集、整理和分析的一门科学。其工作流程为设计、搜集、整理、分析与结果报告。打个通俗的比喻,统计学就好比“打牌”,抓牌就是搜集数据,牌抓好后要整理一下,然后研究怎么打就是分析,打的输赢就是结果报告。下面是我为大家带来的关于医学统计学基础概念整理的知识,欢迎阅读。

一.总体与样本

总体:是指根据研究目的所确定的观察单位某项特征的集合。比如说我想研究山西医科大学所有在校生的平均体重,那根据此目的,我们研究的总体就是:山西医科大学所有在校生的体重数据的集合。但是需要注明一点:总体分为有限总体和无限总体,上面的例子就是有限总体,毕竟山西医科大学学生还是有限的,然而科研过程中面临的大多数是无限的总体,我们是无法取得其总体进行研究的。那我们面对无限总体怎么办呢?

我们为了研究无限总体,发明了抽样的方法。就像我们想知道一锅老母鸡汤的咸淡,不需要喝完所有的汤,只要摇匀,尝其一勺就可以了,这种思想就叫“抽样”。

样本:就是从总体中抽出的部分观察单位某项特征的集合。但是在抽样过程中必须遵守随机化的原则。

随机化原则:是指总体中的任何一个观察单位都要有同等的机会被抽到作为样本进行研究。那么如何保证随机化抽样呢,一般包括单纯随机抽样、系统抽样、分层抽样、整群抽样和多级抽样等方法。

二.参数与统计量

参数:用于描述总体特征的指标;

统计量:用于描述样本特征的指标;

总体、样本、参数与统计量的关系如下图。

统计学就是通过描述样本的统计量去推断描述总体的参数。这是通过偶然去发现必然的过程,通过一般去发现普遍的过程,是以小见大的过程。

三.误差

误差:观察值与真知之差。即我们通过一次试验得到的结果与事件真实结果之间的差值。误差根据其产生的原因,分为四种:

(1)系统误差:因为试剂未校正或仪器没有调零等因素造成的研究结果倾向性的增大或减小。如我们路过药房,门口放个一个体重计,请问我们在称自己的体重之前,首先要干的第一件事情是什么呢?从统计学角度,我们应该看看体重计上的指针是不是对准零,如果本身就有5Kg底重,那我们所有的同学去称,都将会重5Kg,即发生倾向性的偏大。其特点:倾向性的增大或减小,如果我们就行调零,就可以避免。

(2)随机误差(random error):是由各种偶然因素造成的观察值与真值之差。比如班级所有同学用同一把尺子测量我的身高,结果发现我的身高值是不一样的。其特点为:不可以避免,但可以减少。统计学有一定律叫做“测不准定律”,不管你怎么测,就是测不准,因此我们通常多次测量后取平均。

(3)抽样误差(sampling error):因为抽样造成的样本统计量与总体参数之间的差异。有人会说,刚才那一勺老母鸡汤的咸淡应该和锅里汤的咸淡是完全一样的啊,是的,但上面的例子是在讲抽样的原理,而我们科学研究和喝老母鸡汤是不一样的,因为汤里的氯化钠是均匀分布的,而我们科学研究的目标事件是不均匀分布的。比如某个班级120名同学的近视眼患病率为50%,我按照随机化原则随机抽取50名同学,则50名同学的近视眼患病率绝对不等于50%,因为近视眼同学在班级中的`分布是不均匀的。因此抽样误差的特点为:不可以避免,但可以减少。我们可以通过增大样本量进行减少。

(4)过失误差(gross error):

由于观察过程中的不仔细造成的错误判断或记录。过失误差可以通过仔细核对进行避免。

那我们统计学的存在主要是解决那种误差呢?我们通过统计设计减少系统误差、通过统计学检验去排除抽样误差的。

四.概率与频率

概率(P):用于反映某一事物发生可能性大小的一种量度。一般用大写的斜体P表示。

我们根据事物发生概率的大小,把事件分为3类:P=1为必然事件,发生率为100%;P=0为不可能事件,发生率为0;0

频率(f):是指我们进行了N次试验,其中一个事件出现的次数m与总的试验次数N的比值。

问题是:我们到底如何能够得到某一事件发生的概率呢,比如说谁能够告诉我一个半截粉笔从讲台上掉下摔断的概率P=?。我们至今的科学发展也没有办法通过公式去计算该值。那我们是怎么做的呢?有句话叫做“有些事情越想越烦,做起来却极其简单”。我们只需要那两盒同样的粉笔进行重复摔就可以了,如果总共100支粉笔,断了98只,那断的频率就等于f=98/100=0.98。而统计学上证实,当某事件发生次数较多时,频率就会接近于概率。意即f=P。因此,其实我们就是通过频率去估计概率的。

五.同质与变异

同质:是指观察单位所受的影响因素相同。而我们科研的观察单位所受的影响因素只可能相对的相同,不可能绝对的相同,因此,同质是相对的。

变异:是指观察单位在同质的基础上的个体差异。天底下没有两个完全一样的事物,唯一不变的就是变化。因此,变异是绝对的。

这一对概念对我们研究统计的意义:如果没有同质的话,就没有我们研究的总体或者样本。因为如果不同质,我们是不可能把他们放在一起进行研究的。如果没有变异,就根本没有统计学产生的必要,因为如果没有变异,我们拿一种药物治疗某病的一个病人,如果有效,该药对所有该病病人都应该有效,这是不可能的。

六.试验vs实验

试验——对已知事物结果的探索过程:为了查看某事的结果或某物的性能而从事某种活动。

实验——已有明确的结论/假说后的验证过程:为了检验某种科学理论或假设而进行某种操作或从事某种活动。

从上述来自《现代汉语词典》的两个解释,可以看出:实验中被检验的是某种科学理论或假设,通过实践操作来进行;而试验中用来检验的是已经存在的事物,是为了察看某事的结果或某物的性能,通过使用、试用来进行。

在我们实际应用中,很多词汇中到底是用“试验”还是“实验”是已经根据前人的经验明确了的。比如RCT(Randomized Controlled Trial),我们会叫“随机对照试验”,我想多半是因为翻译的过程中Trial翻译为“试验”更为合适。而RCT中,患者被分为两组时,则被称为“实验组”(Treatment Group)和对照组(Control Group)。

七.病人/患者vs受试者/研究对象

这两组词,也许没有必要把定义在贴上来了,因为他们的区别显而易见。病人/患者的称法,当然应该用于病人和患者的身上。如果研究是在健康人或者潜在患者人群中开展的,此时研究对象还不能确定为病人/患者,那么只能称其为受试者或研究对象。相似的,在产科的研究中,如果研究对象为一般的产妇,我们通常也不应该用“患者”或“病人”这样的称谓。

研究对象可以说是一个万金油,什么时候用都是可以的。而受试者我们又要说一下了,“受试者”常与某种干预联系在一起,通常仅在干预性研究(RCT、类实验)和诊断试验中才会使用。

八.终点vs结局

结局(Outcome)——研究中患者可能出现的一种结果:某种疾病或某种状态影响下的(人的)最终(健康)状态。

终点(Endpoint)——研究中患者某一结果的替代指标:用于在研究中判断干预或因素作用效果的某种“结局”。

在临床研究中,结局通常是指患者的某种转归,比如肿瘤患者中,痊愈、死亡、复发、转移这些都可以作为结局。当然,干预或某种因素暴露下短期的改变也可以成为结局,比如红细胞的升高、体温降低等等。而终点,则是临床研究中的效应评价点,比如主要终点、次要终点,此时用“结局”就不合适了。

上面这些看起来很头疼吧,那就记个最简单的。一般在试验性研究中(比如在RCT)我们一般使用“终点”,生存分析是有时也会用观察终点这一说法;而在其他类型的研究中,常使用“结局”。

九.排除vs剔除

所谓的排除标准就是考虑到研究的可行性和研究对象的安全,将一部分无法保证研究对象安全及不可行的符合入选条件的研究对象排除在研究之外。针对研究对象开始进行研究前,不将符合排除标准的对象作为研究对象纳入,这就是排除。

在临床研究中,根据入选排除标准确定研究对象之后,在研究中我们还会发现一些患者无法接受进一步干预或观察,或者在研究期间才能发现研究对象的某些特征不属于我们将要外推的范围。此时虽然这些对象在研究初期被确定为“研究对象”,认为他们属于研究结果将要外推到的人群,但实际上他们并不属于该类人群。这时我们就要将该类研究对象“剔除”出研究,相应的标准就是剔除标准。

简而言之,排除是在研究初期用于选择研究对象的;剔除是在研究中期用于去除随时发现的非外推人群的研究对象。

医学统计学重点知识归纳如下:

1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。

2、研究对象:具有不确定性结果的事物。

3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。

4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。

5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。

6、医学统计学中的基本概念

(1) 同质与变异

同质,指根据研究目的所确定的观察单位其性质应大致相同。

变异,指总体内的个体间存在的、绝对的差异。统计学通过对变异的研究来探索事物。

(2) 变量与数据类型

变量,是反映实验或观察对象生理、生化、解剖等特征的指标。

变量的观测值,称为数据,分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等)

定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)

有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。统计方法的选用与数据类型有密切的关系。

(3)总体与样本

总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。参数,指描述总体特征的指标。

统计量,指描述样本特征的指标。

(4)误差

误差,指观测值与真实值、统计量与参数之间的差别。可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。

抽样误差,是抽样引起的统计量与参数间的差异。抽样误差主要来源于个体的变异。统计学主要研究抽样误差。

(5)概率

概率,是描述某事件发生可能性大小的量度。

必然事件,事件肯定发生,概率P(U)=l。

随机事件,事件可能发生,可能不发生,概率介于0_P(A)≤ 1;不可能事件,事件肯定不发生,概率P($)=0。

小概率事件,事件发生的可能性很小,概率P(A)≤0.05、或P(A)≤0.01。

医学统计学自考重点总结

医学统计学重点知识如下:

1、医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。

2、医学多元统计方法:多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。

3、变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。

4、截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/终止(研究时限已到而终止观察)。

5、总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。

医学统计学重点知识归纳u分布是标准正态分布,均数为0,标准差为1的正态分布,t分布当自由度足够大的时候近似与u分布,n→∞时,t 分布与标准正态分布完全一致。

1)求极差(Range)R=Xmax-Xmin (29.64-7.42=22.22)。

2)确定组数和组距、划分组段组数确定需根据样本大小决定,一般取10组左右。(22.22/12=1.85)。

3)频数统计,列频数表。

图形特征:

集中性:正态曲线的高峰位于正中央,即均数所在的位置。

对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。

关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,形状呈现中间高两边低,正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。

1.u分布是标准正态分布,均数为0,标准差为1的正态分布,t分布当自由度足够大的时候近似与u分布,n→∞时,t 分布与标准正态分布完全一致。2.单样本或两样本时用t检验,3样本或者3组以上用方差分析。两样本t检验与方差分析等效,F=t^2。3.卡方检验一般有2*2,2*C,R*C和配对资料卡方检验。注意理论频数不能太小,如有小于1或者1/5以上的格子小于5,则要考虑合并,或者采用fisher确切概率检验。配对资料b+c>40时,卡方=(b-c)^2/(b+c),当b+c<=40时,用(|b-c|-1)^2/(b+c)。4.非参数检验对数据的分布没有要求5.假设检验基本思想就是小概率事件在一次抽样中不会发生。建议你还是参考相关的书籍吧,回答的不够准确

医学统计学自考重点笔记

医学统计学重点知识归纳如下:

1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。

2、研究对象:具有不确定性结果的事物。

3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。

4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。

5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。

6、医学统计学中的基本概念

(1) 同质与变异

同质,指根据研究目的所确定的观察单位其性质应大致相同。

变异,指总体内的个体间存在的、绝对的差异。统计学通过对变异的研究来探索事物。

(2) 变量与数据类型

变量,是反映实验或观察对象生理、生化、解剖等特征的指标。

变量的观测值,称为数据,分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等)

定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)

有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。统计方法的选用与数据类型有密切的关系。

(3)总体与样本

总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。参数,指描述总体特征的指标。

统计量,指描述样本特征的指标。

(4)误差

误差,指观测值与真实值、统计量与参数之间的差别。可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。

抽样误差,是抽样引起的统计量与参数间的差异。抽样误差主要来源于个体的变异。统计学主要研究抽样误差。

(5)概率

概率,是描述某事件发生可能性大小的量度。

必然事件,事件肯定发生,概率P(U)=l。

随机事件,事件可能发生,可能不发生,概率介于0_P(A)≤ 1;不可能事件,事件肯定不发生,概率P($)=0。

小概率事件,事件发生的可能性很小,概率P(A)≤0.05、或P(A)≤0.01。

医学统计学基础概念整理2017

统计学是研究数据的收集、整理和分析的一门科学。其工作流程为设计、搜集、整理、分析与结果报告。打个通俗的比喻,统计学就好比“打牌”,抓牌就是搜集数据,牌抓好后要整理一下,然后研究怎么打就是分析,打的输赢就是结果报告。下面是我为大家带来的关于医学统计学基础概念整理的知识,欢迎阅读。

一.总体与样本

总体:是指根据研究目的所确定的观察单位某项特征的集合。比如说我想研究山西医科大学所有在校生的平均体重,那根据此目的,我们研究的总体就是:山西医科大学所有在校生的体重数据的集合。但是需要注明一点:总体分为有限总体和无限总体,上面的例子就是有限总体,毕竟山西医科大学学生还是有限的,然而科研过程中面临的大多数是无限的总体,我们是无法取得其总体进行研究的。那我们面对无限总体怎么办呢?

我们为了研究无限总体,发明了抽样的方法。就像我们想知道一锅老母鸡汤的咸淡,不需要喝完所有的汤,只要摇匀,尝其一勺就可以了,这种思想就叫“抽样”。

样本:就是从总体中抽出的部分观察单位某项特征的集合。但是在抽样过程中必须遵守随机化的原则。

随机化原则:是指总体中的任何一个观察单位都要有同等的机会被抽到作为样本进行研究。那么如何保证随机化抽样呢,一般包括单纯随机抽样、系统抽样、分层抽样、整群抽样和多级抽样等方法。

二.参数与统计量

参数:用于描述总体特征的指标;

统计量:用于描述样本特征的指标;

总体、样本、参数与统计量的关系如下图。

统计学就是通过描述样本的统计量去推断描述总体的参数。这是通过偶然去发现必然的过程,通过一般去发现普遍的过程,是以小见大的过程。

三.误差

误差:观察值与真知之差。即我们通过一次试验得到的结果与事件真实结果之间的差值。误差根据其产生的原因,分为四种:

(1)系统误差:因为试剂未校正或仪器没有调零等因素造成的研究结果倾向性的增大或减小。如我们路过药房,门口放个一个体重计,请问我们在称自己的体重之前,首先要干的第一件事情是什么呢?从统计学角度,我们应该看看体重计上的指针是不是对准零,如果本身就有5Kg底重,那我们所有的同学去称,都将会重5Kg,即发生倾向性的偏大。其特点:倾向性的增大或减小,如果我们就行调零,就可以避免。

(2)随机误差(random error):是由各种偶然因素造成的观察值与真值之差。比如班级所有同学用同一把尺子测量我的身高,结果发现我的身高值是不一样的。其特点为:不可以避免,但可以减少。统计学有一定律叫做“测不准定律”,不管你怎么测,就是测不准,因此我们通常多次测量后取平均。

(3)抽样误差(sampling error):因为抽样造成的样本统计量与总体参数之间的差异。有人会说,刚才那一勺老母鸡汤的咸淡应该和锅里汤的咸淡是完全一样的啊,是的,但上面的例子是在讲抽样的原理,而我们科学研究和喝老母鸡汤是不一样的,因为汤里的氯化钠是均匀分布的,而我们科学研究的目标事件是不均匀分布的。比如某个班级120名同学的近视眼患病率为50%,我按照随机化原则随机抽取50名同学,则50名同学的近视眼患病率绝对不等于50%,因为近视眼同学在班级中的`分布是不均匀的。因此抽样误差的特点为:不可以避免,但可以减少。我们可以通过增大样本量进行减少。

(4)过失误差(gross error):

由于观察过程中的不仔细造成的错误判断或记录。过失误差可以通过仔细核对进行避免。

那我们统计学的存在主要是解决那种误差呢?我们通过统计设计减少系统误差、通过统计学检验去排除抽样误差的。

四.概率与频率

概率(P):用于反映某一事物发生可能性大小的一种量度。一般用大写的斜体P表示。

我们根据事物发生概率的大小,把事件分为3类:P=1为必然事件,发生率为100%;P=0为不可能事件,发生率为0;0

频率(f):是指我们进行了N次试验,其中一个事件出现的次数m与总的试验次数N的比值。

问题是:我们到底如何能够得到某一事件发生的概率呢,比如说谁能够告诉我一个半截粉笔从讲台上掉下摔断的概率P=?。我们至今的科学发展也没有办法通过公式去计算该值。那我们是怎么做的呢?有句话叫做“有些事情越想越烦,做起来却极其简单”。我们只需要那两盒同样的粉笔进行重复摔就可以了,如果总共100支粉笔,断了98只,那断的频率就等于f=98/100=0.98。而统计学上证实,当某事件发生次数较多时,频率就会接近于概率。意即f=P。因此,其实我们就是通过频率去估计概率的。

五.同质与变异

同质:是指观察单位所受的影响因素相同。而我们科研的观察单位所受的影响因素只可能相对的相同,不可能绝对的相同,因此,同质是相对的。

变异:是指观察单位在同质的基础上的个体差异。天底下没有两个完全一样的事物,唯一不变的就是变化。因此,变异是绝对的。

这一对概念对我们研究统计的意义:如果没有同质的话,就没有我们研究的总体或者样本。因为如果不同质,我们是不可能把他们放在一起进行研究的。如果没有变异,就根本没有统计学产生的必要,因为如果没有变异,我们拿一种药物治疗某病的一个病人,如果有效,该药对所有该病病人都应该有效,这是不可能的。

六.试验vs实验

试验——对已知事物结果的探索过程:为了查看某事的结果或某物的性能而从事某种活动。

实验——已有明确的结论/假说后的验证过程:为了检验某种科学理论或假设而进行某种操作或从事某种活动。

从上述来自《现代汉语词典》的两个解释,可以看出:实验中被检验的是某种科学理论或假设,通过实践操作来进行;而试验中用来检验的是已经存在的事物,是为了察看某事的结果或某物的性能,通过使用、试用来进行。

在我们实际应用中,很多词汇中到底是用“试验”还是“实验”是已经根据前人的经验明确了的。比如RCT(Randomized Controlled Trial),我们会叫“随机对照试验”,我想多半是因为翻译的过程中Trial翻译为“试验”更为合适。而RCT中,患者被分为两组时,则被称为“实验组”(Treatment Group)和对照组(Control Group)。

七.病人/患者vs受试者/研究对象

这两组词,也许没有必要把定义在贴上来了,因为他们的区别显而易见。病人/患者的称法,当然应该用于病人和患者的身上。如果研究是在健康人或者潜在患者人群中开展的,此时研究对象还不能确定为病人/患者,那么只能称其为受试者或研究对象。相似的,在产科的研究中,如果研究对象为一般的产妇,我们通常也不应该用“患者”或“病人”这样的称谓。

研究对象可以说是一个万金油,什么时候用都是可以的。而受试者我们又要说一下了,“受试者”常与某种干预联系在一起,通常仅在干预性研究(RCT、类实验)和诊断试验中才会使用。

八.终点vs结局

结局(Outcome)——研究中患者可能出现的一种结果:某种疾病或某种状态影响下的(人的)最终(健康)状态。

终点(Endpoint)——研究中患者某一结果的替代指标:用于在研究中判断干预或因素作用效果的某种“结局”。

在临床研究中,结局通常是指患者的某种转归,比如肿瘤患者中,痊愈、死亡、复发、转移这些都可以作为结局。当然,干预或某种因素暴露下短期的改变也可以成为结局,比如红细胞的升高、体温降低等等。而终点,则是临床研究中的效应评价点,比如主要终点、次要终点,此时用“结局”就不合适了。

上面这些看起来很头疼吧,那就记个最简单的。一般在试验性研究中(比如在RCT)我们一般使用“终点”,生存分析是有时也会用观察终点这一说法;而在其他类型的研究中,常使用“结局”。

九.排除vs剔除

所谓的排除标准就是考虑到研究的可行性和研究对象的安全,将一部分无法保证研究对象安全及不可行的符合入选条件的研究对象排除在研究之外。针对研究对象开始进行研究前,不将符合排除标准的对象作为研究对象纳入,这就是排除。

在临床研究中,根据入选排除标准确定研究对象之后,在研究中我们还会发现一些患者无法接受进一步干预或观察,或者在研究期间才能发现研究对象的某些特征不属于我们将要外推的范围。此时虽然这些对象在研究初期被确定为“研究对象”,认为他们属于研究结果将要外推到的人群,但实际上他们并不属于该类人群。这时我们就要将该类研究对象“剔除”出研究,相应的标准就是剔除标准。

简而言之,排除是在研究初期用于选择研究对象的;剔除是在研究中期用于去除随时发现的非外推人群的研究对象。

医学统计学重点知识如下:

1、医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。

2、医学多元统计方法:多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。

3、变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。

4、截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/终止(研究时限已到而终止观察)。

5、总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。

  • 索引序列
  • 自考本科医学统计学重点会考什么
  • 医学统计学自考重点
  • 医学统计学自考重点内容
  • 医学统计学自考重点总结
  • 医学统计学自考重点笔记
  • 返回顶部