当前位置 : 经济师 > 中级经济师抽样调查书

中级经济师抽样调查书

最新回答

小葛装饰
教材出版业的市场调查、评估和预测方法
  摘要
  本题是一个设计型题目,题目有数据量大,信息多的特点。
  首先,我们分析数据库中数据,按一定规则将各大学排序,采用随机抽样的方法,外加地域性修正,把市场调查的范围从205所高校缩小到26所 。针对此26所学校进行问卷调查。我们分析调查所得数据,对于某出版社的市场份额,用与该出版社相关的问卷数与总问卷数的比值来衡量,从而得到三年各出版社市场份额的数据表格,并利用拟合的方法进行预测。
  其次,我们还考虑到了问卷抽样调查过程中有可能出现的特殊情况,即:抽样无回答情况。我们利用两种补救无回答的二级抽样调查方法对此问题进行了解决,传统方法和贝叶斯方法,并对它们之间的异同作简略的概括和比较。此两种方法均是为降低非抽样误差、提高数据质量服务的。
  再次,我们还提出了对按需印刷理论的新理解,从而大大减少了出版社的成本投入。在数据的验证中,我们将通过抽样调查得出的市场份额与分析总体得到的市场份额进行比较,求出相对误差。发现绝大多数数据误差不超过1,效果较好。在模型改进中,也提出了改进模型的新思路。
  最后,我们还对题目进行了更加完备的讨论和使用说明,并在此题的基础上对出版社提出了意见和建议。

  关键词: 随机抽样 地域性修正 补救无回答 二级抽样调查方法 按需印刷理论

  一、问题背景
  随着党“十一五”发展规划的提出,我国的文化产业也受到了前所未有的重视,同时,“十一五”也宣告了出版产业面临着前所未有的挑战。 “十一五”期间,出版发行业将面临因特网、手机短信、数字出版等科技发展引发的对出版环境的影响,不少出版社和发行单位已经或者正在开始着手对自身未来发展的思考和规划,这种现象本身也是出版业理性回归的一个重要标志。对于出版发行单位而言,战略规划的最大价值在于它的过程,在于培养一种在市场经济环境中的思考与应变能力,而不仅仅是规划的结果。根据加入WTO的承诺,2022年是我国出版分销行业全面放开的最后一年,深化体制改革以应对入世,正在成为出版发行行业的重中之重。行业对竞争力的关注前所未有的重视,任何研究报告、市场调查、行业排名都会触动出版社敏感的神经。教育出版对出版社的竞争力影响大,经营成为最主要的提高竞争力的手段,形成了相对稳定的竞争力优势。因此,占据出版业优势地位的教材出版业更注重对市场的调查研究,对市场作出科学的评估和预测,我们需要的就是一种科学的调查、评估和预测方法。

  二、问题重述
  某出版社出版多类高等教育和职业教育的教材。从出版社的战略发展、投资策略、生产安排、方式、和产品策划等业务考虑,需要对出版社的市场占有率(市场份额)及其逐年变化进行调查。请你设计有效而可行的调查方法,并且建立调查数据的分析模型,以及对市场作出科学评估和预测的方法。
  本题的附录中给出的基础数据是问卷式普查数据,由于抽样成本的限制,普查是不可取的,而且抽样数应该在调查目的的基础上尽量少。
  题目说明
   由于抽样成本,普查不可取,但是抽样方法的样本数和调查效益之间有平衡关系,确定你的抽样数时应该考虑这种平衡关系。
   完整地描述你的调查方法,并且清楚地给出你的模拟数据。如果使用问卷式抽样调查(不限于问卷式),请给出问卷格式。
   给出基于调查数据的市场评估和预测模型,并用数据说明你的方法的有效性和科学性。
   在附录1中给出了一个参考的问卷格式,也给出与该问卷相关的一个数据库附录4。这个数据库是包含十个省,全部学生(为了减少数据量,假定全班学生填表相同,因此每个专业只有一个学生填写问卷)的模拟答卷(包括三年的),作为本竞赛题的背景数据
   附录2中给出供本题提供的数据库的29类教材名称以及分类号,附录3给出某出版社各类教材的三年量,可供查询。
   在附录4中也给出十个省所有学校名称以及其专业名称,你可以用在这些检索词确定你对数据库的取样查询。
   如果你自行选用数据,请给出调查数据的可靠性和合理性的检验方法和数据来源。

  三、基本假设
  为了便于我们从题目的整体理解,从出版社的战略发展、投资策略、生产安排、方式和产品策划等业务考虑,对出版社的市场占有率(市场份额)及其逐年变化进行调查。从而设计有效而可行的调查方法,并且建立调查数据的分析模型,以及对市场作出科学评估和预测的方法。我们在此做出合理的基本假设:
  (1)在相当长的一段时期内教材出版业的市场是基本稳定的;
  (2)社会环境稳定,社会政策关于出版业方面无较大调整;
  (3)门对教材的应用无较大变化;
  (4)学校各专业无较大的变化,学校的人数不会有大幅度的增加或减少;
  (5)教材出版社的数量基本稳定,经营状况起伏不大;
  (6)出版社的经营情况良好,无意外事件发生;
  (7)教材出版社出版的教材质量有保证,无质量问题;

  四、问题的分析与模型的准备
  一、问题的分析
  鉴于本题的附录中所给出的数据较多,有:
  (1)在附录1中给出了一个参考的问卷格式;
  (2)在附录2中给出供本题提供的数据库的29类教材名称以及分类号;
  (3)在附录3给出某出版社各类教材的三年量,可供查询;
  (4)在附录4中给出十个省三年的原始数据以及相对应的学校专业名录;
  (5)还可自行选用数据。
  而且,题目中要求基础数据是问卷式普查数据,由于抽样成本的限制,普查不可取,抽样数应该在调查目的的基础上尽量少,所以,我们从以下方面考虑,处理数据,解决问题:
  首先,我们分析数据库中数据,按一定规则将各大学排序,采用随机抽样的方法,外加地域性修正,把市场调查的范围从205所高校缩小到26所 。针对此26所学校进行问卷调查。我们分析调查所得数据,对于某出版社的市场份额,用与该出版社相关的问卷数与总问卷数的比值来衡量,从而得到三年各出版社市场份额的数据表格,并利用拟合的方法进行预测。
  其次,我们还考虑到了问卷抽样调查过程中有可能出现的特殊情况,即:抽样无回答情况。我们利用两种补救无回答的二级抽样调查方法对此问题进行了解决,传统方法和贝叶斯方法,并对它们之间的异同作简略的概括和比较。此两种方法均是为降低非抽样误差、提高数据质量服务的。可以说在模型的应用一个非常好的补救方案,使我们的模型更加完整,更具有有效性和科学性。
  再次,我们还提出了对按需印刷理论的新理解,从而大大减少了出版社的成本投入。在灵敏度分析中,我们还利用某出版社的数据对模型进行了验证,将模型推广到一般。
  最后,我们还对题目进行了更加完备的讨论和使用说明,并在此题的基础上对出版社提出了意见和建议。
  二、模型的准备(名词解释)

  1、数据压缩
  数据压缩是以信息损失最小为前提,简化或压缩数据以提高其传输、存储和处理效率的一种技术。考虑到数据量相当庞大,需要获取和处理的数据量较多,数据压缩是减少工作量、节省计算机时间的有效方法。可通过去掉间隔、空白段、冗余项目或不必要数据,只保留反映特征的数据等手段实现,达到在给定空间内增加所能存储的数据量,减少数据量所占的空间。数据压缩方法通常有:①削减。用外延或内方法推算冗余数据并将其去掉;②参数抽出。即仅保留特征数据和参数;③等时间采样。按等时间间隔对连续输入的数据进行采样;④编码变换。将数据变成简化代码,或对每个数据块进行编码变换,其效率用每个像元的比特数来衡量;⑤函数应用。根据由等间隔或不等间隔采样得到必要的采样点,用函数算法推算出削减的数据。

  2、无回答
  所谓无回答是指出于某些原因,不能从所有的样本单位或问卷的所有问题中获得所需的信息。它可以是样本单位没有提供或者没有完全提供所需的信息,可以是所提供的信息中有一部分无法使用。无回答的调查者与回答的调查者通常具有不同的特征,因此如果对无回答不进行纠正的话,将会降低样本的有效性和代表性,使调查估计值产生偏差,从而降低调查的精度,甚至导致整个调查的失败。

  3、二级抽样方法
  二级抽样方法是人们常用的一种处理无回答问题的方法,它的基本思想是:对最初的无回答进行再一次的随机抽样,然后用最初样本的回答数据和子样本数据对总体进行估计,以消除无回答的偏差影响,提高估计量的精度。这种方法常用于邮寄调查中。下面我们将介绍两种补救无回答的二级抽样调查方法:传统方法和贝叶斯方法,并对它们之间的异同作简略的概括。

  4、按需印刷
  按需印刷Pnt On Demand,简称POD的本意是指按照不同时间、地点、数量、内容的需求,通过数码及超高速挽印技术实现出版行业整个流程的全新改造来适应个性化、短版化、高效率的现代市场需求。它尤其适用于一些定向较窄、专业性强、可变性强、批昼较小的印刷业务。按需印刷是先进的数据库技术和数字印刷技术相结合的产物。其操作过程是先将图书内容数字化,然后用电子文件在专门的激光打印机上高速印制书页,并完成折页、配页、装订等工序。它具有印刷时间上的即时性,印刷数量、印刷内容的可变性和个性化等特点。
  在此,我们利用它的引申意,按照市场所需的教材的数目进行印制。由于各高校对于教材的需求种类不同,所以,很需要这么一种模式来满足客户的需求,因此,我们在此提出按需印刷模式。
  同时,按需印刷采用即时供货结账的方式,使出版社节省了图书储存空间。实现“零库存”,而且还能解决图书绝版及印数问题。通过按需印刷,出版社可摆脱图书印刷、库存、运输、投资所带来的资金风险和发行量的压力,节省成本。

  五、模型的建立与预测
  (一)、抽样调查方法的陈述
  我们的抽样调查可分前期、中期、后期三个工作阶段,即“样本-数据-分析”。前期工作是进行抽样设计获得调查单位名单,解决向谁搜集统计资料的问题(样本);中期工作是对抽选的调查单位进行统计调查,获得统计数据并对数据进行必要整理,提供准确的、可供统计分析的数据,解决数据获取和数据格式问题;后期工作是利用统计软件对调查和整理得到的数据进行统计分析,得出科学的分析结论,达到统计工作的最终目的(分析)。三者相辅相成,缺一不可。
  抽样调查所考虑的问题在实际抽样调查中无外乎包括以下三个方面: 调查指标估计的精度;调查成本的高低;样本的容量。在抽样调查方案设计中以上三个方面是相互矛盾的。因此,在抽样调查方案设计中应当根据实际对以上三个方面问题进行重要性排序,一般情况下,调查指标估计的精度是最重要的,其次应当考虑调查成本,最后再考虑样本容量。
  所以, 抽样调查方案设计中三个问题的优先级:
   I 是优先级
  以下是我们归纳的抽样调查的步骤:
  1、抽样的目的
  抽样的目的是从已有的普查数据库中选取有代表性的数据,即数据压缩。通过数据压缩,得到误差允许范围内的数据,从而对市场进行科学的评估和预测。
  2、抽样的基本原则
  为了掌握市场的情况,所抽得的数据应该具有全面性和代表性,这是抽样的基本原则。
  3、常用的抽样方法(简述)
  抽样方法可分为概率抽样和非概率抽样两大类。由于非概率抽样结果的可能性不能准确地计量,一般都使用概率抽样方法,简单随机抽样、分层随机抽样和随机抽样均属概率抽样方法。
   简单随机抽样
  简单随机抽样是指“从含有N 个个体的总体中抽取n 个个体,使包含有n 个个体的所有可能的组合被抽取的可能性都相等”。采用此方法抽样时,数据库中的每个数据被抽入样本的机会均等,它是完全不带主观限制条件的随机抽样法。它是一个基本的随机抽样方法,也是其他随机抽样方法的基础。
   分层随机抽样
  有时产品可分为若干层,各层产品质量存在明显的差异,为了取得有代表性的样本,把整批产品分为若干层,使同一层内产品质量尽可能均匀整齐,在各层内分别随机抽取一些产品,合在一起组成一个样本,这样的抽样方法叫分层随机抽样。在正确分层的前提下,分层抽样的代表性比简单随机抽样好,但是如果对批质量的分布不了解或分层不正确,则分层抽样的效果会适得其反。
   随机抽样
  如果一的产品可按一定的顺序排列,并可将其分为数量相当的n 个部分,从每个部分按简单随机抽样方法确定的相同位置,各抽取一个单位产品构成一个样本,这样的抽样方法称为随机抽样。它的代表性在一般情况下比简单随机抽样要好些,但在产品质量波动周期与抽样间隔相当时,抽到的样本单位可能都是质量好的或都是质量差的产品,此时代表性就较差。

  4、抽样方法的正确选择
  为了更好的评估和预测市场,选择合适的抽样方法是非常重要的。
   当数据比较稳定,数据并不多时,选择简单随机抽样,在对总体质量一无所知的情况下,也应选择简单随机抽样。
   当不同的数据来自不同的地域时,为了取得有代表性的样本, 可以采用分层随机抽样。
   当数据不稳定,中间相差较大时,应采用随机抽样。
  根据实际情况, 选择正确合理的抽样方法,提高样本的代表性和随机性, 从而提高抽样的有效性, 是十分重要的。只有科学、合理、有效地实施抽样,才能使我们的要求得以实现。
  为此,我们针对此题数据多,地域性广,各类书籍需求量相差很大等特点,综合考虑三种抽样方法,采取以抽样为主,其它抽样为辅的方法,利用数据压缩解决抽样问题。
  同时,我们还应用了Excel软件,Excel软件在统计分析方面的功能虽不及专业统计软件(如SPSS、SAS等),但它那强大的、灵活易用的数据和整理功能是专业统计软件所不能及的。因此,我们在处理数据方面较多的利用了Excel软件,使我们的处理数据的速度大大加快。
  抽样调查问卷采用题中给出格式。

  (二)、模型的建立

  首先,我们从数据库中查询出一些有用数据,先写在下面。
  学科类别 29类
  出版社数目 25个
  大学数量 205所 ,各个省市对应的大学数量见下(表一):
  北京 广东 河北 安徽 河南 福建 广西 甘肃 贵州 海南
  49 30 26 24 24 14 13 12 9 4
  (表一)

  基于数据库中全部数据,每一年收回问卷数中与该出版社有关的问卷数目,见(表二):
  出版社 第一年与出版社有关的问卷数目 第二年与出版社有关的问卷数目 第三年与出版社有关的问卷数目
  p1 325 323 327
  p559 328 336 346
  p106 353 352 351
  p199 380 379 393
  p307 406 411 418
  p102 444 451 452
  p131 476 475 472
  p511 490 495 503
  p030 497 503 512
  p063 506 508 515
  p416 0 637 635
  p304 654 661 666
  p110 747 754 7
  p246 773 778 781
  p432 871 870 868
  p091 910 913 913
  p118 1002 1015 1031
  p210 1308 1311 1308
  p044 1606 1604 1602
  p390 2041 2035 2025
  p405 3098 3162 3227
  p534 4021 4001 3983
  p293 5095 4947 4767
  p115 18267 18116 177
  p357 20490 206 20812
  (表二)
  分析:题目说明4中,说明了一份问卷的意义。在一份问卷上出现一个出版社的名字,说明填写该问卷的学生所在的整个专业,使用该出版社的教材。我们可以假设,总体上说,专业平均的人数相同,则某一年与某出版社对应的问卷数目越大,在该出版社购书的人越多,说明该出版社的市场占有率越大。

   基于数据库中全部数据,可以考察每一年各个大学的购书情况。我们可以统计出各个大学的学生填写问卷的数目。根据我们的假设,问卷数越大,学校对书的需求量越大。
  我们按不同大学对应的问卷数目降序排列。同时,经分析发现,各大学三年的问卷数目并没有发生变化,因此各大学的排名也不会发生变化,因此,三年的问卷数目都可以按第一年的情况考虑。
  由于大学数目有205所,我们分析得到的各大学排名数据仍然很多,在这里我们省略。
  下面我们来分析每一个问卷数目段中的大学数量:见(表三)

  某大学的填写问卷数目 大学的数量
  700~799 1
  600~699 7
  500~599 34
  400~499 34
  300~399 39
  200~299 38
  100~199 20
  0~99 32
  (表三)

  据此,我们采取随机抽样,对于按填写问卷数目降序排列的205大学,将其分为数量相当的26个部分(按照排名,每8个学校为一个部分,前25部分满额,第26部分有空缺)。对于每个部分,采用简单随机抽样确定相同的位置(本题选用每一部分的第一个位置)。

  下面我们来考察我们现在确定的方案是否符合数据的“全面性、地域性和代表性”
  见(表四)

  省份 北京 广东 河北 安徽 河南 福建 广西 甘肃 贵州 海南
  共有大学数量 49 30 26 24 24 14 13 12 9 4
  选取大学数量 7 4 3 5 1 3 0 1 1 1
  (表四)

  从表格中我们看出,个别数据并不能很好的体现地域性和代表性。我们需要对随机抽样的结果作出人为的微调。举例来说,我们可以把某一所安徽省的学校换为和它排名相差较小的广西省的学校。

  最后,我们确定的学校数量如下(表五):
  省份 北京 广东 河北 安徽 河南 福建 广西 甘肃 贵州 海南
  共有大学数量 49 30 26 24 24 14 13 12 9 4
  调整后选取大学数量 6 4 3 3 3 2 2 1 1 1
  (表五)

  最终我们所选出来具体的大学,结果见下(表六):
  郑州大学 福州大学 广西学院 北京理工大学 中国农业大学 贵州工业大学 河北农业大学 北京联合大学
  河南省 福建省 广西 北京市 北京市 贵州省 河北省 北京市
  744 597 552 542 519 507 470 451

  续上表
  海南大学 广西师范大学 茂名学院 郑州航空工业学院 北京广播学院 商丘师范学院 湛江师范学院 北京机械工业学院
  海南省 广西 广东省 河南省 北京市 河南省 广东省 北京市
  414 405 385 369 342 305 301 276

  续上表
  唐山师范学院 河西学院 仲恺农业技术学院 巢湖学院 福建医科大学 北京电子科技学院 安徽医科大学 安徽中医学院
  河北省 甘肃省 广东省 安徽省 福建省 北京市 安徽省 安徽省
  253 239 208 204 138 103 77 68

  续上表
  中国人民武装警察部队学院 广州体育学院
  河北省 广东省
  35 32
  (表六)
  总结我们的调查方法,是:在205所学校中,选取部分学校作为代表,接受问卷调查。学校的选取方法为:总体采用随机抽样的方法,但为了保证“全面性、地域性和代表性”,也对抽样方法作了一些修正。我们选取了如上26所高校作为发放调查问卷的对象。

  下面,我们根据上述调查方法,从数据库中分别找出第一年26所大学对应每个出版社的问卷数目。我们采用Excel软件进行处理,得出第一年每个出版社对应26所大学的问卷数目的和。
  对应表格如下(表七):
  出版社 P559 P199 P102 P106 P1 P307 P304 P030 P131 P511 P063 P416
  问卷数目 38 45 47 47 49 55 59 67 68 72 85

  续上表
  P110 P246 P091 P118 P432 P210 P044 P390 P405 P534 P293 P115 P357
  88 99 118 119 119 160 204 266 378 515 631 2507 2657
  (表七)

  我们利用Matlab软件,也表示出了第一年每一个出版社对应的问卷数目与总问卷数目的比值如下(表八):
  出版社 P559 P199 P102 P106 P1 P307 P304 P030 P131 P511 P063 P416
  问卷比例 0044 0053 0055 0055 0057 00 0069 0075 0078 0079 0084 0099

  续上表
  P110 P246 P091 P118 P432 P210 P044 P390 P405 P534 P293 P115 P357
  0103 0116 0138 0139 0139 0187 0238 0311 0442 0602 0737 2930 3105
  (表八)

  基于原来的假设和说明,我们可以用它来考察市场占有率。相应的,也可以求出第二年,第三年每一个出版社对应的问卷数目与总问卷数目的比值。
  下面给出第二年的结果,见(表九)

  出版社 P559 P199 P106 P102 P1 P307 P304 P131 P030 P511 P416 P110
  问卷比例 0044 0051 0055 0058 0061 0065 0069 0072 0076 0083 0098 0105

  续上表
  P063 P246 P432 P118 p091 P210 p044 P390 P405 P534 P293 P115 P357
  0107 0118 0138 0141 0139 0185 0259 031 0447 0595 0711 2886 3123
  (表九)

  六、模型的误差分析
  运用Matlab软件,可以求出基于数据库全部数据时,每一年每一个出版社对应的问卷数目与总问卷数目的比值。
  对于我们的采样方法,以第一年为例,我们可以计算两个比值之间的相对误差,以此来检验我们的方法。
  表格见(表十)
  P1
  p559 p106 P199
  p307 p102 p131 p511 p030 p063 p416 p304
  标准 0049 0050 0054 0058 0062 0068 0072 0075 0076 0077 0097 0100
  测量 0057 0044 0055 0053 00 0055 0078 0079 0075 0084 0099 0069
  误差 3% 0% 8% 6% 2% 1% 3% 3% 3% 1% 1% 31%

  续上表
  P110 p246 p432 p091 p118 p210 p044 p390 p405 p534 p293 p115 p357
  0114 0118 0133 0138 0152 0199 0244 0311 0471 0612 0775 2779 3117
  0103 0116 0139 0138 0139 0187 0238 0311 0442 0602 0737 2930 3105
  6% 7% 5% 0 6% 6% 5% 0 2% 6% 9% 4% 4%
  (表十)
  由上面表格可以看出,除个别组外,其余各组的相对误差均小于1。可见我们的方法在精度要求范围内较好。

  七、模型的验证及改进
  从出版社的角度考虑,在印刷方面,我们提出按需印刷理论。为了验证模型的有效性和科学性,我们按地区划分,将10个省市三年的售书情况进行了统计,然后我们利用Excel软件对数据进行了处理,并作出直观的图表,借以26所大学的选取进行验证。
  某出版社三年内在10个省市的售书情况:
   表格见(表十一):

  北京市 广东省 河南省 河北省 安徽省 福建省 甘肃省 广西省 贵州省 海南省 合计
  第一年 3934 2837 2544 2374 1998 1400 1136 1017 844 290 18374
  第二年 3902 2809 2533 2354 1980 13 1133 1017 838 282 18244
  第三年 3870 2773 2504 2315 13 1378 1122 1009 830 283 18047
  合计 11706 8419 7581 7043 5941 4174 3391 3043 2512 855 54655
  平均值 3902 2807 2527 2348 1981 1932 1131 1015 838 285 18222
  排名 1 2 3 4 5 6 7 8 9 10
  (表十一)

  由表格我们可以看出:
  (1)10个省市,每个省市三年中书的数量基本相同,每年数量相差不大;
  (2)在三年中,每一年,10个省市书的总量基本相同,平均每年18222册;
  (3)通过三年的比较,可以得出10个省市每年的售书情况及其排名。

  作图如下:
  (图一)为三年10各省市的售书情况的自然条形图

  (图一)

  (图二)为三年10各省市的售书情况的比例圆饼图

  (图二)
  通过作图,我们可以看出:
  (1)北京市三年内售书最多,达到了4%;广东省其次,达到了4%;河南省紧跟其后,达到了9%;它们三个省市的售书量已达到7%,超过了一半。
  (2)北京市、广东省、河南省、河北省、安徽省、福建省五省的售书量均超过 10%,其五省的总量达到了5%。

  我们根据(附录),可以求出基于我们的模型,P115出版社各个省份所占的百分比,如下(表十二)
  省份 北京 广东 河北 安徽 河南 福建 广西 甘肃 贵州 海南
  百分比 4% 2% 2% 7% 1% 9% 4% 3% 5% 4%
  (表十二)
  可以看出,和圆饼图相比,一些省份的数据有所出入。
  据此,我们找到了模型的改进方向。在选取大学的时候,不仅做到随机抽样和地域性修正,还要做到各个省份学校分布相对均衡。这样所得结果必定效果更好。
  八、模型的补救方案
  在这里,我们将介绍两种补救无回答的二级抽样调查方法:传统方法和贝叶斯方法,并对它们之间的异同作简略的概括。
  一、传统的二级抽样方法
  传统的二级抽样方法最早由Hansen和Hurwitz提出来的。它以传统的统计推论为基础,用简单随机的抽样的方法对总体进行第一次抽样,取得回答单位的观测值及回答单位权重的估计,然后在无回答单位中再随机抽出一个子样本进行调查,取得无回答单位的信息,最后把这两部分调查结果结合起来,对总体作出推断估计。这种方法实际上是一种分层的二级抽样,总体被分为两层,即回答层和无回答层。
  设总体容量为N,其中有 个回答者和 个无回答者, ,随机抽取最初样本,样本容量为 ,其中有 个回答者,样本均值为 ;有 个无回答者, 。然后从 中随机抽取一个子样本 ,其抽样比 ,样本均值为 。总体回答率 ,总体无回答率为 , 。则二级抽样总体均值的估计量为: (1)
  根据二级抽样的抽样方差公式可得:
  (2)
  其中, 是样本方差, 是无回答层的方差。
  可以看出,总体方差的第一项受最初样本 大小的影响,而第二项不仅受 的影响还受无回答者子样本抽样比 的影响。当 时,方差第二项为零,就是说所有调查者都进行了回答,收集到了全部的数据,它相当于样本量为 的简单随机抽样。
  由于考虑上面方差公式中 项与样本的分配无关,所以改写成:
  (3)
  如果考虑二级抽样中两次调查的费用差异,则总费用函数可记为:
  (4)
  其中 为最初样本每单位的调查费用, 为
rainbaobao1116
一、抽样调查的基本知识
  1、概念:它是按照一定方式,从调查总体中抽取部分样本进行调查,用所得的结果说明总体情况的调查方法。抽样调查是现代市场调查中的重要组织形式,是目前国际上公认和普遍采用的科学的调查手段。抽样调查的理论原理是概率论,概率论中诸如中心极限原理等一系列理论,为抽样调查提供了科学的依据。
  2、分类:抽样调查分为随机抽样和非随机抽样两类。
  随机抽样是按照随机原则抽取样本,即在总体中抽取单位时,完全排除了认得主观应因素的影响,使每一个单位都有同等的可能性被抽到。遵守随机原则,一方面可使抽取出来的部分单位的分布情况(如不同年龄、文化程度人员的比例等)有较大的可能性接近总体的分情况,从而使根据样本所做出的结论对总体研究具有充分的代表性;另一方面,遵循随机原则,可有助于调查人员准确地计算抽样误差,并有效的加以控制,从而提高调查的精度。
  非随机抽样不遵循随机原则,它是从方便出发或根据主观的选择来抽取样本非随机抽样无法估计和控制抽样误差,无法用样本的定量资料,采用统计方法来推断总体,但非随机抽样简单易行,尤其适用于做探测性研究。
  3、抽样调查的特点
  (1)从经济上说,抽样调查节约人力、物力和财力
  (2)抽样调查更节省时间,具有较强的时效性
  (3)抽样调查具有较强的准确性
  (4)通过抽样调查,可使资料搜集的深度和广度都大大提高
  尽管抽样调查具有上述优点,但它也存在着某些局限性,它通常只能提供总体的一般资料,而缺少详细的分类资料,在一定程度上难以满足对市场经济活动分析的需要,此外,当抽样数目不足时,将会影响调查结果的准确性。
  4、抽样调查的适用范围
  (1)对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽样方式解决。
  举例:对有性或损耗性质的商品质量检验;对一些具有无限总体的调查(如对森林木材积蓄量的调查)等。
  (2)在经费、人力、物力和时间有限的情况下,采用抽样调查方法可节省费用,争取时效,用较少的人力物力和时间达到满意的调查效果。
  (3)运用抽样调查对全面调查进行验证,全面调查涉及面广、工作量大、花费时间和经费多,组织起来比较困难。但调查质量如何需要检查验证,这时,显然不能用全面调查方式进行。
我们的季节e
现代被广泛应用的抽样调查是概率抽样。因此,现代的抽样调查是指概率抽样,其定义为:抽样调查,又称抽样推断,是一种重要的、科学的非全面调查方法。它根据调查的目的和任务要求,按照随机原则,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据来推断总体。抽样调查按抽样的组织形式划分,有以下几种主要方法:   (1)简单随机抽样(也叫纯随机抽样,SPS抽样)。也就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全,彼此之间无一定的关联性和排斥性。简单随机抽样是其他各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。   (2)等距抽样(也叫机械抽样或抽样,SYS抽样)。是将总体各单位按一定标志或次序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位。特点是:抽出的单位在总体中是均匀分布的,而且抽取的样本可少于纯随机抽样。等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。等距抽样是实际工作中应用较多的方法,目前我国城乡居民收支等调查,都是采用这种方式。   (3)类型抽样(也叫分层抽样,STR抽样)。就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。   (4)整群抽样(又称集团抽样)。就是从总体中成群成组地抽取调查单位,而不是一个一个地抽取调查样本。特点是:调查单位比较集中,调查工作的组织和进行比较方便。但调查单位在总体中的分布不均匀,准确性要差些。因此,在群间差异性不大或者不适宜单个地抽选调查样本的情况下,可采用这种方式。   (5)多阶抽样(又称多级抽样)。就是将调查分成两个或两个以上的阶段进行抽样。第一阶段先将总体按照一定的规范分成若干抽样单位,称之为一级抽样单位(或称初级抽样单位),再把抽中的一级抽样单位分成若干更小的二级抽样单位,从抽中的二级抽样单位再分三级抽样单位等等,这样就形成一个多阶段抽样过程。特点是,在对超大而又复杂总体调查的抽样中实施和更加方便,且不需要对每级抽样单位编制完全的抽样框。   (6)二重抽样(又称两相抽样)。就是先抽取一个容量比较大的初始样本,用初始样本估计总体的某些参数或某些必要的信息作为分层的比例或再次抽样的标志,然后将抽出的初始大样本作为总体,从中抽取容量合适的样本进行比较详细的调查。特点是,适合用于对总体信息了解比较少的调查。   (7)比率抽样(PPS抽样)。就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。特点是总体中含量大的部分被抽中的概率也大,可以提高样本的代表性。   在抽样调查的实际工作中,经常是要将几种抽样方法结合起来应用。比如,城市居民的收支调查,是将二重抽样、多阶段抽样、分层抽样、机械抽样等多种方法结合起来使用。   在现实的商业性的市场调查中也有非概率抽样的应用。如,配额抽样、随意抽样、志愿者抽样、判断抽样、修正的概率抽样和雪球抽样等等,由于这些抽样方法容易出现偏差,所以只在对共性特别强的群体的商业性调查中应用。
1322183606ww
抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。
根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。概率抽样是按照概率论和数理统计的原理从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。在我国,习惯上将概率抽样称为抽样调查。
几种具体的抽样方式:
1、简单随机抽样
简单随机抽样也称为单纯随机抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
简单随机抽样一般可采用掷硬币、掷骰子、抽签、查随机数表等办法抽取样本。在统计调查中,由于总体单位较多,前三种方法较少采用,主要运用后一种方法。
按照样本抽选时每个单位是否允许被重复抽中,简单随机抽样可分为重复抽样和不重复抽样两种。在抽样调查中,特别是社会经济的抽样调查中,简单随机抽样一般是指不重复抽样。
简单随机抽样是其它抽样方法的基础,因为它在理论上最容易处理,而且当总体单位数N不太大时,实施起来并不困难。但在实际中,若N相当大时,简单随机抽样就不是很容易办到的。首先它要求有一个包含全部N个单位的抽样框;其次用这种抽样得到的样本单位较为分散,调查不容易实施。因此,在实际中直接采用简单随机抽样的并不多。
2、分层抽样
分层抽样又称为分类抽样、或类型抽样,它首先是将总体的N个单位分成互不交叉、互不重复的k个部分,我们称之为层;然后在每个层内分别抽选n1、n2、k个样本,构成一个容量为个样本的一种抽样方式。
分层的作用主要有三:一是为了工作的方便和研究目的的需要;二是为了提高抽样的精度;三是为了在一定精度的要求下,减少样本的单位数以节约调查费用。因此,分层抽样是应用上最为普遍的抽样技术之一。
按照各层之间的抽样比是否相同,分层抽样可分为等比例分层抽样与非等比例分层抽样两种。
实际上,分层抽样是科学分组与抽样原理的有机结合,前者是划分出性质比较接近的层,以减少标志值之间的变异程度;后者是按照抽样原理抽选样本。因此,分层抽样一般比简单随机抽样和等距抽样更为精确,能够通过对较少的样本进行调查,得到比较准确的推断结果,特别是当总体数目较大、内部结构复杂时,分层抽样常能取得令人满意的效果。
3、整群抽样
整群抽样是首先将总体中各单位归并成若干个互不交叉、互不重复的集合,我们称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
整群抽样特别适用于缺乏总体单位的抽样框。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。
整群抽样的优点是实施方便、节省经费;缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。
4、等距抽样
等距抽样也称为抽样、或机械抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。
根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。
按照具体实施等距抽样的作法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。
等距抽样的最主要优点是简便易行,且当对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。
5、多阶段抽样
多阶段抽样,也称为多级抽样,是指在抽取样本时,分为两个及两个以上的阶段从总体中抽取样本的一种抽样方式。其具体操作过程是:第一阶段,将总体分为若干个一级抽样单位,从中抽选若干个一级抽样单位入样;第二阶段,将入样的每个一级单位分成若干个二级抽样单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样……,依此类推,直到获得最终样本。
多阶段抽样区别于分层抽样,也区别于整群抽样,其优点在于适用于抽样调查的面特别广,没有一个包括所有总体单位的抽样框,或总体范围太大,无法直接抽取样本等情况,可以相对节省调查费用。其主要缺点是抽样时较为麻烦,而且从样本对总体的估计比较复杂。
6、双重抽样
双重抽样,又称二重抽样、复式抽样,是指在抽样时分两次抽取样本的一种抽样方式,其具体为:首先抽取一个初步样本,并搜取一些简单项目以获得有关总体的信息;然后,在此基础上再进行深入抽样。在实际运用中,双重抽样可以推广为多重抽样。
双重抽样的主要作用是提高抽样效率、节约调查经费。
7、按规模大小成比例的概率抽样
按规模大小成比例的概率抽样,简称为PPS抽样,它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。其抽选样本的方法有汉森-赫维茨方法、拉希里方法等。
PPS抽样的主要优点是:使用了辅助信息,减少抽样误差;主要缺点是:对辅助信息要求较高,方差的估计较复杂等。
上述各种抽样方式均为随机抽样方式。此外还有非随机抽样方式,即按照调查人员主观设立的某个标准抽选样本的抽样方式,如偶遇抽样、立意抽样、配额抽样等。
快乐的精灵王
抽样调查的基本知识
1、概念:它是按照一定方式,从调查总体中抽取部分样本进行调查,用所得的结果说明总体情况的调查方法。抽样调查是现代市场调查中的重要组织形式,是目前国际上公认和普遍采用的科学的调查手段。抽样调查的理论原理是概率论,概率论中诸如中心极限原理等一系列理论,为抽样调查提供了科学的依据。
2、分类:抽样调查分为随机抽样和非随机抽样两类。
随机抽样是按照随机原则抽取样本,即在总体中抽取单位时,完全排除了认得主观应因素的影响,使每一个单位都有同等的可能性被抽到。遵守随机原则,一方面可使抽取出来的部分单位的分布情况(如不同年龄、文化程度人员的比例等)有较大的可能性接近总体的分情况,从而使根据样本所做出的结论对总体研究具有充分的代表性;另一方面,遵循随机原则,可有助于调查人员准确地计算抽样误差,并有效的加以控制,从而提高调查的精度。
非随机抽样不遵循随机原则,它是从方便出发或根据主观的选择来抽取样本非随机抽样无法估计和控制抽样误差,无法用样本的定量资料,采用统计方法来推断总体,但非随机抽样简单易行,尤其适用于做探测性研究。
3、抽样调查的特点
(1)从经济上说,抽样调查节约人力、物力和财力
(2)抽样调查更节省时间,具有较强的时效性
(3)抽样调查具有较强的准确性
(4)通过抽样调查,可使资料搜集的深度和广度都大大提高
尽管抽样调查具有上述优点,但它也存在着某些局限性,它通常只能提供总体的一般资料,而缺少详细的分类资料,在一定程度上难以满足对市场经济活动分析的需要,此外,当抽样数目不足时,将会影响调查结果的准确性。
4、抽样调查的适用范围
(1)对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽样方式解决。
举例:对有性或损耗性质的商品质量检验;对一些具有无限总体的调查(如对森林木材积蓄量的调查)等。
(2)在经费、人力、物力和时间有限的情况下,采用抽样调查方法可节省费用,争取时效,用较少的人力物力和时间达到满意的调查效果。
(3)运用抽样调查对全面调查进行验证,全面调查涉及面广、工作量大、花费时间和经费多,组织起来比较困难。但调查质量如何需要检查验证,这时,显然不能用全面调查方式进行。
普查:普查是专门组织的一次性的全面调查,用来调查 属于一定时点上或一定时期内的社会现象总量。
普查具有资料包括的范围全面、详尽、的优
点,但是普查的工作量大,耗资也多,一般不宜经常 举行。(如全国人口普查)

抽样调查:抽样调查是一种非全面调查,它是按照随机 原则从总体中抽取一部分单位作为样本来进行观察研 究,以抽样样本的指标去推算总体指一种调查。
抽样调查同其他调查比较,既能节省人力物力财 力,有可以提高资料的时交性,而且能取得比较正解 的全面统计资料,具有很多优点。

相关问答

经济师抽样调查题

第一题:第二题:第三题:1、2、扩展资料这部分的内容主要考察的是抽样调查知识点:抽样调查一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象做出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全……

月语星纱

抽样调查方法经济师

一、抽样调查的基本知识  1、概念:它是按照一定方式,从调查总体中抽取部分样本进行调查,用所得的结果说明总体情况的调查方法。抽样调查是现代市场调查中的重要组织形式,是目前国际上公认和普遍采用的科学的调查手段。抽样调查的理论原理是概率论,概率论中诸如中心极限原理等一系列理论,为抽样调查提供了科学的依据……

壹只头俩只脑

抽样调查中级经济师

现代被广泛应用的抽样调查是概率抽样。因此,现代的抽样调查是指概率抽样,其定义为:抽样调查,又称抽样推断,是一种重要的、科学的非全面调查方法。它根据调查的目的和任务要求,按照随机原则,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据来推断总体。抽样调查按抽样的组织……

周闹闹now

中级经济师抽样调查

现代被广泛应用的抽样调查是概率抽样。因此,现代的抽样调查是指概率抽样,其定义为:抽样调查,又称抽样推断,是一种重要的、科学的非全面调查方法。它根据调查的目的和任务要求,按照随机原则,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据来推断总体。抽样调查按抽样的组织……

一首ciao情歌

中级经济师抽样调查书

市场调查分析师证书考试1、报考对象及条件:凡中华人公民均可报名参加所有级别的考试。2、调查分析师证书考试分为三个级别:初级、中级和高级。具体考试课程安排如下:初级课程包括:《社会经济调查方法与实务》、《初等数量分析》、《调查报告写作》。中级课程包括:《消费者行为学》、《调查概论》、《抽样技术(二)》……

馒头笑开了花