广州都市报

您现在的位置: 非处方药 > 非处方药适宜病种 > 省考预测3定义判断统计学难度大,有备

省考预测3定义判断统计学难度大,有备

发布时间:2021-5-3 17:52:09   点击数:

定义判断的命题呈现明显的“学科特征”,在近几年的考试中,常考“统计学”的相关概念,如果之前没接触过相关知识,在考试时很容易做错,这也是区分度很高、命题人特别喜欢考查的方向。

因此老刘今日梳理了近3年考查的“统计学”相关真题,并配备了多道预测模拟题,希望小伙伴们在平时“多下点功夫”,如果能够碰巧遇到相似的题目,在考试时能够轻松一些。

题目1(年江苏)

1.随机试验:指在同一条件下会出现多种可能结果且可以重复进行的试验;试验的所有可能结果虽预先可知,但每次具体实验的结果却无法预知。下列属于随机试验的是:

A.将一壶淡水加热到沸腾,观察其状态变化的实验

B.在狮子身上安装定位设备了解其生活习性的实验

C.为检测某辆新款汽车的安全性能所做的撞击实验

D.抛一枚硬币观察带有数字的一面朝上次数的实验

题目2(年陕西)

2.古典概率通常又叫事前概率,是指当随机事件中各种可能发生的结果及其出现的次数都可以由演绎或者外推法得知,而无需经过任何统计试验即可计算各种可能发生结果的概率。古典概率是以这样的假设为基础的,即随机现象所能发生的事件是有限的、互不相容的,而且每个基本事件发生的可能性相等。根据上述定义,下列判断中属于古典概率的是:

A.某裁判通过抛硬币来决定哪个队先开球,因为他认为抛硬币出现正反的可能性各为1/2

B.某赌者通过大量抛骰子试验,发现出现各个点数的概率接近1/6

C.某人观察空中云彩,认为明天下雨的可能性为1/5

D.某专家认为,在一个地质断层的场所建造核电站,出现事故的概率为1/2

题目3(年吉林)

3.众数是一组数据中出现次数最多的一个数据。平均数是一组数据中表示平均每份的数量。中位数是一组数据按大小顺序排列,位于最中间的一个数据。

根据上述定义,下列说法错误的是

A.平均数说明的是整体的平均水平,中位数说明的是生活中的中等水平

B.日常生活中诸如“最佳”“最受欢迎”的评选,一般都与众数有关系

C.平均数通过计算得出,中位数通过排序得出,众数是通过计数得出的

D.个别极端数据对平均数的影响不明显,对众数和中位数的影响则较大

题目4(年事业单位)

4.系统抽样是将总体的全部单元按照一定顺序排列,先随机抽取第一个样本,再以此样本为起点,按照某种确定的规则顺序抽取其余的样本单元的抽样方法。根据上述定义,下列抽样中属于系统抽样的是()。

A.为了从标有1~15号的15个球中选3个作样本,先随机选取2号球,再抽取7号、12号入样

B.工厂生产的产品用传送带送入包装车间,检验人员从传送带上每隔五分钟抽一件产品进行检验

C.为了进行某项市场调查,在商场门口随机选择消费者进行询问,直到询问人数满足事先规定为止

D.电影院为了解观众对某部电影的观感,邀请每排座位号为14的观众填写调查问卷

题目5(年国考)

5.算术平均数描述了一组数据的平均趋势,是所有数据之和除以数据个数所得之商。在统计学中使用时应注意:出现极端数值、模糊不清的数据或者不同质的数据时,均不能计算算术平均数。

根据上述定义,下列适于计算算术平均数的是:

A.某公司统计35岁以下青年职工的年平均收入,发现基本处于10~12万元之间,其中有一人为公司高管,年收入百万元以上

B.某社区统计该社区居民的平均年龄,其中包括10岁以下儿童人,90岁以上老人26人

C.某学校统计本校青少年平均身高,将该校学前部、小学部和中学部全部学生计算在内

D.某市统计该市各区县留守儿童的平均数量,其中外出务工人员数量较多的区县无法进行准确统计,只提供了估算数据

题目6(年国考)

6.一般来说,科学实验中主要涉及三种变量:自变量、因变量和控制变量。自变量是指在实验中由实验者操作的变量。因变量是指随着自变量的变化而变化的变量。控制变量是指实验中除自变量以外的影响实验变化和结果的潜在因素或条件。根据上述定义,下列说法正确的是:

A.研究小麦供给量受当地采购价格的影响,小麦供给量是控制变量,采购价格是因变量

B.研究不同税率对稀土出口量的影响,稀土出口量是自变量,税率是因变量

C.研究气候条件对棉花产量的影响,气候条件是因变量,害虫影响是控制变量

D.研究制糖厂营业额受糖产量的影响,糖的单价是控制变量,糖产量是自变量

题目7(年国考)

7.统计数据分为定性数据与定量数据。定性数据包括分类数据和顺序数据。分类数据是指只能归于某一类别的非数字型数据,它是对事物进行分类的结果,用文字表述;顺序数据是指归于某一有序类别的非数字型数据。定量数据是指表现为具体数字观测值的数据。

①按城市规模可将城市分为特大城市、大城市、中等城市和小城市;

②婚姻状况:1-未婚,2-已婚,3-离异,4-丧偶;

③A地到B地的距离为公里,到C地为公里,到D地为公里;

④某医院建筑面积37.5万平方米,开放床位个,临床医生个。

根据上述定义,关于以上4组数据的说法正确的是:

A.②④都是分类数据

B.②③④都是定量数据

C.①②都是顺序数据

D.仅②是分类数据

答案解析(1/2)

题目1

D

本题属于单定义中的脉络型,主要考查“数学统计”相关的知识。

随机试验的关键信息是:(1)在同一条件下会出现多种可能结果;(2)可以重复进行试验;(3)试验的所有可能结果预先可知,但每次具体实验的结果无法预知。

A项:将水加热到沸腾观察其状态变化,满足(2)可以重复进行的试验,而水沸腾后一定会变成气态,不满足(1)同一条件下会出现多种可能结果,也不满足(3)每次具体实验的结果无法预知,不符合定义,排除。

B项:在狮子身上安装定位设备了解其生活习性,满足(2)可以重复进行的试验,但狮子的生活习性不同也难以琢磨,不满足(3)试验的所有可能结果预先可知,不符合定义,排除。

C项:对某辆新款汽车进行撞击实验是可行的,但无法对该辆汽车重复进行撞击试验,不满足(2)可以重复进行的试验,不符合定义,排除。

D项:抛一枚硬币观察数字一面朝上的次数,满足(2)可以重复进行的试验;每次抛出后的数字朝向可能不同,满足(1)同一条件下会出现多种可能结果;并且数字一面要么朝上要么朝下,满足(3)所有可能结果预先可知,但是每次具体实验的结果,即数字的朝向却不可预知,满足(3)每次具体实验的结果无法预知,符合定义,当选。

因此本题选D。

题目2

A

本题属于单定义中的脉络型,主要考查“数学统计”相关的知识。

古典概率的关键信息包括:(1)随机事件中各种可能发生的结果及其出现的次数都可以由演绎或者外推法得知;(2)无需经过任何统计试验即可计算各种可能发生结果的概率。

A项:“硬币只有正反两面,且每面出现的概率相等”,体现出(1)随机事件中各种可能发生的结果及其出现的次数都可以由演绎或者外推法得知;所以抛硬币出现正反面的概率为1/2,体现出(2)无需经过任何统计试验即可计算各种可能发生结果的概率。符合定义,当选。

B项:通过大量抛骰子的试验发现概率,不符合(2)无需经过任何统计试验即可计算各种可能发生结果的概率,不符合定义,排除。

C项:观察云彩推算明天下雨的概率,不符合(2)无需经过任何统计试验即可计算各种可能发生结果的概率,不符合定义,排除。

D项:地质断层处建造核电站出现事故的概率,是专家通过科学论证后得出的,不符合(2)无需经过任何统计试验即可计算各种可能发生结果的概率,不符合定义,排除。

因此本题选A。

题目3

D

本题属于多定义,主要考查匹配型。

(1)众数:一组数据中出现次数最多的一个数据;

(2)平均数:一组数据中表示平均每份的数量;

(3)中位数:一组数据按大小顺序排列,位于最中间的一个数据。

A项:平均数说明整体的平均水平,而中位数在日常生活中经常被看做中等水平的一个标准,比如平均收入和中等收入水平,说法正确,排除。

B项:“最佳”“最受欢迎”的评选都是选出被支持、被投票最多的,而众数就是体现一组数据中出现次数最多的一个,两者之间是存在关联的,说法正确,排除。

C项:说明了三种统计数据的获取方式,平均数需要得到总数,再除以个数,需要计算得出,中位数是把所有数据按大小排序,找出位于中间位置的数据,它是通过排序得到的,而众数是把相同的最多的数据给找到,需要通过计数来得到,说法正确,排除。

D项:个别极端数据对平均数的影响是十分显著的,但是对于众数和中位数可能并没有任何影响,说法错误,当选。

因此本题选D。

题目4

A

本题属于单定义中的脉络型,主要考查“数学统计”相关的知识。

系统抽样是指:将总体按照一定顺序排列,先随机抽取第一个样本,再以此样本为起点,按照某种确定的规则顺序抽取其余的样本。

A项:15个球按照1~15排序,先随机抽取第一个样本“2号”,再以每隔5个的规则顺序抽取7号、12号,属于按照某种确定规则顺序抽取其余的样本,符合定义,当选。

B项:将工厂生产的产品用传送带送入包装车间,未体现“将总体按照一定顺序排列”,且每隔5分钟抽取一件产品并非是随机抽取的第一个样本,不符合定义,排除。

C项:随机选择消费者调研,未体现“将总体按照一定顺序排列”,不符合定义,排除。

D项:邀请每排座位号为14的观众填写调研,未体现“先随机抽取第一个样本”,不符合定义,排除。

因此本题选A。

题目5

B

本题属于单定义中的脉络型,主要考查“数学统计”学科的相关知识。

不适于算术平均数计算的情形包括:(1)极端数值(2)模糊不清的数据(3)不同质的数据。

A项:“年平均收入基本处于10~12万元之间,其中有一人年收入百万元以上”,体现出(1)极端数值,不适于算术平均数计算,排除。

B项:“统计该社区居民的平均年龄,无论是10岁以下还是90岁以上,都属于社区居民,且年龄包含各个年龄段”,未体现(1)(2)(3)中的任意一个,适于算术平均数计算,当选。

C项:“统计本校青少年的平均身高”,但是把“学前部、小学部的学生也计算在内,体现出(3)不同质的数据,不适于算术平均数计算,排除。

D项:“只提供了估算数据”,体现出(2)模糊不清的数据,不适于算术平均数计算,排除。

因此本题选B。

题目6

D

本题属于多定义,主要考查“匹配型”。

(1)自变量:在实验中由实验者操作的变量。

(2)因变量:随着自变量的变化而变化的变量。

(3)控制变量:实验中除自变量以外的影响实验变化和结果的潜在因素或条件。

A项:“研究小麦供给量受当地采购价格的影响”,小麦供给量是自变量,而非“控制变量”,当地采购价格是因变量,说法错误,排除。

B项:“研究不同税率对稀土出口量的影响”,税率是自变量,而非“因变量”,稀土出口量是因变量,而非“自变量”,说法错误,排除。

C项:“研究气候条件对棉花产量的影响”,气候条件是自变量,而非“因变量”,棉花产量是因变量,其他的因素,如害虫影响是控制变量,说法错误,排除。

D项:“研究制糖厂营业额受糖产量的影响”,糖产量是自变量,制糖厂营业额是因变量,其他的因素,如糖的单价是控制变量,说法正确,当选。

因此本题选D。

题目7

D

本题属于多定义,主要考查“匹配型”。

(1)分类数据:非数字型数据,对事物进行分类的结果,用文字表述。

(2)顺序数据:归于某一有序类别的非数字型数据。

(3)定量数据:表现为具体数字观测值的数据。

例证①:将城市按照规模分为特大城市、大城市、中等城市和小城市,属于“归于某一有序类别的非数字型数据”,是顺序数据。

例证②:依据婚姻状况不同而将人分成四类,类别之间不存在排列顺序,体现出“非数字型数据,对事物进行分类的结果,用文字表述”,是分类数据。

例证③:分别列举了A地到B、C、D三地的具体距离,体现出“表现为具体数字观测值的数据”,是定量数据。

例证④:医院的建筑面积、床位、临床医生等具体数据,体现出“表现为具体数字观测值的数据”,是定量数据。

因此本题选D。

题目8(预测模拟题)

8.异众比率是统计学当中研究现象离中趋势的指标之一。异众比率指的是总体中非众数次数与总体全部次数之比,换句话说,异众比率指非众数组的频数占总频数的比例。四分位差也称四分间距,主要用于测度顺序数据的离散程度,是指将各个变量值按照大小顺序排列,然后将此数列分成四等份,所得第三个四分位上(即位于75%)的值与第一个四分位上(即位于25%)的值的差。

根据以上定义,下列说法错误的是:

A.异众比率越大,说明众数的代表性就越好

B.异众比率越大,说明非众数组的频数占总频数的比重越大

C.四分位差反映了中间50%数据的离散程度

D.四分位差的数值越大,说明中间的数据越分散

题目9(预测模拟题)

9.敏感性分析最早是用于投资项目的经济评估中常用的分析不确定性的方法之一。从多个不确定性因素中,每次只允许一个因素发生变化而假定其他因素不变,以此来逐一找出对投资项目经济效益指标有重要影响的敏感性因素,并分析、测算其对项目经济效益指标的影响程度和敏感性程度。若某参数的小幅度变化能导致经济效益指标的较大变化,则称此参数为敏感性因素。后来该分析方法也被广泛应用于其他领域。

根据以上定义,以下关于敏感性因素的说法正确的是。

A.甲研究发现,某农作物产量受日照时长、空气湿度、施肥天数这三个因素的影响,假定日照时长、空气湿度这两个因素不变,当施肥天数为50天时,该农作物产量为每亩地0斤,由此甲推出施肥天数是影响该农作物产量的敏感性因素

B.乙研究发现,某商品的销售量受其销售单价这一个因素的巨大影响,当单价为元时,每天只能卖出50个,当单价为95元时,每天能卖出个,由此乙推出销售单价是影响该商品销售量的敏感性因素

C.丙研究发现,某房地产投资项目的利润受销售收入、银行利率这两个因素的影响,假定销售收入不变,当银行利率为4%时,利润为万元,当银行利率为3.9%时,利润为0万元,由此丙推出银行利率是影响该房地产投资项目利润的敏感性因素

D.丁研究发现,某个胖子减掉的体重受每天跑步时间、吃米饭数量这两个因素的影响,假定每天吃米饭数量不变,当每天跑步10分钟时,其每天减掉的体重是克,当每天跑步10.5分钟时,其每天减掉的体重是0克,由此丁推出跑步时间是影响该胖子减掉体重量的敏感性因素

题目10(预测模拟题)

10.伯努利试验是在同样的条件下重复地、相互独立地进行的一种随机试验,其特点是该随机试验只有两种可能结果:发生或者不发生。当我们反复进行伯努利试验,去观察这些试验有多少是发生的,多少是不发生的,事情就变得有意义了,这些累计记录包含了很多潜在的非常有用的信息。

根据以上定义,以下哪一项属于伯努利试验。

A.连续独立地抛掷硬币一千次,记录出现正反面的次数,出现正面的概率为52%。

B.连续独立地抛掷骰子一千次,记录出现1-6点的次数,出现每个点数的概率分别为1/6

C.从只有黑白两个球的箱子中每次抽取1个球后放回,重复一千次,记录连续两次抽到黑球的次数,出现连续两次为黑球的概率为25%

D.连续统计某公交车每天的载客人次,持续一千天,记录每天的载客人数,载客人数在-人的概率为50%,载客人数大于人的概率为30%

题目11(预测模拟题)

11.单盲试验是统计分析中常用的一种试验方法,在单盲试验中,只有研究者了解分组情况,研究对象不知道自己是试验组还是对照组。这种试验方法的优点是研究者可以更好地观察研究对象。根据以上定义,以下属于单盲试验的是()

A.为了比较两款饮品的口感,某公司将饮品A都倒入红色杯子中,将饮品B都倒入白色杯子中,并找了若干消费者,在不向他们透露细节的情况下,让他们选择更喜爱哪种

B.在检查视力时,为了准确地知道每只眼睛的视力水平,医生会让检查者轮流遮住一只眼睛

C.针对某种新型药物的疗效进行检验,寻找两组各项指标相近的患者,一组服用新药,一组服用安慰剂,患者和医生都不知道谁被给予了新药,谁被给予了安慰剂,1周后比较效果

D.李老师用同样的教学方法教两个班级,一个班平均分90分,另一个班平均分却只有70分

题目12(预测模拟题)

12.当人们尝试探究两种变量是否具有相关性的时候,会分别对之进行分组研究。然而,在分组比较中都占优势的一方,在总评中有时反而是失势的一方。该现象于20世纪初就有人讨论,但一直到年,E.H.辛普森在他发表的论文中阐述此一现象后,该现象才算正式被描述解释,后来就以他的名字命名此悖论,即辛普森悖论。

根据以上定义,以下属于辛普森悖论的是()

A.某学校今年的研究生招生中,经管学院录取率为男生70%,女生50%,法学院录取率为男生10%,女生5%,但该校这两个学院的女生总体录取率反而高于男生

B.在某次篮球比赛中,甲队的平均身高、投篮命中率均高于乙队,甲队的平均年龄也小于乙队,但比赛的结果却是甲队输给了乙队

C.老板将一件事情分配给下属去做,如果只分配给小李一个人,小李需要5小时,如果只分配给小张一个人,小张需要4小时,现在老板决定让小李和小张共同完成,结果却花了8个小时

D.某企业一名金牌销售的销售方案取得成功后,该企业所有的销售人员都采用该方案,结果反而使得企业收入出现下滑

题目13(预测模拟题)

13.分类变量是说明事物类别的一个名称,其变量值是定性的,表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类。无序分类变量是指所分类别或属性之间无程度和顺序的差别;有序分类变量是指各类别之间有程度的差别。

根据以上定义,以下涉及有序分类变量的是()

A.某市居民的血型可以分为:A、B、AB、O型

B.某班同学语文期末考试可以分为:60分以下、60-80分、80分以上

C.刘老师今年年终考核的结果为:优秀

D.对于患者的尿糖化验结果:可以分类-、±、+、++、+++

答案解析(2/2)

题目8

A

本题属于多定义,主要考查匹配型。

异众比率:非众数次数占全部次数的比例。

四分位差:第三个四分位上(即位于75%)的值与第一个四分位上(即位于25%)的值的差。

A项:异众比率越大,说明非众数次数占比越大,众数占比越小,代表性越差,说法错误,当选。

B项:异众比率越大,说明非众数次数占比越大,说法正确,排除。

C项:四分位差由位于75%的值与25%的值相减所得,刚好反映了中间50%数据的离散程度,说法正确,排除。

D项:四分位差的数值越大,说明数值排名25%-75%的数越离散,即中间的数据越分散,说法正确,排除。

因此本题选A。

题目9

D

本题属于单定义中的脉络型,主要考查“数学统计”相关的知识。

敏感性因素的关键信息是:(1)存在多个不确定的影响因素;(2)每次只改变其中一个因素而其他因素保持不变;(3)该参数小幅变动将导致指标的较大变化。

A项:甲只列出了当其他因素不变,施肥天数为50天这一种情况下的作物产量,未体现施肥天数这一因素的“变动”对产量的影响,没法推出施肥天数是敏感性因素,排除。

B项:销售量只受销售单价这一个因素的影响,并非“存在多个不确定的影响因素”,因此没法推出销售单价是敏感性因素,排除。

C项:当银行利率从4%变为3.9%时,利润仅从万变为0万元,并未导致较大的变化,因此没法推出银行利润是敏感性因素,排除。

D项:减掉的体重量受跑步时间和吃米饭数量两个因素影响,当吃米饭数量不变时,跑步时间的小幅变动(从10分钟到10.5分钟),就能引起减掉体重量的较大变化(从克到0克),说明跑步时间是影响减掉体重量的敏感性因素,当选。

因此本题选D。

题目10

A

本题属于单定义中的脉络型,主要考查“数学统计”相关的知识。

伯努利试验是指:重复、独立地进行只存在“发生或不发生”这两种结果的随机试验。

A项:连续独立抛掷硬币,每次硬币只存在正面和反面这两种结果,符合定义,当选。

B项:连续独立抛掷骰子,每次骰子出现的点数可能存在1-6这6种结果,而并非两种结果,不符合定义,排除。

C项:连续2次抽到黑球,说明试验并非相互独立的,而是前后有关联,不符合定义,排除。

D项:每天的载客人数是随机的,并非只存在两种结果,即使分成区间,也包括了“小于人”,“-人”,“大于人”这三个区间,不符合定义,排除。

因此本题选A。

题目11

A

本题属于单定义中的脉络型,主要考查“数学统计”相关的知识。

单盲试验的关键信息是:只有研究者了解分组情况,研究对象不知道自己是试验组还是对照组。

A项:研究者-“某公司”知道饮品的分组情况,但是研究对象-“消费者”并不清楚,符合定义,当选。

B项:检查视力水平与“统计分析”无关,也不涉及分组,不符合定义,排除。

C项:“研究者-医生和研究对象-患者都不知道分组情况”,是双盲试验,不符合定义,排除。

D项:“李老师用同样的方法教学”,未体现对班级进行分组,不符合定义,排除。

因此本题选A。

题目12

A

本题属于单定义中的脉络型,主要考查“数学统计”相关的知识。

辛普森悖论是指:分组研究两种变量的相关性时,在分组比较中都占优势的一方,在总评中反而是失势的一方。

A项:为了研究“录取率”与“性别”这两种变量的相关性,分成了“经管学院”和“法学院”这两组,在分组中都占优势的“男生”,在计算总体录取率时反而低于“女生”,体现出“在分组比较中都占优势的一方,在总评中反而是失势的一方”,符合定义,当选。

B项:出现了“身高”、“投篮命中率”“年龄”“输赢”等多种变量,而并非两种变量,不符合定义,排除。

C项:老板将同一件事情按照不同的方案进行分配,未体现“研究两种变量的相关性,在分组比较中都占优势的一方”,不符合定义,排除。

D项:该企业所有的销售人员都采用该方案,未体现“在分组比较中都占优势的一方”,不符合定义,排除。

因此本题选A。

题目13

D

本题属于多定义,主要考查“辨析型”中选是的题目。

(1)分类变量:说明事物类别,变量值是定性的,且变量值互不相容;

(2.1)无序分类变量:类别或属性之间无程度和顺序的差别。

(2.2)有序分类变量:指各类别之间有程度的差别。

A项:居民的血型,变量值是定性的,但是各个血型之间无程度和顺序的差别,是无序分类变量,不属于有序分类变量,排除。

B项:同学的考试成绩,变量值是定量的,而非定性的,不属于有序分类变量,排除。

C项:只涉及刘老师一个人的考核结果,未体现“事物类别”,以及“互不相容的定性变量值”,不属于有序分类变量,排除。

D项:尿糖化验结果,变量值是定性的,且根据符号“-、±、+、++、+++”的不同,表示尿糖含量的不同,“+”越多,表示糖含量越高,体现出“有程度的差别”,属于有序分类变量,当选。

因此本题选D。

跟着老刘学公考



转载请注明:http://www.shoujik.com/fcfysybz/6780.html

热点文章

  • 没有热点文章

推荐文章

  • 没有推荐文章
网站简介 | 发布优势 | 服务条款 | 隐私保护 | 广告合作 | 合作伙伴 | 版权申明 | 网站地图

当前时间: