【www.guakaob.com--会计硕士】
第三讲 数据分析初步
一.<新课标要求>
1.理解平均数的意义,能计算中位数,众数,加权平均数,了解它们是数据集中趋势的描述.
2.体会刻画数据离散程度的意义,会计算简单数据的方差.
3.体会样本与总体的关系,知道可以通过样本平均数,样本方差推断总体平均数和总体方差.
4.能解释统计结果,根据结果作出简单的判断和预测,并能进行交流. 二.达标题
1.(2013•昭通)已知一组数据:12,5,9,5,14,下列说法不正确的是( )
A.平均数是9 B.中位数是9 C.众数是5 D.极差是5
A.6 B.7 C.8 D.9
3.(2013•重庆)为了比较甲乙两种水稻秧苗谁出苗更整齐,每种秧苗各随机抽取50株,分别量出每株长度,发现两组秧苗的平均长度一样,甲、乙的方差分别是3.5、10.9,则下列说法正确的是( )
A.甲秧苗出苗更整齐 B.乙秧苗出苗更整齐
C.甲、乙出苗一样整齐 D.无法确定甲、乙出苗谁更整齐
4.(2013•舟山)在某次体育测试中,九(1)班6位同学的立定跳远成绩(单位:m)分别为:1.71,1.85,1.85,1.95,2.10,2.31,则这组数据的众数是( )
A.1.71 B.1.85 C.1.90 D.2.31
5.(2013•自贡)某班七个合作学习小组人数如下:4、5、5、x、6、7、8,已知这组数据的平均数是6,则这组数据的中位数是( )
A.5 B.5.5 C.6 D.7
A.0.4和0.34 B.0.4和0.3 C.0.25和0.34 D.0.25和0.3
第四讲 平行四边形和特殊平行四边形
一.<新课标要求>
1.了解多边形的定义,多边形的顶点,边,内角,外角,对角线等概念;探索并掌握多边形内角和,与外角和公式.
2.理解平行四边形,矩形,菱形,正方形的概念,以及它们之间的关系;了解四边形的不稳定性.
3.探索并证明平行四边形的性质定理:平行四边形的对边相等,对角相等,对角线互相平分;探索并证明平行四边形的判定定理:一组对边平行且相等的四边形是平行四边形;两组对边分别相等的四边形是平行四边形;对角线互相平分的四边形是平行四边形.
4.了解两条平行线之间距离的意义,能度量两条平行线之间的距离.
5.探索并证明矩形,菱形,正方形的性质定理:矩形的四个角都是直角,对角线相等;菱形的四条边相等,对角线互相垂直;以及它们的判定定理:三个角是直角的四边形是矩形,对角线相等的平行四边形是矩形;四边相等的四边形是菱形,对角线互相垂直的平行四边形是菱形.正方形具有矩形和菱形的一切性质.
6.探索并证明三角形的中位线定理. 二.达标题
1.(2013•宜昌)四边形的内角和的度数为( )
A.180° B.270° C.360° D.540°
2.(2013•湛江)已知一个多边形的内角和是540°,则这个多边形是( )
A.四边形 B.五边形 C.六边形 D.七边形
3.(2013•扬州)一个多边形的每个内角均为108°,则这个多边形是( )
A.七边形 B.六边形 C.五边形 D.四边形
4.(2013•资阳)一个正多边形的每个外角都等于36°,那么它是( )【数据的初步分析】
A.正六边形 B.正八边形 C.正十边形 D.正十二边形 5.(2013•宜宾)如图,已知O是四边形ABCD内一点,OA=OB=OC,∠ABC=∠ADC=70°,则∠DAO+∠DCO的大小是( )
A.70°
B
.110
° C.140° D.150°
(5) (6) (7)
6.(2013•益阳)如图,在平行四边形ABCD中,下列结论中错.误.的是( )
A.∠1=∠2 B.∠BAD=∠BCD C.AB=CD D.AC⊥BD 7.(2013•云南)如图,平行四边形ABCD的对角线AC、BD相交于点O,下列结论正确的是( )
A.S▱ABCD=4S△AOB B.AC=BD C.AC⊥BD D.▱ABCD是轴对称图形
8.(2013•黔西南州)已知▱ABCD中,∠A+∠C=200°,则∠B的度数是( )
A.100° B.160° C.80° D.60° 9.(2013•襄阳)如图,平行四边形ABCD的对角线交于点O,且AB=5,△OCD的周长为23,则平行四边形ABCD的两条对角线的和是( )
A.18
B.28 C.36 D.46
(9) (10) 10.(2013•泰安)如图,在平行四边形ABCD中,AB=4,∠BAD的平分线与BC的延长线交于点E,与DC交于点F,且点F为边DC的中点,DG⊥AE,垂足为G,若DG=1,则AE的边长为( )
A.2 B.4
C.4
D.8
11.(2013•潍坊)下
面的图形是天气预报的图标,其中既是轴对称图形又是中心对称图形的是( )
A. B. C. D.
12.(2013•泸州)四边形ABCD中,对角线AC、BD相交于点O,下列条件不
能判定这
个四边形是平行四边形的是( )
A.AB∥DC,AD∥BC B.AB=DC,AD=BC
C.AO=CO,BO=DO D.AB∥DC,AD=BC
(12) (14)
13.(2013•西宁)如果等边三角形的边长为4,那么等边三角形的中位线长为( )
A.2 B.4 C.6 D.8 14.(2013•淄博)如图,△ABC的周长为26,点D,E都在边BC上,∠ABC的平分线垂直于AE,垂足为Q,∠ACB的平分线垂直于AD,垂足为P,若BC=10,则PQ的长为( )
A.35 B. C.3 D.4 22
15.用反证法证明“在同一平面内,若a⊥c,b⊥c,则a∥b”时,应假设( )
A.a不垂直于c B.a,b都不垂直于c
C.a⊥b D.a与b相交
16.对于命题“如果a>b>0,那么a2>b2.”用反证法证明,应假设( )
A.a2>b2 B.a2<b2 C.a2≥b2 D.a2≤b2 17.证明“一个三角形中,至少有一个内角小于或等于60°”.运用反证法时,假设正确的是( )
A.△ABC中,∠A<60°且∠B=60°
B.△ABC中,∠A、∠B、∠C都不小于60°
C.△ABC中,∠A<60°且∠B<60°
D.△ABC中,∠A、∠B、∠C都大于60°
18.(2013•茂名)如图,矩形ABCD的两条对角线相交于点O,∠AOD=60°,AD=2,则AC的长是( )
A.2
B
.4
C.2 D.4
(18) (19) (20) 19.(2013•济宁)如图,矩形ABCD的面积为20cm2,对角线交于点O;以AB、AO为邻边做平行四边形AOC1B,对角线交于点O1;以AB、AO1为邻边做平行四边形AO1C2B;„;依此类推,则平行四边形AO4C5B的面积为( )
A.5255252cm B.cm2 C.cm D.cm 481632
20.(2013•淄博)如图,菱形纸片ABCD中,∠A=60°,折叠菱形纸片ABCD,使点C落在DP(P为AB中点)所在的直线上,得到经过点D的折痕DE.则∠DEC的大小为( )
A.78° B.75° C.60° D.45°
21.(2013•东营)如图,E、F分别是正方形ABCD的边CD、AD上的点,且CE=DF,AE、BF相交于点O,下列结论:
(1)AE=BF;(2)AE⊥BF;(3)AO=OE;(4)S△AOB=S
A.4个 B.3个 C.2个 D.1个 四边形DEOF中正确的有( )
第一章 数据的初步分析
一个数据可能有很多变量和观测值,这些变量和观测值可以通过一些简单的表格、图形以及少数的特征统计量来进行描述。这些方法在统计学中称为描述性统计分析方法,其目的在于帮助我们整理、展示数据,使得我们可以了解数据的特征,进而为进一步的统计推断做好准备。
通过计算机软件做数据的描述性分析,可以使我们更加直观、便捷地了解数据特征,有利于对统计描述的理解。本章的实验重点是介绍如何运用R软件来对数据进行描述性分析,并掌握描述性统计的基本方法和概念。
实验一 数据的统计量描述
一、
实验目的
初步了解数据的特点、分布形状;熟悉R软件的程序结构;学会使用R软件计算数据的描述统计量。 二、
实验内容
掌握通过R软件读入或输入数据,并能够计算数据集的均值、中位数、分位数、方差、标准差、变异系数、偏度系数以及峰度系数。 三、
准备知识
1. 位置的度量
所谓位置的度量就是那些用来描述数据集中趋势的统计量。常用的有均值、众数、中位数、百分位数等。
平均数(Mean):
x
xi
中位数(Median):一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数,即
me= 1
2
x n+1 当n为奇数时
2
xn+xn 当n为偶数时
中位数描述的是数据的中心位置不受数据分布的影响,具有稳健性,是数据分析中相当重要的统计量。
众数(Mode):在一组数据中,出现次数最多的那个数据。
百分位数:百分位数是中位数的推广。将数据按从小到大排序后,对于0≤p<1,它的分位点定义为
x np +1 当np不是整数时
mp= 1
x+x(np+1) 当n是整数时(np)
其中[np]为np的整数部分。
2. 离散趋势度量
表示数据分散或变异程度的特征统计量,常用的有方差、标准差、变异系数等
样本方差S2(Sample Variance):描述数据取值分散性的一个度量,即
S(xi)2n1)
2
i1n
样本标准差S(Standard Deviation):样本方差的开方,即
SS2
变异系数(CV):变异系数是刻画数据相对分散性的一种度量
s
CV=100×(%)
是一个无量纲的量,用百分数表示。
3. 分布形状的度量
数据分布形状的度量包括偏度系数和峰度系数。 偏度系数:计算公式为
nn2μ3
3
g1= (xi−x )=i=1n
s是标准差,μ3是样本三阶中心矩,即μ3=n n )3.偏度系数是刻画数i=1(xi−x据的对称性指标。关于均值对称的数据偏度系数为0.数据左偏时,对称系数为正,右偏时为负。
峰度系数:计算公式
1
2
n(n+1(n−1)
g2= (xi−x )4−3 i=1
n
n2(n+1)μ4(n−1)2
=−3 s是标准差,μ4是样本四阶中心矩,即μ3=n n )4.来自正态总体的数i=1(xi−x据峰度近似为0;如果样本数据的峰度大于0,则该数据的总体分布比正太分布的尾部更分散;如果一个样本数据的峰度小于0,则总体分布较正太分布更集中。 四、
实验背景
1
某灯泡生产厂商测试某种新型灯泡的燃烧寿命,如下数据表格列出了200个灯泡样本的可使用小时数。
计算数据集的均值、中位数、分位数、方差、标准差、变异系数、偏度系数以及峰度系数。 五、
实验过程
1. 读入数据。首先通过R软件中的read.table()命令来读入实验数据(也可以通过函数scan()
来读入数据)。以本实验为例,我们假定数据的存储路径为:I:\非参数实验教材\教材\
第一章 描述性统计分析,数据名称为”测试.txt”,则具体读入过程如下: > x<-read.table("I:\\非参数实验教材\\教材\\第一章 描述性统计分析") > x=t(x)
2. 均值。读入数据后,可以通过”mean()”这一函数求数据的均值,记为x.mean,过程如下:
> x.mean=mean(x);x.mean [1] 76.05
3. 数据排序。在R软件中,对原始数据进行排序,可以通过”sort()”函数(具体用法可以参考help文件)对数据进行排序,例如,分别对数据进行降序和升序排列,过程如下: > sort(x,decreasing=T)
[1] 116 107 103 102 101 99 98 98 98 97 96 96 96 94 94 94 94 93
[19] 93 92 92 92 92 92 91 90 90 89 89 89 89 89 89 88 88 88 [37] 88 88 87 87 86 86 86 86 85 85 85 85 85 84 84 84 84 84 [55] 83 83 83 83 83 82 82 82 82 81 81 81 81 81 81 80 80 80 [73] 79 79 79 79 79 79 79 78 78 78 78 78 78 77 77 77 77 77 [91] 77 77 77 77 76 76 76 76 76 76 75 75 75 75 75 75 74 74 [109] 74 74 74 74 73 73 73 73 73 73 72 72 72 72 72 72 71 71 [127] 71 71 71 71 71 71 70 70 70 70 69 69 68 68 68 68 68 68 [145] 68 68 67 67 67 67 66 66 66 66 66 66 65 65 65 65 65 65 [163] 65 65 64 64 64 64 63 63 63 63 63 63 62 62 62 62 62 62 [181] 62 62 61 61 61 61 61 60 59 59 59 59 59 58 58 57 54 51 [199] 45 43
> sort(x,decreasing=F)
[1] 43 45 51 54 57 58 58 59 59 59 59 59 60 61 61 61 61 61 [19] 62 62 62 62 62 62 62 62 63 63 63 63 63 63 64 64 64 64 [37] 65 65 65 65 65 65 65 65 66 66 66 66 66 66 67 67 67 67 [55] 68 68 68 68 68 68 68 68 69 69 70 70 70 70 71 71 71 71
[73] 71 71 71 71 72 72 72 72 72 72 73 73 73 73 73 73 74 74 [91] 74 74 74 74 75 75 75 75 75 75 76 76 76 76 76 76 77 77 [109] 77 77 77 77 77 77 77 78 78 78 78 78 78 79 79 79 79 79 [127] 79 79 80 80 80 81 81 81 81 81 81 82 82 82 82 83 83 83 [145] 83 83 84 84 84 84 84 85 85 85 85 85 86 86 86 86 87 87 [163] 88 88 88 88 88 89 89 89 89 89 89 90 90 91 92 92 92 92 [181] 92 93 93 94 94 94 94 96 96 96 97 98 98 98 99 101 102 103 [199] 107 116
4. 中位数。在R软件中,求数据中位数的命令函数为median(),可以通过以下命令求中位数。
> median(x) [1] 75.5
5. 分位数。求分位数的函数命令为quantile(),我们可以通过quantile()求某一个具体的分位点值,也可以同时求多个分位点值,例如
> quantile(x)
0% 25% 50% 75% 100%
43.00 66.75 75.50 84.00 116.00 > quantile(x,0.05) 5% 59
> quantile(w, probs = seq(0, 1, 0.2))
0% 20% 40% 60% 80% 100% 47.40 56.98 62.20 64.00 67.32 75.00
6. 方差和标准差。在R软件中求方差和标准差的命令函数为var()和sd(),通过这两个命令可以很容易的求出数据的方差、标准差。具体如下:
> var(x) [1] 145.4548 > sd(x) [1] 12.06046
1
2
3
4
5
第三章 数据分析初步 复习稿
一、平均数
一般地,有n个数x1,x2,…,xn,我们把 叫做这n个数的算术平均数,简称 。记做 【例1】.我省某市五月份第二周连续七天的空气质量指数分别为:105,98,99,95,107,103,94,则这七天空气质量指数的平均数是 。 解法一:x=
=
解法二:这些数据都在 上、下波动,所以我们可以以 为基准,原数据记为
;则x 【练一练】:
1、 数据201,198,196,202,205的平均数是 。
2、如果x1与x2的平均数是4,那么x1+1与x2+5的平均数是 。 3、若数据2,3,-1,7,x的平均数为2,则x= 。
【例2】.某次能力测试中,10人的成绩统计如下表,则这10人成绩的平均数
这种形式的平均数是叫做 ,其中3,1,2,2, 2表示各相同数据的个数,称为 。 【练一练】: 1、某商场用加权平均数来确定什锦糖的单价,由单价为15元/千克的甲种糖
果10千克,单价为12元/千克的乙种糖果20千克,单价为10元/千克的丙种糖果30千克混合成的什锦糖果的单价应定为( )
A.11元/千克 B.11.5元/千克 C.12元/千克 D.12.5元/千克
2、某校为了招聘一名优秀教师,对入选的三名候选人进行教学技能与专业知识两种考核,现将甲乙丙三人的考核成绩统计如下:【数据的初步分析】
被录用。
(2)如果校方认为教师的教学技能水平比专业知识水平重要,因此分别赋予它们6和
4的权。计算赋权后他们各自的平均成绩,并说明谁将被录用。
二、众数与中位数:
1、 众数:在一组数据中出现次数 的数据叫做众数。
【例3】这组数据:1、1、1、2、2、4中的众数是 ;
这组数据:2、2、5、3、5的众数是 ;
【练一练】:已知一组数据3,,4,5的众数是4,则这组数据的平均数为( )
A.3 B.4 C.5 D.6
2、中位数:将一组数据按 (或 )的顺序排列,位于最中间
的一个数据(当数据的个数为 时)或最中间两个数据的 (当数据为 时)叫做这组数据的 。中位数只有 个。
【例4】浙江农村医疗保险已经全面实施,绍兴县7个村中享受了住院医疗费用报销的人数分别是:20、24、27、28、31、34、38,则这组数据的中位数是 。
【例5】 某公司销售部有营销人员15人,销售部为了制定某种商品的月销售额,统计了者15人某月的销售量如下:
(1)求者15人营销人员该月销售量的平均数、中位数和众数;
(2)假设销售部负责人把每位营销人员的月销售量定320件,你认为是否合理,为什么?如果不合理,请你制定一个较合理的销售定额,并说明理由。
【练一练】:
【提高题】由小到大排列的一组数据:x1,x2,x3,x4,x5其中每个数据都小于-1,则对于数据:1,x1,-x2,x3,-x4,x5,中位数可以表示为( ) A.
1x5xx41x2xx1
B.2 C. D.3 2222
三、方差和标准差
1.方差:在一组数据中,各数据与它们的平均数的差的 的平均数叫做这组数据的方差,用 表示。方差越 ,说明数据越稳定。 方差的计算公式: 2、标准差:方差的 叫做这组数据的 ,用 表示。 如:(1)某样本的方差是9,则标准差是______
(2)数据-2,-1,0,3,5的方差是 ,标准差是 。
【例5】两台机床同时生产直径为10的零件,为了检验产品的质量,质量检验员从两台机床的产品中各抽出5件进行测量,结果如下表。如果你是质量检验员,在收集到上述数据后,你将利用哪些统计知识来判断这两台机床生产的零件的质量优劣? (点拨:通常比较优劣是通过平均数、方差(或标准差)、众数等来衡量的)
【例6】一组数据x1, x2,… xn, 的平均数是2,方差是3,
则一组新数据x1+8, x2+8,… xn+8的平均数是 ,方差是 . 另一组新数据3x1+8, 3x2+8,…3xn+8的平均数是 ,方差是 .
【练一练】
1、一个样本的方差是
S2
1
[(x18)2(x28)2(x1008)2]100
则这个样本中的数据个数是____,平均数是____。
2、甲、乙两名战士在射击训练中,打靶的次数相同,且射击成绩的平均数也相同,如
22
果甲的射击成绩比较稳定,那么方差的大小关系是:S甲_________S乙。
3、学校篮球队五名队员的年龄分别为17,15,17,16,15,其方差为0.8,则三年后这五名队员年龄的方差为______.
4、不计算,比较图中甲、乙两组数据的标准差,则S甲与S乙的关系是( )
A.s甲s乙 B.s甲s乙 C.s甲s乙 D.不能确定
【提高题】某同学5次上学途中所花的时间(单位:分钟)分别为x,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x-y|的值为多少?