SAT数学常见问题及解决方式之统计学

2016-09-01 15:41

雅思备考资料免费领取

免费领取



以下就是100留学SAT为大家带来SAT数学常见问题及解决方式之统计学,希望对各位考生的备考有所帮助:


1.mode(众数)

一堆数中出现频率最高的一个或几个数e.g.mode of 1,1,1,2,3,0,0,0,5 is 1 and 0


2.range(值域)

一堆数中最大和最小数之差 ,所以统计学上又称之为极差.(两极的差) e.g. range of 1,1,2,3,5 is 5-1=4


3.mean(平均数)

arithmatic mean(算术平均数): n 个数之和再除以 ngeometricmean (几何平均数): n 个数之积的 n 次方根


4.median(中数)

将一堆数排序之后,正中间的一个数(奇数个数字), 或者中间两个数的平均数(偶数个数字)e.g. median of 1,7,4,9,2,2,2,2,2,5,8 is 2medianof 1,7,4,9,2,5 is (5+7)/2=6


5.standard error(标准偏差)

一堆数中,每个数与平均数的差的绝对值之和,除以这堆数的个数(n) e.g. standard error of 0,2,5,7,6 is:(|0-4|+|2-4|+|5-4|+|7-4|+|6-4|)/5=2.4


6.standard variation

一堆数中,每个数与平均数之差的平方之和,再除以 n 标准方差的公式:d2=[(a1-a)2+(a2-a)2+....+(an-a)2 ]/n e.g. standard variation of 0,2,5,7,6 is: average=4((0-4)2 +(2-4)2+(5-4)2+(7-4)2+(6-4)2)/5=6.8


7.standard deviation

就是 standard variation 的平方根 d


8.the calculation of quartile(四分位数的计算)

Quartile(四分位数):

0 Quartile 实际为通常所说的最小值(MINimum);

1 Quartile(En:1st Quartile);

2 Quartile 实际为通常所说的中分位数(中数、二分位分、中位数:Median); 3 Quartile(En:3rd Quartile);

4 Quartile 实际为通常所说的最大值(MAXimum);

我想大家除了对 1st3rd Quartile 不了解外,对其他几个统计值的求法都是比较熟悉的了,而求 1st3rd 是比较麻烦的。

下面以求 1rd 为例:设样本数为 n(即共有 n 个数),可以按下列步骤求 1st Quartile:1.n 个数从小到大排列,(n-1)/4,设商为 i,余数为 j2.则可求得 1st Quartile :( i+1 个数)*(4-j)/4+( i+2 个数)*j/4 (已经排过序啦!):1).设序列为{5},只有一个样本则:(1-1)/4 0,余数 01st= 1 个数*4/4+ 2 个数*0/4=5

2).设序列为{1,4},有两个样本则:(2-1)/4 0,余数 1 1st= 1 个数*3/4+ 2 个数*1/4=1.75 3).设序列为{1,5,7},有三个样本则:(3-1)/4 0,余数 2 1st= 1 个数*2/4+ 2 个数*2/4=3 4).设序列为{1,3,6,10},四个样本:(4-1)/4 0,余数 2 1st= 1 个数*1/4+ 2 个数*3/4=2.5

5).其他类推!因为 3rd 1rd 的位置对称,这是可以将序列从大到小排(即倒过来排),再用 1rd 的公式即可求得:(各序列同上各列,只是逆排):


1.序列{5},3rd=52.{4,1},3rd=4*3/4+1*1/4=3.253.{7,5,1},3rd=7*2/4+5*2/4=64.{10,6,3,1},3rd=10*1/4+6*3/4=79.Thecalculation of Percentile设一个序列供有 n 个数,要求(k%) Percentile:

(1)从小到大排序,(n-1)*k%,记整数部分为 i,小数部分为 j 可以如此记忆:n 个数中间有 n-1 个间隔,n-1/4 就是处于前四分之一处,

(2)所求结果=(1-j)*(i+1)个数+j*(i+2)个数特别注意以下两种最可能考的情况:

(1)j 0,(n-1)*k%恰为整数,则结果恰为第(i+1)个数

(2)(i+1)个数与第(i+2)个数相等,不用算也知道正是这两个数. 注意:前面提到的 Quartile 也可用这种方法计算,其中 1st Quartile k%=25%

2nd Quartile k%=50% 3rd Quartile k%=75%

计算结果一样. :(注意一定要先从小到大排序的,这里已经排过序啦!){1,3,4,5,6,7,8,9,19,29,39,49,59,69,79,80} 16 个样本要求:percentile=30%:(16-1)*30%=4.5=4+0.5i=4,j=0.5(1-0.5)* 5 个数+0.5* 6 个数=0.5*6+0.5*7=6.5


10.To find median using Stem-and-Leaf (茎叶法计算中位数)

Stem-and-Leaf method 其实并不是很适用于 GRE 考试,除非有大量数据时可以用这种方法比较迅速的将数据有序化.一般 GRE 给出的数据在 10 个左右,茎叶法有点大材小用.

Stem-and-Leaf 其实就是一种分级将数据分类的方法.Stem 就是大的划分, 如可以划分为 1~10,11~20,21~30..., Leaf 就是把划分到 Stem 一类中的数据再排一下序。看了例子就明白了。


Example for Stem-and-Leaf method:Data:23,51,1,24,18,2,2,27,59,4,12,23,15,200| 1 2 2 41| 12 15 182| 20 23 23 24 275| 51 59Stem(unit) = 10Leaf (unit) = 1分析如下:

最左边的一竖行 0, 1, 2, 5 叫做 Stem, 而右边剩下的就是 Leaf(leaves). 面的 Stem-and-Leaf 共包含了 14 data, 根据 Stem leaf unit, 分别是: 1, 2, 2, 4 (first row), 12, 15, 18 (second row), 20,23, 23, 24, 27(third row), 51, 59 (last row). Stem and Leaf 其实就是把各个 unit,比如个位,

十位等归类了而已,一般是从小到大有序排列,所以在找 Stem-and Leaf median 的时候,一般不需要你自己把所有的数写出来从新排序.所以只要找到中间的那个数 (如果 data 个数是偶,则取中间两数的平均数), 就是 median . 这道题的 median 18 20 的平均值 =19. 大家在碰到这种题的时候都可以用上面的方法做,只要注意 unit 也就是分类的数量级就行了.


为什么用 Stem-and-Leaf 方法?可能你觉得这样做太麻烦了,其实 Stem-and-Leaf 方法好处就是:你不必从一大堆数里去按大小挑数了,按照 data 给出的顺序填到表里就可以了。但是,GRE 考试这样做是否值自己斟酌。


我的方法,不就是找十来个数么?排序!在先浏一眼数据看看大致范围,后在答题纸上按个的写,觉得小的写前面,大的写后面,写了几个数之后,就是把剩下的数儿们,一个个的插到已写的数中间么!注意尽可能的把数之间的距离留大一些,否则,如果某些数比较密集,呵呵,你会死的很惨的。


11.To find the median of data given bypercentage(按比例求中位数)

给了不同年龄 range, 和各个 range percentage, median 落在哪个 range . percentage 加到 50%就是 median range .担小心一点,range 首先要保证是有序排列.

   Example for this:

Given: 10~20 = 20%, 30~50 =30%, 0~10 = 40%, 20~30 = 10%, median 在哪个 range .

分析: 千万不要上来就加,要先排序,切记!!

重新排序为: 0~10 = 40%, 10~20 = 20%, 20~30 = 10%, 30~50 = 40%. 后从小开始加, median(50%)落在 10~20 这个 range .

如果觉得比较玄乎,我的方法,GRE 大部分的题都可以这么搞。0~10 40 ETS,10~20 20ETS,20~30ETS,30~50ETS, 100 ETS 猪按着年龄排下来,你说第五十匹 ETS 猪的年龄落在那个范围。

(原题: 说一堆人 0-10 10%,11-20 12%,21-30 23%,31-40 20%,)40 35%, median 在什么范围?)


12:比较, n<1 ,n,1,2 1,2,3 的标准方差谁大

standard error standard variation (作用=standarddeviation)都是用来衡量一组数据的离散程度的统计数值,只不过由于 standard error 中涉及绝对值,

在数学上是很难处里的所以,都用标准方差,实际上 standard error 更合理一些, 它代表了数据和平均值的平均距离.很明显题目中如果 n=0 的话,0,1,2 的离散程度应该和 1,2,3 的离散程度相同.如果 n<0, n,1,2,的离散程度大于后者, 0<n<1 的话,则后者大于前者,但是 n 为整数,这种情况不成立.故而

Key: n 是整数, 前〉=(n=0,;n=-1,-2,......大于)


13.算数平均值和加权平均值

三组数据的频数分布 FREQUENCY DISTRIBUTION: 1(6),2(4),3(1),4(4),5(6) 1(1),2(4),3(6),4(4),5(1)1(1),2(2),3(3),4(4),5(5) 其中括号里的是出现的频率, MEAN AVERAGE 相等的有那些. 答案:只有第二个.

mean-arithmetic mean 算术平均值 (1+2+3+4+5)/ 5 = 3

average-weighted average 加权平均值: (1*1+2*4+...5*1)/(1+4+6+4+1)=48/16=3


14.正态分布题.

一列数从 0 28,给出正态分布曲线.75% percentile 20,85% percentile r,95% percentile 26, r 23 的大小.

Key:r<23

下面是来自柳大侠的七种武器中的正态分布


15.正态分布

高斯分布(Gaussian)(正态分布)的概率密度函数为一钟型曲线,

1 (xa)2 p(x)= e22

2

a 为均值, 为标准方差,曲线关于 x=a 的虚线对称, 决定了曲线的胖瘦”, 形状为:

836847585257c7db52ef1c8.png

高斯型随机变量的概率分布函数,是将其密度函数取积分,


F(x)= A

1 x ( a)2

e22 dP(A x) , 表示随机变量 A 的取值小于等于 x 的概率。比如 A


2 () FA (x)

2

取值小于等于均值 a 的概率是 50%。曲线为

88a677c96057c7db64af442.png

如果前面看得有些头大也没有关系,结合具体题目就很容易理解了J 1)一道正态分布:95%26,75%20,85%r, r 23 的大小,答小于: 由图 2,正态分布的分布函数 F(x)在其期望 a 的右方曲线是向上凸的, 此时F(20)=75%,F(r)=85%,F(26)=95%,

a15cd1d24757c7db744ee1a.png

如果把曲线的片段放大就比较清楚了。O AB 的中点。 A(20, 75%)B(26, 95%)O(23, 85%)

C(r, 85%)由于曲线上凸,显然 C 的横坐标小于 O,所以 r<23补充:如果问的是曲线的左半部分或者其它一些情况,只要画一下图就很 easy 了。2) 正态分布题好像是:有一组数平均值 9,标准方差 2,另一组数平均值 3,准方差 1,问分别在(5,11)(1,4)中个数(概率)谁大,应该是相等。:令图1中的曲线a=0, =1, 就得到了标准正态分布,曲线如图3

684851437657c7db821a96c.png

此时问分布在区间(x1, x2)的概率,就是图中的阴影面积。注意此时的曲线关 x=0 对称。 ()对于一般的正态分布,可以通过变换,归一化到标准的正态分布,算法为: 设原正态分布的期望为 a,标准方差为 ,欲求分布在区间(y1, y2)的概率, 可以变换为求图 3 中分布在(x1, x2)间的概率。其中

x=ya比如题目中 a=9,

x1=5 9= 2 2

x2=11 9=1 2

= 2 , 区间为(5, 11),则区间归一化为(-2,1),

同理,a=3, =1, 区间为(1, 4),则区间归一化后也为(-2,1)所以两者的分布概率相等。估计最难的题也就是利用钟型曲线的对称性,比如归一化后的区间并不相同,

而是(-2,1)(-1,2),但根据对称性,仍然可以比较概率的大小。


     以上就

100留学移动课堂出国留学语言培训专家
立即下载
移动课堂是100留学最新推出的“贴身学习伴侣”, 其中拥有名师直播、录播课程和名师答疑等多项服务。课堂可以为大家提供新的移动学习平台,让大家学习更方便,想学就学!
关注更多校区资讯,考试动态,满满的干货喂饱你!
托福雅思寒假补习

你可能需要的资料

托福考前必备

热门文章

编辑推荐