· 返回首页 · 联系我们 · English
 
 
     
 
课外天地
 专业园地
 它山之石
 史海钩沉
 下载园地
 
一个操纵着NBA的统计学魔律 2003-1-1

一个操纵着NBA的统计学魔律

.(转自“HoopChina篮球论坛 -> 火箭专区 - O.G. -> 一个操纵着NBA的统计学魔律”,作者:mingleon)

  做为全球顶级的职业篮球联赛,NBA除了为广大球迷推出一道道明星荟萃的PK盛宴外,也巨细无遗地留下了海量的技术统计资料,诸如得分、篮板、助攻、胜率等等技术指标令人目不暇接,眼花缭乱。在这个数字的茫茫大海中,难道真的是杂乱无章、毫无规律可循吗?其实不然,就篮球这项运动的本质而言,从统计科学的角度来看无非是一种概率的集体博奕,从比赛双方的每一次进攻或防守,到球队的每一次选秀或交易,甚至是球员的每一次伤病,都可以看作是一次随机事件,因此涉及到的种种技术指标也就成为了随机变量。既然如此,那么做为统计学中最重要的概率分布规律,正态分布就像一只无形的魔棒,操纵着NBA的方方面面。

  那么何谓正态分布呢?通俗地讲就是“中间多,两头少”,比如我们每个人的身高,巨人或侏儒在人口总数中所占的比例都很小,而中等身材的人占的比例最大。换成统计学的讲法,如果把身高做为随机变量,那么这种规律就是说一个人的身高达到平均值的概率最大,但身高越偏离平均值,其概率也越小。在自然现象和社会现象中,大量的随机变量都服从或近似地服从正态分布,至于产生这种现象的原因,有兴趣的网友可以在统计学书籍中找到答案。只要稍加思考,你在目前的NBA里也能找到类似的例子,比如像马刺、活塞等超级劲旅与像猛龙、老鹰等大烂队的数目同样稀少,大多数球队处于中游水准。如果你对这种规律有更深入的理解,那么NBA许多稀奇古怪的现象也就见怪不怪了。




  为了方便本贴后面的叙述,我不妨在这里简单介绍一下正态分布的相关知识,相信大多数网友能看懂。正态分布在统计学中是以概率密度函数的形式表述的,设连续型随机变量X的概率密度函数f(x)有图1中的形式,其中a、b为常数,分别被称为平均值和标准差,π、e 分别为圆周率和自然常数,则称X服从参数为a,b的正态分布。如果P{x1<X≤ x2}表示随机变量X的值落在x1和x2 之间的概率,那么图2中给出了相应的计算公式。

  在图3中直观地显示了正态分布的概率密度函数f(x),从图中可以看出正态分布有以下几个特点:
  1.分布曲线关于平均值a 对称,这表明随机变量X的值落在平均值a 两边的概率是均衡的,但随机变量X的值离开平均值a越远,出现的概率越小;
  2.如果固定平均值a,改变标准差b,可以看出当标准差b越小,图形变得越尖,因而随机变量X的值落在平均值a附近的概率越大;
  3.由于P{a-b<X≤a+b}=0.6826,P{a-2b<X≤a+2b}=0.9544,P{a-3b<X≤a+3b}=0.9974,我们可以看到,对于服从正态分布的随机变量X来说,它的值落在a-3b与a+3b之间几乎是肯定的,这就是所谓的“3b规则”。

  我们接下来看看正态分布到底是如何对NBA施展它的魔法的,相关的数据和图示均由统计软件SPPS 14.0 版生成。
1.NBA球员的技术指标均服从或近似地服从正态分布。
以姚明在2002-03赛季常规赛每场比赛中的得分分布为例,请看图4。
从图中可看出姚明该赛季的得分服从平均值为13.46,标准差为6.65的正态分布。
分布图的纵坐标表示得分频率,可见姚明的得分出现在13分附近的次数最多,而出现在5分以下或25分以上的次数就很少了。

  2.NBA球员某项技术指标的稳定性是由该技术指标分布的标准差决定的,这个值越小,那么他的这项技术指标越稳定。
  以姚明在四个赛季常规赛每场比赛中的得分分布为例,请看下表:
  赛季       平均值   标准差
  2002-03   13.46     6.65
  2003-04   17.54     6.901
  2004-05   18.34     6.801
  2005-06   19.91     6.309
  可见姚明本赛季在得分的稳定性方面有明显的进步,因为他在比赛中得到20分左右的概率增大了,而拿10分以下或拿30分以上的概率则相应地减少,不再大起大落了,这就是稳定性的体现。

  我们再来看看一些NBA著名球星每个赛季常规赛场均得分的分布情况,请看下表:
球星              平均值   标准差
迈克尔·乔丹        30.7      3.72
哈基姆·奥拉朱旺     21      5.98
蒂姆·邓肯            22.2      1.62
科比·布莱恩特      23.4      7.62
特雷西·迈克格雷迪      21.8      8.89
沙克·奥尼尔      26.1      3.25
史蒂夫·弗朗西斯      19.3      2.11
文斯·卡特            23.1      4.09
凯文·加内特      20.4      3.9
阿伦·艾弗森      28.1      3.57

  从上表可以看出,邓肯的稳定性令人惊叹,无愧于“石佛”的称号;虽然科比和迈蒂均为得分高手,但他们的稳定性与乔天王相比还有较大的差距,或许伤病是造成这种情况的一大原因吧;在中锋这个位置上,奥尼尔的稳定性相当突出,说明他的竞技状态保持得比较好。

  3.NBA球队的技术指标均服从或近似地服从正态分布,某项技术指标的稳定性也是由该技术指标分布的标准差决定的,这个值越小,那么它的这项技术指标越稳定。
以火箭队在2004-05赛季常规赛每场比赛中的得分分布为例,请看图5。从图中可看出火箭队该赛季的得分服从平均值为95.07,标准差为13.671的正态分布。

  4.从历史的角度来看,NBA球队每个赛季的常规赛胜率服从正态分布。
以火箭队建队39年来的每个赛季常规赛胜率为例,请看图6。从图中可看出火箭队的常规赛胜率服从平均值为0.50153,标准差为0.12425的正态分布,但胜率在0.4与0.5之间的频率明显偏小。火箭队本赛季伤兵满营、厄运连连的困境,看来是正态分布的对称性在做怪啊!这或许就是有些网友经常说的RP守恒吧。

  再以活塞队为例,请看图7。从图中可看出活塞队的常规赛胜率服从平均值为0.51769,标准差为0.137064的正态分布。按照上面的“3b规则”,活塞队本赛季常规赛胜率几乎肯定会在0.106与0.929之间,要想超过公牛队0.878的NBA常规赛胜率记录,虽说并非不可能,但其成功的概率不会超过2.3%,因此可能性并不大。

  虽然只举了几个例子,但我们可以清楚地看到:正态分布在NBA也是普遍存在的规律,有了它,我们就可以对球员的竞技状态以及球队的状况作出正确的评估和比较,并利用它在球队阵容配置上减少不必要的风险,另外也可以从一个全新的视角来观察NBA。

 

 
     
 
 
  数字资源 | 友情链接 | 联系我们
 
COPYRIGHT © 2006-2010 第二军医大学卫生统计学教研室 hejia@smmu.edu.cn
地址:上海市翔殷路800号 邮编:200433 电话:021-81871441
 
技术支持:网络信息中心