如何確保數(shù)據(jù)真實(shí)和準(zhǔn)確 NBA球員的真實(shí)命中率怎么算?
NBA球員的真實(shí)命中率怎么算?真實(shí)命中率是多少?真實(shí)百分比是衡量投籃效率的一個(gè)百分比數(shù)據(jù),通常縮寫為TS%,本質(zhì)上也是投籃百分比。但由于籃球比賽中每次投籃得分并不完全相同,所以對(duì)三分和罰球修正了真實(shí)百
NBA球員的真實(shí)命中率怎么算?
真實(shí)命中率是多少?
真實(shí)百分比是衡量投籃效率的一個(gè)百分比數(shù)據(jù),通??s寫為TS%,本質(zhì)上也是投籃百分比。但由于籃球比賽中每次投籃得分并不完全相同,所以對(duì)三分和罰球修正了真實(shí)百分比。其計(jì)算公式為:
TS% 100% * PTS / [ 2* ( FGA 0.44 *自由貿(mào)易區(qū))]
它的核心思想很簡(jiǎn)單,就是每一個(gè)投籃都調(diào)整成兩分投籃,體現(xiàn)了球員 每次都有分?jǐn)?shù)回報(bào)。我們知道籃球比賽是強(qiáng)制交換球權(quán)的回合制比賽,所以雙方創(chuàng)造得分的機(jī)會(huì)實(shí)質(zhì)上是有限的。如何抓住機(jī)會(huì)成了制勝的關(guān)鍵,而真正的命中率是一種反映機(jī)會(huì)把握率的數(shù)據(jù)。
為什么需要引入真實(shí)命中率?
著名數(shù)據(jù)博客NylonCalculus的專欄作家Justin兩年前寫過一篇介紹TS%的文章,其中舉了一個(gè)非常合適的例子來說明引入TS%的必要性。2004年,活塞 職業(yè)生涯投籃命中率只有41.5%,幾個(gè)賽季甚至低于40%,包括他的總冠軍賽季(39.5%)。傳統(tǒng)觀點(diǎn)會(huì)認(rèn)為他可能是一個(gè) "問題與挑戰(zhàn)一支優(yōu)秀球隊(duì)的,但事實(shí)上,比盧普斯在巔峰時(shí)期每36分鐘5個(gè)三分球,一直排在聯(lián)盟前20%。同時(shí)他也有一定的造犯規(guī)能力,是一名優(yōu)秀的罰球手。所以在2005年改變了Handcheck判罰后,他的真實(shí)命中率多年保持在精英水平的60%以上。 "問題與挑戰(zhàn)團(tuán)隊(duì)的?不,他是一個(gè)真正的冠軍防守者。因此,從這個(gè)案例中,我們可以發(fā)現(xiàn)投籃命中率可以 不能準(zhǔn)確反映球員和球員的表現(xiàn)因?yàn)椴煌痘@的得分和難度的差異,對(duì)得分時(shí)機(jī)的把握能力,真實(shí)的投籃命中率遠(yuǎn)比一般的投籃命中率可靠。
為什么是0.44?
在真實(shí)命中率的計(jì)算中,我們需要把罰球換算成一般投籃。一般來說,一次投籃犯規(guī)可以獲得兩次罰球,也就是說一次罰球占用0.5次投籃。但是必須要考慮附加罰,技術(shù)犯規(guī)罰,惡意犯規(guī)罰,三罰三的第三罰。這些點(diǎn)球不會(huì)占用多余的射門,所以每個(gè)點(diǎn)球?qū)嶋H占用的射門不到0.5,大概0.44。
這里可能會(huì)有朋友想問,為什么要用這個(gè) "大約0.44 "?而不是準(zhǔn)確地使用播放器 這是真正的圓形物。這是一個(gè)非常好的問題。前陣子也問了我一個(gè)類似的問題。在 "真正聰明的籃球分析網(wǎng)站 "福爾克 在清潔玻璃的過程中,他有一個(gè)名為PSA的項(xiàng)目出手次數(shù))數(shù)據(jù),即每次出手得分,這個(gè)數(shù)據(jù)本質(zhì)上不是0.44,而是實(shí)際出手次數(shù)的TS%。精一模覺得這個(gè)數(shù)據(jù)比TS%更準(zhǔn)確,為什么不用這個(gè)數(shù)據(jù)呢?他是對(duì)的,PSA更準(zhǔn)確,但TS%被更廣泛采用有兩個(gè)原因。
首先,以2017-18賽季為例,我們對(duì)所有出手次數(shù)超過100次的球員進(jìn)行篩選,從比賽的逐場(chǎng)日志中提取每次罰球的原因,剔除那些不占用額外出手次數(shù)的罰球,比如點(diǎn)球、三分罰球第三罰和技術(shù)犯規(guī)罰球,計(jì)算球員的真實(shí)出手次數(shù)。這樣就可以得到一個(gè)真實(shí)的命中率,也就是PSA(實(shí)際PSA是一百輪的數(shù)據(jù)而不是一個(gè)百分比,為了更方便用TS%也算作百分比),把這個(gè)結(jié)果和TS%進(jìn)行比較。
這張圖,橫軸是TS%和PSA的差值,左邊低估TS%,右邊高估TS%。我們可以看到,只有一個(gè)球員被TS%高估了1%以上,被TS%低估的只有四個(gè)球員,大部分被低估的球員都執(zhí)行了大量的技術(shù)犯規(guī)罰球。一些分析家認(rèn)為在計(jì)算PSA時(shí)應(yīng)該排除技術(shù)犯規(guī)罰球,因?yàn)樗ǔ2皇且驗(yàn)榍騿T 獲得罰球機(jī)會(huì)的能力。
其次,如前所述,TS%的計(jì)算只是基于三個(gè)基礎(chǔ)數(shù)據(jù),從1946-47年NBA第一個(gè)賽季開始統(tǒng)計(jì),而我們剛剛用來計(jì)算PSA的逐場(chǎng)比賽日志只能追溯到1996-97年第一個(gè)賽季,也就是說PSA可以 在NBA的整個(gè)五十個(gè)賽季里都無法計(jì)算。再者,即使是最近20個(gè)賽季,計(jì)算TS%也遠(yuǎn)比PSA方便。
因此,這就變成了一個(gè)工程問題。一個(gè)需求可以以最小的性能為代價(jià)大大減少工作時(shí)間,同時(shí)可以應(yīng)對(duì)更廣泛的工作環(huán)境。那么,為什么性能提升這么少呢?
TS%多少算高,多少算低?
一般來說,TS%的平均聯(lián)賽水平在53%-54%左右。通常低于50%會(huì)被認(rèn)為很差。他們中的大多數(shù)都是能 不要在籃下得分或犯規(guī),可以 不要投三分。他們只能打中距離,也就是所謂的非 "魔球 "。而且60%以上會(huì)被認(rèn)為是這個(gè)領(lǐng)域的精英選手。TS%高的球員一般都是終端內(nèi)線,擅長(zhǎng)突破造犯規(guī)的球員或者高產(chǎn)高效的三路得分手。
從今年出手次數(shù)超過300次的玩家整體分布來看,大部分玩家的TS%集中在52%到58%。同時(shí),今年TS%最高的球員是庫(kù)里(67.5%),而只有兩名球員的TS%低于45%,分別是鮑爾(44.4%)和尼里基納(43.7%)。
然而,TS%的水平有時(shí)不得不根據(jù)時(shí)代來看待。在20世紀(jì)80年代后的大部分時(shí)間里,TS%穩(wěn)定在53%和54%之間。但在20世紀(jì)最后幾年和21世紀(jì)初,由于規(guī)則和打法的雙重作用,可以說是聯(lián)盟歷史上最黑暗的幾年,進(jìn)攻成功率很低。聯(lián)盟平均TS%遠(yuǎn)低于其他賽季。因此,如果涉及跨季節(jié)比較,并且恰好與那些季節(jié)有關(guān),我們應(yīng)該考慮使用 "相對(duì)聯(lián)盟平均TS % "為了對(duì)比。
如何拆解分析TS%
TS%的具體拆解分析會(huì)涉及到很多因素,需要具體分析。這里很難給出一個(gè)籠統(tǒng)的結(jié)論,但可以從兩個(gè)方向來考慮。
首先要明確產(chǎn)出和效率的關(guān)系。TS%是每次出手的得分回報(bào),也叫效率,有很多數(shù)據(jù)可以代表輸出。這里我們用USG%,大致對(duì)應(yīng)TS%。USG%是球員在場(chǎng)時(shí)的投籃次數(shù)、罰球次數(shù)和失誤次數(shù)占己方進(jìn)攻回合總數(shù)的比率,一般翻譯成利用率,但意義更好。一般來說,產(chǎn)量越高,任務(wù)越重,效率越低。兩年前很少有國(guó)內(nèi)粉絲意識(shí)到這一點(diǎn)。今年大量的自媒體寫手開始用下面的圖片來說明這一點(diǎn)。
所以我們?cè)诳碩S%的時(shí)候,往往需要看球員的回合占有率。比如同樣處于高TS%的球員,庫(kù)里和杜蘭特的效率,喬丹和科瓦爾的效率就明顯不同。在同樣高效率的情況下,高產(chǎn)更有意義。同樣的,雖然我們看到邵偉 s TS%略低于平均水平,他肩負(fù)著很多球權(quán),發(fā)展進(jìn)攻機(jī)會(huì),所以效率稍微低一點(diǎn)并不代表他就比那些中上中等球員差。但是有一部分球員傾向于中距離的打法,他們不容易因?yàn)槌智蚨嗌俣斐蒚S%的波動(dòng)。
其次要拆分TS%的構(gòu)成和球員的具體投籃分布。拆分構(gòu)圖很好理解。TS%的構(gòu)成包括三分和罰球,可以通過FTr看球員來判斷 s三分球命中率3PAr和罰球命中率。例如,coval s 3PAr高達(dá)0.777,即77.7%的投籃來自三分線外,所以coval s高TS%主要是大量的三分出手。再比如德瑪爾·德羅贊,他的中距離打法效率很低,但他還能保持中等水平的效率,這得益于他強(qiáng)大的造犯規(guī)能力,連續(xù)5年每36分鐘罰球超過7次。
觀察球員的具體投籃分布,也是了解球員TS%成因的重要一環(huán),比如蘭斯·史蒂芬森,三分線外投籃。手不多,投籃命中率差,籃下投籃少。他的出手大多集中在中距離,所以他的低TS%完全符合一般理論。所謂打球不是魔球,所以哈登就不用說了,相反,應(yīng)該有很多三分,籃下罰球。比如高伯特,小喬丹等人,他們?cè)诨@下的投籃命中率都非常高,TS%高也在情理之中。有些球員是特例,比如鮑爾:
球哥的投籃分配已經(jīng)很神奇了。51%的投籃來自三分線外,超過83%的同位置球員,31%的投籃來自籃下,超過55%的同位置球員。所以他的TS%低得可怕,原因只是真的太鐵了。
這里我們只說幾個(gè)簡(jiǎn)單的例子。更細(xì)致深入的拆解分析,需要結(jié)合更多的數(shù)據(jù)和游戲場(chǎng)景進(jìn)行解讀。這里的兩點(diǎn)只是作為一個(gè)大概的思考方向。
TS%有什么缺陷嗎?
一般來說,人們總是會(huì)談?wù)撃硞€(gè)數(shù)據(jù)的缺陷,并說一些類似于 "XX數(shù)據(jù)偏向某一類玩家 ",這往往是正確的。然而,說 "TS%偏向于那些三分以上,罰球更多的球員 "關(guān)于TS%的問題,因?yàn)樵谄渌闆r下,往往意味著數(shù)據(jù)的設(shè)計(jì)缺陷導(dǎo)致某一類玩家被高估或低估。但是TS%并不是一個(gè)評(píng)價(jià),而是一個(gè)球員每投一球能換來多少分的客觀記錄。三分以上罰球多的球員在TS%上看起來不錯(cuò),因?yàn)樗麄兇_實(shí)比其他球員有更高的得分回報(bào)。
另一個(gè)更科學(xué)的問題是,罰球比普通投籃更難得到前場(chǎng)籃板,三分球比近投更難得到前場(chǎng)籃板,所以TS%并不像其公式所示的那樣等同于每次投籃的回報(bào)。在這個(gè)問題上,我和NylonCalculus的專欄作家Justin觀點(diǎn)一致。這不是TS%應(yīng)該承擔(dān)的任務(wù),而是反彈問題。我們不應(yīng)該。;不要指望一個(gè)關(guān)于投籃效率的數(shù)據(jù)能回答球場(chǎng)上的所有問題。
所以我傾向于認(rèn)為TS%在其合理的應(yīng)用范圍內(nèi)沒有致命的缺陷,是一個(gè)非??煽康臄?shù)據(jù)。
怎樣才叫精確數(shù)和近似數(shù),有什么區(qū)別?
精確數(shù)字:可以代表原始對(duì)象或事件的實(shí)際數(shù)量的數(shù)字。這個(gè)數(shù)叫做精確數(shù)。
約數(shù):指接近精確數(shù)的數(shù)。
其中,精確數(shù)是這個(gè)數(shù)最原始的數(shù)據(jù),沒有經(jīng)過任何化簡(jiǎn)、化簡(jiǎn)、四舍五入等運(yùn)算就表示出來。近似值是通過舍入、輸入一或截?cái)嗯c原始數(shù)據(jù)相差不大的數(shù)字。
有一個(gè)詞 "關(guān)于 "大概的數(shù)字前面。
舉個(gè)簡(jiǎn)單的例子,1?80.125
上面的0.125是一個(gè)準(zhǔn)確的值。只要沒有計(jì)算錯(cuò)誤,答案只有一個(gè)
近似值表示答案不是精確值,例如0.125保留兩位小數(shù)。數(shù)字是0.13。此時(shí),我們正在看 "5 "千分之一,所以我們需要向前移動(dòng)一。也可以保留小數(shù)點(diǎn)后0.1位,然后看 "2 "百分位數(shù)。
有效數(shù)字是指從整數(shù)部分,第一個(gè)非零數(shù)字到最后一個(gè)數(shù)字的計(jì)數(shù)。比如這里的0.00001只有最后一個(gè)1,而這里的0.10000有10000。