Diskussion: Quality Start?

En diskussion från Facebook där vi försökte hitta en bra formel för att bestämma en pitchers insats i en enskild match.

Tom Tango:
Ok, har inte riktigt kunna släppa det här med decisions för pitchers. Framför allt inte med tanke på hur Kuroda pitchade igår och ändå belastas med en L, när det är Yankees offense som inte producerar.

Här är en annan approach som antagligen är helt galen, men jag tänkte att med den här samlade braintrusten kanske man kan spåna fram något mer rättvist.

Man utgår från RSA (Runs Scored Average) och RAA (Runs Allowed Average). I det här fallet har Yankees (efter Regular Season) ett RSA på 4.96 och ett RAA på 4.12, Kurodas ERA i matchen blev 3.52. I det här exemplet förlorades matchen och det ska bestämmas om det blir L eller No Decision.

1) ERA ; RAA och R No Decision (om laget i fråga har ett högre RSA än RAA)
3) ERA >;;; RAA och R >;;; RSA =>;;; L

Det finns ju självklart massor med hål, luckor och fallgropar i det här sättet att se på pitcherns insats (hur göra i början av säsongen, vem ska få lossen etc). Man kanske får införa L med en * som indikerar att pitcherns offense inte har producerat som de brukar?

Vad säger ni?

…och då egentligen en W med * som indikerar att offense ”överproducerat”. Krångligt det här….

The Loveable Loser:
Gillar din tanke, men som du säger är det ju svårt i början av en säsong.
ERA och W/L har väl egentligen inget samband. Han hade väl fått lossen även om han hade haft 0.00 i ERA?
Dvs. han kunde ju ha släppt 3 unearned runs.
Skrota pitchers W-L… säger det någonting alls?

Eephus:
ja precis vad jag skulle föreslå – skrota. Men jag gillar din tanke, Magic Man!

Tom Tango:
Ha, ha det har vi varit inne på tidigare.
Samtidigt måste det ju finnas en korrelation mellan hur bra en pitcher är och hur många matcher han startar i som laget vinner?

Eephus:
Ja, en korrelation på det sättet att en bra insats ökar sannolikheten för att ett lag ska vinna. Men sannolikhet i baseboll vet vi ju vad det är värt.

The Loveable Loser:
QS – Quality starts. Hur många starter en pitcher gör där han går minst sex innings och släpper max tre runs.

Eephus:
Ja, jag gillar QS om man är ute efter ett hyfsat enkelt mått.

Tom Tango:
Sant, men vad baseras QS på, varför just 6 innings och 3 Runs? Måste väl baseras på något?

The Loveable Loser:
Det måste vara ett av de bästa talen för att på ett enkelt sätt se bästa pitchern under en säsong.

Eephus:
Jag gissar att man har valt 6 innings och 3 runs för att det är ungefär på det viset man normalt sett ger sitt lag en bra chans att vinna.

”The quality start was developed by sportswriter John Lowe in 1985 while writing for the Philadelphia Inquirer.[1] ESPN.com terms a loss suffered by a pitcher in a quality start as a tough loss and a win earned by a pitcher in a non-quality start a cheap win”

The Loveable Loser:
kolla. samma tankar.

Eephus:
Var det inte James Shields som fick the loss i en match här i september efter en two hit complete game där han släppte en run. Snacka om tough loss.

The Loveable Loser:
L*/tough loss för Kuroda igår.

Tom Tango:
Ja, precis. Där har vi kanske något.
Intressant annars top 10-listan sedan 1950:

Tim Lincecum (101 of 139, 72.7%)
Tom Seaver (454 of 647, 70.2%)
Adam Wainwright (83 of 119, 69.7%)
Mel Stottlemyre (247 of 356, 69.4%)
Roy Oswalt (216 of 316, 68.4%)
Josh Johnson (77 of 113, 68.1%)
Bob Gibson (328 of 482, 68%)
Roy Halladay (226 of 338, 66.9%)
Felix Hernandez (127 of 190, 66.8%)
Randy Johnson (403 of 603, 66.8%)

I QS alltså.

The Loveable Loser:
Man undrar var allas gud Justin Verlander är…

Eephus:
Intressant lista. Ja, var är Verlander? Han kan inte ligga långt från listan. Och Lincecum ligger klar etta trots sina insatser under 2012. Säger nåt om hans föregående säsonger…

”Another criticism against the statistic is that it is not beneficial for pitchers who pitch many innings per start. If a pitcher allows three earned runs in six innings, he gets a quality start with an ERA of 4.50 for that game. But if a pitcher pitches for nine innings and allows four earned runs, he would have a 4.00 ERA, but would not get a quality start. ”

Listan blir ju lite snedvriden eftersom Tom Seaver har 647 starts medan Lincecum bara har 139.

Aha, just ja – jag har läst en artikel just om Verlander och att han missgynnas när det gäller QS. Detsamma för t ex Complete Game James (Shields). Samma för CC skulle jag gissa.

The Loveable Loser:
Då blir det ju fel. Kanske skulle en ERA på 4.50 och under ge en QS.

Eephus:
Ja tjena – imponerande av Tom Seaver att hålla sån nivå i så galet många matcher. Men det var kanske en lite annan tid.

Vettig idé där Nilk.

Tom Tango:
Eller så får starting pitchers bara kasta 6 innings 😉 Allt för att det ska vara mätbart.

The Loveable Loser:
Tråkigt om man pitchar fem shutout innings.

Eephus:
Sedan finns det ju en massa andra mått som inte är knutna till en enstaka match. ERA är såklart ett sånt men sedan finn ju FIP (Fielding Independent Pitching) och såna grejer.

FIP bygger väl framför allt på baserunners allowed och home runs allowed. Dags att grotta ner sig i lite Sabermetrics kanske 😃

Tom Tango:
David Smith gjorde ju en koll på QS under 84-91 (16831 matcher) och kunde urskilja följande:

1. The ERA of starting pitchers when they have a quality start is over five runs per game better than in games in which they do not have a quality start (1.91 vs 7.50 overall).

2. The winning percentage of the starting pitchers when they have a quality start is more than twice what it is when they don’t have one (.674 vs .311 overall).

3. The innings pitched per start is also substantially different in quality start and non-quality start games (7.45 vs 4.80).

16831 var alltså totala antalet matcher (52 % var QS)

Eephus:
Överraskande stor skillnad i punkterna 1 resp. 3. Att det skulle göra skillnad att ha en QS kunde man ju räkna ut, men SÅ mycket.

Hyfsat omfattande studie. Han måste gilla baseboll. 😃

Tom Tango:
Ha, ha det får man säga. Här är länken för de som är intresserade.

The Loveable Loser:
Frågan är om man ska fokusera helt på pitcher/batter-duellen och skita i hur många som är på bas, clutch pitching mm. Då skulle man kunna omvandla runs till total bases allowed. 1 run = 4 total bases. En quality start är då om man går minst 6 innings och tillåter max 12 total bases. (Eller 7 IP – 14 TB, 8 IP – 16 TB, 9 IP – 18 TB ).
Man bortser totalt från hur många runs motståndarlaget gör. Vilket är vad baseboll går ut på, så vid närmare eftertanke kanske det är feltänkt. Är lite osäker på om HBP och BB ingår i total bases. Men isf får man addera detta till TB…

Svårt att beräkna exakt när en pitcher inte går hela innings också…

Eephus:
Good point, outs görs ju av hela laget. Även om man tar med errors i beräkningen (så att pitchern inte belastas av misstag på fältet) så påverkas ju antalet outs av om t ex en outfielder råkar ha en grym arm och lyckas kasta ut en baserunner eller inte. Så den saken gör ju att en pitchers BABIP (batting average on balls in play) kan leda till orättvisa resultat. T ex: När Lincecum gav upp galet mycket runs under våren nämnde de på Baseball Today att hans BABIP var extremt högt. Dvs han hade helt enkelt en hel del oflyt med att ovanligt många bollar som sattes i spel ledde till hits. Så han var i o f s i en rejäl formsvacka, men hans stats (som t ex ERA och Batting Average Allowed) blev extra usla pga det.

Så för att ta bort sådana variationer har det ju dykt upp en massa sabermetric-varianter som försöker ge en ERA-siffra som bortser från defence, t ex FIP (Fielding Independent Pitching). Men de här varianterna ger ju ingen egentlig hjälp med att utvärdera en pitchers insats i en enskild match, som vi var ute efter här från början. Men det är rätt intressant. Den metod som verkar vara exaktast i att mäta en pitchers ”true ERA” verkar vara SIERA:

”Skill-Interactive ERA (SIERA) is the newest in a long line of ERA estimators. Like it’s predecessors FIP and xFIP, SIERA attempts to answer the question: what is the underlying skill level of this pitcher? How well did they actually pitch over the past year? Should their ERA have been higher, lower, or was it about right?”

Shit vad jag grottar ner mig här. 😃 Men tillbaka till problemet med att mäta en pitchers insats i en enskild match. En udda variant är Bill James’ Game Score, som jag tycker är riktigt kul.

Eephus:
Men en vettig variant tycker jag var den som Niklas föreslog – att låta en Quality Start vara minst sex innings + en ERA för den matchen på 4.50 eller lägre. Inga konstigheter. Antalet QS under en säsong skulle i så fall vara ett aningen förenklat men ändå riktigt bra mått på hur bra en pitcher varit under säsongen. (Sjuukt mycket bättre än Won-Lost record.) En 5 inning shutout skulle missgynnas, men ändå. Det känns som att det är rätt sällan en starting pitcher som är het kliver av tidigare än efter 6 innings.

The Loveable Loser:
Det jag ser som en svaghet i Quality Start/4.50 ERA är att 6 IP, 3 earned runs är 4.50 ERA och likaså 8 IP, 4 earned runs. Men om en pitcher går 7 innings… vad är en Quality Start då? 3 eller 4 earned runs?

Man kan ju säga att en Qualtity Start är:
6 IP – 3 earned runs
7 IP – 3 earned runs
8 IP – 4 earned runs
9 IP – 4 earned runs
Men det blir ju ganska trubbigt…

Eephus:
Eller att en quality start mäts efter sex innings. Det som händer efter det spelar ingen roll. Men det har ju också sina uppenbara svagheter. Ger upp nio runs i sjunde och får ändå en QS.

The Loveable Loser:
Kan ändå gilla det på något sätt. En start är en start, minst 6 IP. Man kan ju inte heller få en win om man inte gör en start. Även om man gör 5 shutout innings.

Gillar även Game Score 😃

Eephus:
Ja visst är den rätt mäktig! Rätt kul att jämföra grymma matcher med varandra på det sättet.

The Loveable Loser:
Man kan ju se det som att inning 7, 8, 9 egentligen inte är starting pitchers inningar att ta hand om. Det kan ju bero på många olika anledningar att man låter en starter stanna kvar, bullpen workload m.m.

Eephus:
Nej precis, så kan man se det. Sex innings är rätt normalt. Och då är det en ”start” och resten är bara bonus, eller vad man ska säga.

The Loveable Loser:
Ja. Egentligen som att starting pitcher CC Sabathia blir utbytt mot relievern CC Sabathia… eller nåt.

Tror folk har klurat på detta tidigare… 😃
Vi kan ju slå fast att alla våra förslag är bättre än att räkna Win eller Loss.

Eephus:
He he, definitivt! 😃

Tom Tango:
Game Score var ju intressant. Gillar att man tar bort (nästan) alla element som pitchern inte kan påverka (bortsett från E’s och 3rd strike PB). Står ju att det är en extension på MLB:s QS.

Vad tror ni om att införa ytterligare en parameter – som inkluderar defense’s roll i varje out. Likaväl som en Run betecknas som Unearned om defense gör ett E kan väl en Out betecknas som” Earned” om det rör sig om ett Routine Play eller ”Unearned” om det är ett Exceptional Defense Play?

Kan man bedöma om det är tack vare otillräcklig fielding en löpare konverteras till en Run måste man ju kunna bedöma om det är tack vare defense det blir en out eller om det helt enkelt är en bra pitch?
Är jag Mr Loco?

Eephus:
Hmm, nej du är inte Mr Loco! 😃 Med ”unearned run” är du inne på samma grundtanke som fiffiga sabermetric-snubbarna, dvs att isolera pitcherns insats så att defence – bra eller dåligt sådant – inte ska spela in när man utvärderar pitchern. Länken jag la upp igår kväll om SIERA är den senaste av de varianterna men man kan börja med att kolla in FIP, Fielding Independent Pitching. Rätt intressanta grejer! Och rätt likt det som Mr Loco är inne på. 😃

Fielding Independent Pitching (FIP) measures what a player’s ERA should have looked like over a given time period, assuming that performance on balls in play and timing were league average. Back in the early 2000s, research by Voros McCracken revealed that the amount of balls that fall in for hits against pitchers do not correlate well across seasons. In other words, pitchers have little control over balls in play. McCracken outlined a better way to assess a pitcher’s talent level by looking at results a pitcher can control: strikeouts, walks, hit by pitches, and homeruns.

Hur mäktigt är det förresten inte att heta Voros McCracken?

Tom Tango:
Fan, vad mäktigt. Hur lyckas man komma på den formeln egentligen (FIP = ((13*HR)+(3*(BB+HBP))-(2*K))/IP + constant)????

Och ja, det är ett styggt mäktigt namn.

Eephus:
Fanns inte det där med i din formelsamling du har på vinden?

Tom Tango:
Ha, ha nej du. Skulle nog ha tagit 20 år att få fram den formeln. Om det räcker…

Eephus:
Jag hade lätt blivit matematiker om jag hade vetat att man kunde få jobba med basebollformler. 😃

Avancerad formel, men grundtanken är inte så krånglig. utgår från det som pitchern kan kontrollera – HR, BB, HBP, K – och sätter sedan in snittvärdet för hur ofta det blir en out på en boll som sätts i spel. Sjukt smart, tycker jag.

Tom Tango:
Ha, ha det är sant 😃
Men hur har man härlett viktvärdena 13, 3 och 2?

”You’re probably wondering where the coefficients came from — 13 * HR, 3 * BB, and 2 * K. The simple answer is that Tom Tango created a matrix with run values for each play outcome. The coefficients attempt to adjust for how much each home run and walk contribute to the other team’s runs scored and how much each strikeout contributes to preventing the other team’s runs scored.”

Eephus:
Ah bra där! Satt just och letade. Hittade en snubbe som ställde samma fråga i kommentarsfältet, men med risig attityd och tyckte att de här formlerna är värdelösa eftersom det är subjektivt vilka coefficienter man använder. Svaret: ”Are you really so naive as to believe they just pull these numbers out of their collective ass?”

Som man frågar får man svar, brukar det väl heta.

Känns som att de här statistikkillarna har rätt bra underlag när de väljer sina coefficienter. Du hade ju t ex snubben där David Smith med sina 16 000 matcher…

Tom Tango:
He, he precis. De är ju inga amatörstatistiker direkt, som vissa av oss är.

Eephus:
He he, nej verkligen. De här killarna verkar leva för sina stats. Hm, kanske tur att jag hann skaffa fru och barn innan jag upptäckte sabermetrics.

Inser att här finns det huuur mycket som helst att grotta ner sig i.

The Loveable Loser:
Ingen som reflekterade över det andra namnet som dök upp? Tom Tango.

FIP skiljer inte på om hit är triple eller single va? Isf finns det ju en svaghet i den formeln.
Eller hit är ju inte alls med i den formeln. Såklart. En hit innebär ju andra spelares inverkan.

FIP känns inte som att man kan använda för att avgöra en prestation i enskild match va? Är det det som fortfarande är grundfrågan?

Borde inte BB+HBP+H/AB kunna ge ett tal som kan säga vad som är en bra eller dålig start?

Från picherns synvinkel ska det väl iofs vara Batters faced, snarare än at bats… men det är ju samma tal.

Eephus:
Tom Tango är inte heller tråkigt namn. Oklart om jag tycker det låter mer som countryhjälte eller porrskådis.

Hm, bra fråga där med om extra base hits kommer med i FIP eller inte. Nej precis, hits är ju inte med. Motståndarlagets offensiva resultat av pitcherns insats tror jag liksom är inbakad i det faktum att formelns resultat uttrycks i form av en ”ERA”, dvs hur många runs alltihopa leder till per 9 innings.

Exakt, FIP och sånt löser fortfarande inte problemet med att utvärdera en enskild match. Din variant där är inte så dum. Det liknar WHIP, dvs Walks + Hits per Innings Pitched (och där du lagt till HBP). Då får man ju ett mått på hur många baserunners man släpper till per inning, eller per batter faced, om man föredrar det. Baksidan med det är väl densamma som med ERA – att vad som blir en hit kan bero på annat än pitcherns skicklighet, t ex ren slump att alla grounders råkar hitta hålen eller hur bra/dåligt defence han har bakom sig (som att det blir fler hits om bollen går mot Prince Fielders håll, eftersom hans räckvidd är typ noll.

Men som ett hyfsat mått på hur effektiv en pitcher varit i en match tycker jag det kan funka riktigt bra. En enskild match är ju ändå såpass litet statistiskt underlag att man måste räkna med att det inte går att hitta en perfekt formel.

The Loveable Loser:
Line drives + HR istället för H?

Eephus:
Eller i så fall Balls in play minus groundouts och flyouts? Så man inte bortser från de markbollar som går igenom.

The Loveable Loser:
markbollar tycker jag inte ska belasta pitchern. Linedrives finns aldrig med i officiell statistik från matchen va?

Eephus:
Fast det är ju en stor del av spelet att infielders omöjligt kan täcka alla hålen på infield. Groundball pitchers skulle gynnas sjukt mycket framför flyball pitchers i så fall.

Du var ju annars inne på en bra grej tycker jag med Total Bases Allowed per nine innings, eller vad det var. Fortfarande fins såklart problemet med att defence spelar in i fråga om hur baserunners lyckas ta sig ut/avancera, men det tror jag att man har svårt att komma ifrån när man ska mäta en enda match. Det vore ett exaktare mått än t ex WHIP som inte tar hänsyn till extra bases.

Nä precis, line drives finns inte med på det viset tror jag.

The Loveable Loser:
Total bases allowed / batters faced?

Batters faced måste vara bättre att använda än innings pitched.

Eephus:
Ja det låter bra!
Vi får testa det på några matcher. Frågan är bara hur man lättast läser ut TBA ur statistiken. Men när den här nya staten fått fotfäste kommer det att finnas med i varje boxscore!

Batters faced tror jag finns med i boxscoren t ex i MLB-appen.

The Loveable Loser:
Total bases finns ju alltid med, dock aldrig uppdelat per pitcher va?

Eephus:
Nej just det, det brukar ju finnas med. Fast uppdelat per slagman, väl?

Tom Tango:
Har försökt hänga med här 😉
Är Total Bases H + BB + HBP alltså? Där exempelvis en 2B ger +2 i Total Bases?

Eephus:
Japp, det är det man brukar mena med Total Bases. På det sättet får man ju med extra base hits också i stället för bara hits oavsett ”valör”. Det känns rimligt att det ska ”straffa sig” i statistiken för pitchern att ge upp extra base hits. Extra base hits ökar ju risken för runs väldigt mycket.

Tom Tango:
Mäktigt.
Ja, det är bara att titta på Ivan Nova som väl ”vann” i alla fall AL vad gäller Extra bases.

The Loveable Loser:
Tyvärr kan vi ju inte kolla den formeln mot några matcher då TB inte är uppdelat per pitcher. Eller finns bra plats för Expanded Boxscores?

6 IP kan översättas till 26 batters faced (4,33 per inning, snittet är någonstans mellan 4,00 och 4,60). Måste ju också vara minst 27, annars skulle ju inte ett perfect game kunna bli en sån här ny Quality start.

3 runs är ju 12 total bases, men om man skulle vara lite givmild och säga att 13 total bases allowed är ok för en QS så blir det enklare att räkna.

13/26 = 0.5

Testas:
Maximum 0.5 total bases allowed/batters faced ratio, minimum 26 batters faced.

???????

Ska kolla den formeln mot några starter. Man kan ju ta reda på total bases som en pitcher har släppt. Bara kolla hitsen, om det är 2B, 3B eller HR står det ju vem som släppt detta i statistiken.

Invändningar? Tror detta kan bli helgalet… eller inte.

Eephus:
Hmm, har varit bortkopplad hela kvällen men ska fundera på den där formeln. Eftersom det handlar om totala baser inklusiver walks och HP – blir det kanske ungefär detsamma som OPS fast ur pitcherns perspektiv?

För att testa formeln kollade jag statsen från nattens match. Cain: 12 totala baser, 27 batters faced = 0.444. Lohse: 13 totala baser/27 batters faced = 0.481. Quality starts för båda, m a o. Och det känns ju rimligt. Men man kan ju notera att Lohse var på håret, trots att han bara släppte en enda run. Så eftersom formeln inte tar hänsyn till hur många runs en pitcher släpper kan formeln ge resultat som kan kännas lite ”fel”. Man kan ju argumentera att pitcherns viktigaste uppgift är att inte ge upp runs. Å andra sidan ger ju inte enbart slutresultatet av pitcherinsatsen en särskilt tydlig bild av hur effektiv pitchern har varit. Så på det viset är den här formeln bra. Typexemplet är ju Valverde, som var ”perfect” som closer förra säsongen med inte en enda blown save. Men jag vet inte huuur många gånger han släppte hits, walks och runs och trasslade sig ur fulla baser och grejer. Mil ifrån att vara en stabil pitcher, enligt all statistik förutom om man enbart såg till slutresultatet. Så på det viset är den här formeln m a o rättvisare än om man baserar allt på t ex Runs Allowed.

(Eller i fråga om en closer – antal saves/opportunity)

The Loveable Loser:
Jag tycker att det där riktigt bra speglar matchen. Lohse och Cain var jämbördiga. Lohse ska ligga på gränsen, för han hade tur. Giants hade vid ett tillfälle löpare på 2B och 3B, no outs. I snitt gör motståndarlaget två runs i ett sånt läge, men Giants gjorde ingen.

Tom Tango:
Vad menar du med att Lohse var på håret?

Eephus:
O – jag menade att Lohse enligt formeln fick en siffra som precis hamnade under den gräns på .500 total bases allowed/batter faced som sabermetrician Niklash Hellerschmidt satte upp som gräns för Quality Start. Och ja, det stämmer ju bra i det här fallet med hur det såg ut. Lohse hade t ex 5 walks och sju hits, så han var ju inte supereffektiv. Så i det här fallet hamnade man riktigt bra med The Formula och jag tror man gör det i de allra flesta fall!

Tom Tango:
Aha, missade att det var en gräns på .500, cheers!

Swing away!

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s