El WAR es la respuesta

Gracias a la contienda del JMV del 2012, la estadística está en boca de todos

Actualizado el 19 de febrero de 2013
Por Sam Miller
ESPN The Magazine

Esta historia aparecerá en ESPN The Magazine el 4 de marzo en la edición Analytics.

HACE CUARENTA Y NUEVE AÑOS, Sports Illustrated publicó un perfil sobre un profesor de ingeniería con sorprendentes teorías sobre el béisbol. Earnshaw Cook, autor del entonces no publicado título Percentage Baseball, clamaba que la matemática avanzada y el análisis objetivo podía convertir a cualquier equipo en un ganador de campeonato. No le llamó sabermetrics ni le llamó Moneyball, pero esa era esencialmente lo que proponía Cook.

También hace 49 años, un hombre en Wilmington, Delaware, llamado Herb Groh, escribió una carta a la revista en respuesta. "Gracias a Dios el juego de béisbol nunca puede reducirse a una maquina de suma de precisiones", escribió. "Es mucho más divertido así".

La carta de Groh habla por muchos, sobre todo hoy. El libro de Cook, por su parte, habla por casi nadie: Muchos de sus hallazgos resultaron estar equivocados y de hecho le hubiera costado victorias a los equipos. Pero la ciencia rara vez llega a la conclusión correcta la primera vez, pero llega con el tiempo. La herramienta Victoria por Encima del Reemplazo (WAR por sus siglas en inglés) -- una medida que abarca todo el valor de un jugador desarrollado a través de décadas de datos y los debates del ejército de analistas aficionados en el béisbol -- lo consigue.

En el 2012, WAR asumió un papel co-estelar en la competencia por el Jugador Más Valioso de la Liga Americana. Para los seguidores de Mike Trout, el registro de WAR era simplemente la evidencia irrecusable de un jugador perfecto con rendimientos a un nivel casi sin precedentes. Para los partidarios de Miguel Cabrera, WAR era la herramienta triste e inescrutable de todos nosotros los troles, cabezas de huevo, que nunca jugamos un partido. El enfrentamiento Cabrera vs. Trout fue reducido a menudo a un referéndum sobre el valor de los datos. "Esta estadística de WAR es otra forma de declarar: "¡Ganaron los nerds!'", escribió el popular autor Mitch Albom en defensa de Cabrera.

Albom estaba equivocado. A riesgo de la grandilocuencia, se trata de algo más que una competencia por el premio al Jugador Más Valioso, mucho más que incluso el béisbol. Vivimos en un mundo de desacuerdos sobre cuestiones trascendentales que no podemos resolver, aun cuando la ciencia es inequívoca: la evolución, las vacunas y el cambio climático, entre ellas. Estos temas son de enormes proporciones. Basarse en una ciencia que es difícil de entender puede dar miedo. Así que la tendencia es la de aferrarse a las comodidades de la ideología y la tradición -- incluso cuando las ideologías están mal, incluso cuando las tradiciones no están actualizadas.

Lucha contra ello si quieres, pero el béisbol se ha vuelto demasiado complicado de resolver sin la ciencia. Ahora se mide cada giro de cada lanzamiento. Cada centímetro que viaja una pelota de béisbol se mide ahora. Equipos que solían burlarse del uso de las hojas de cálculo se basan actualmente en las bases de datos llenas de precisiones de cada jugador y cada jugada -- y esos equipos son la norma, no la excepción de inspiración cinematográfica. Esto es emocionante y es aterrador.

A pesar de que soy un escritor y editor de Baseball Prospectus, yo no voy a tratar de convencerlo de que Mike Trout debería haber superado a Miguel Cabrera por el premio al Jugador Más Valioso. El WAR, a pesar de lo que se podría haber leído, no toma una posición al respecto. Pero voy a tratar de convencerlo de que el WAR representa una oportunidad de responder a la complejidad de béisbol con algo más que la ideología o la desesperación.

Y no temas, Herb Groh, de Wilmington, Delaware. WAR también hace mucho más divertido el béisbol.


Cabrera Trout WARChris Buck para ESPNCabrera y Trout son el JMV de la LA y el niño símbolo del WAR, respectivamente.

1. WAR CUENTA UNA GRAN HISTORIA

Un sólo turno al bate en el béisbol es magníficamente complejo, un simple juego lo es más aun de forma exponencial, la temporada de un equipo es más que eso y la carrera de un jugador es más que eso. El WAR utiliza los datos disponibles más avanzados para medir, en cada área de desempeño, cuántas carreras de produce o salva un jugador de Grandes Ligas en relación con una línea de base consistente: Las carreras producidas o salvadas por un jugador de liga menor es llamado hipotéticamente "reemplazo". "Expresa esas carreras como victorias -- alrededor de 10 carreras por cada victoria -- y lo define como el "valor" del jugador en un año. Toma toda la complejidad increíble del béisbol y la resume en un número. Ni siquiera es un número colorido. Por lo general es un número aburrido, como 1,3. No hay nada interesante en la cifra 1,3.

La reducción del valor de un jugador a un solo número puede ser despreciable, dice John Thorn, un importante escritor de sabermetrica y autor del libro de 1984 The Hidden Game of Basebal. Este libro presenta el Linear Weights System, que adjudica un valor en carreras para todos los eventos ofensivo. (Por ejemplo, cuando el libro fue publicado un sencillo valía 0,47 de carrera.) El Linear Weights System, proporciona la base matemática para los componentes ofensivos de WAR. Aunque Thorn apoya la estadística WAR, critica la forma en que es frecuentemente utilizado para terminar una discusión.

"El actual denominador común mínimo de la escritura estadística es la fijación en comparar al Jugador A con el Jugador B, lo cual me parece no sólo inútil, sino que sirve para ocultar la gran historia del béisbol", dijo Thorn. "El disfrute de béisbol es como el disfrute del arte. Si lo decides, tiene que tener una función utilitaria y lo haces parecer como un trabajo. Se supone que es el juego".

Pero la queja de Thorn es sobre el usuario, no sobre la herramienta. Gustar del béisbol y gustar de WAR van de la mano a la perfección.

A tres horas por juego, 162 partidos al año, 10 ó 20 ó 80 años, muchos de nosotros pasamos decenas de miles de horas en el deporte -- y eso sin siquiera entrar en el manejo de los equipos de fantasía y la recogida de tarjetas y la lectura de este artículo y todas las otras cosas que hace un fanático del béisbol en vez de hacer su trabajo y cortar el césped. Pocos de nosotros vamos a ganar 10 centavos en el juego, así que ¿por qué lo vemos? Por la misma razón que nos gustan los sitcoms y las películas: Crecemos a través de la historia -- las dificultades, la redención, la conexión.

WAR cuenta una nueva historia sobre béisbol. Mejor, WAR muestra la historia de nuevo, ya que incorpora todas las partes del juego dentro de su fórmula. Considere al campocorto David Eckstein. La historia convencional sobre Eckstein -- es pequeño y no técnicamente muy bueno, pero el muchacho tiene coraje -- fue dicha a través de adjetivos, no hechos. En el sitio de crítica de los medios Fire Joe Morgan, había una categoría de David Eckstein que comprendía 20 comentarios separados sobre la hagiografía de Eckstein. Eso son cerca de 12.000 palabras burlonas (histéricas) a los periodistas que celebraron al valiente Eckstein a pesar de su débil brazo, su bate de poco poder y el fracaso general para ser atlético.

Ahora, aquí está el truco: David Eckstein fue realmente muy valioso, y no tenía nada que ver con los adjetivos. En el 2002, Eckstein (con un WAR de 4.4, de acuerdo a FanGraphs que se basa en datos analíticos de la internet) fue casi tan bueno como Miguel Tejada (WAR de 4,7), que ganó el premio al Jugador Más Valioso de ese año. Tejada bateó 34 jonrones y remolcó 131. Pero Eckstein estuvo casi igual al empujar 63 y poner out un corredor en cada vez que lanzó a primera. ¿Cómo? El WAR, y los componentes que lo integran, nos dice:

1. Eckstein dejó que le pegaran 27 lanzamientos, otorgándole un mejor porcentaje de OBP que Tejada y desafiando la ventaja de poder del dominicano.

2. Eckstein bateó para un tercio de las dobles matanzas.
3. Eckstein fue de hecho un buen campocorto defensivo con más alcance que Tejada y más éxito en las dobles matanzas.

Un escritor que quisiera entonces alabar a Eckstein podría haber hecho algunas suposiciones acerca del jugador basado en su altura, el peso y color de la piel (blanco), recolectar algunas citas aduladores de los compañeros de Eckstein y hojear su tesauro en busca de nuevas palabras -- ¡taumatúrgico! ¡leptoalgo! -- para describir al pequeño. O podría haber comenzado con el WAR y explicar cómo David Eckstein, jugador de béisbol, era bueno jugando al balón.

Durante el debate de la temporada pasada sobre el Jugador Más Valioso, WAR no fue simplemente un número colgado a cada jugador -- sino que ha vuelto a revelar una historia. Trout fue el mejor bateador de la Liga Americana (54 carreras mejor que el jugador promedio, de acuerdo con el sitio en la red Baseball-Reference, en comparación con las 52 de Cabrera) y el mejor corredor de bases en la Liga Americana (10 carreras mejor que el jugador promedio, en comparación a Cabrera con 0) y fue el tercero mejor con el guante en la Liga Americana (con 21 carreras salvadas frente a Cabrera con -4). Ningún bateador no miembro del Salón de la Fama en la historia, aparte de Barry Bonds, ha producido más WAR en una temporada que Trout con 10.7. Ningún jugador en la historia ha sido un corredor de plus-10 o un defensor de plus-20 y un bateador de plus-50. Ningún jugador a tenido una grandeza tan bien redondeada como Trout en el 2012. Esa es una historia bastante genial, y una que le diremos a nuestros nietos que presenciamos.


2. WAR DEMANDA FE

El negocio de la medición de los jugadores de béisbol -- por escritores, agentes y equipos -- se vuelve más exhaustiva cada año. El WAR, tratando de hacer cálculos en cada parte medible del juego, no sólo refleja la avalancha de datos, sino que también lleva en sí todos los pasos de la evolución de la estadística.

Como la mayoría de los avances en la investigación de béisbol, WAR, con toda probabilidad se inició con Bill James, quien en la década de 1980 comenzó poco a poco a comparar a los jugadores sobre una base lineal pequeña y consistente en su Bill James Baseball Abstract. Una década más tarde, el sabermetrico Keith Woolner desarrolló la estadística Over Replacement Player, que fue aprobada por Baseball Prospectus y mide la destreza ofensiva en comparación con otros en la misma posición. En los próximos 15 años, el sitio FanGraphs y luego Baseball Reference presentaron sus propias versiones, la incorporación gradual de defensa y corrido de bases, las tendencias de los bateadores de batear para jugadas de doble matanza, y los ajustes de dificultad de la liga y entornos ofensivos, mientras que también ajustar su definición de la medida Over Replacement Player. Como los cálculos se refinaron continuamente por las investigaciones de expertos, libros de sabermetrica y sitios en la red, así surgió una de las críticas más difíciles del WAR: Que es inescrutable para los aficionados que no son del alto nivel de los matemáticos.

Miguel Cabrera Tigres
Rick Osentoski/USA TODAY SportsNi Cabrera ni Trout quisieron meterse en el debate por el WAR, pero ambos simbolizaron la batalla entre la tradición y la ciencia.
Sean Smith era un lanzador de secundaria en Louisville en 1980 cuando leyó la escritura de James. Finalmente comenzó a desarrollar su propia fórmula, y su trabajo se convirtió en el algoritmo original de Baseball-Reference para WAR. Desde entonces, ha sido modificado de forma tal que ni siquiera él puede calcular el WAR de la forma en que tú o yo podríamos calcular el promedio de bateo, desde el principio. "No se puede calcular el UZR", dice Smith, refiriéndose a las métricas defensivas que FanGraphs utiliza para su WAR. "Están recibiendo datos que no están disponibles públicamente. Baseball-Reference está utilizando la estadística Defensive Runs Saved, que viene de Baseball Info Solutions, que no es pública; la información detallada, jugada por jugada, no está disponible". Y las partes de WAR que están disponibles -- las métricas de cada sitio en el desempeño de bateo, el rendimiento de pitcheo, factores del parque de líneas de base, la fuerza del oponente y las líneas básicas de las ligas para el corrido de bases y las dobles matanzas -- son demasiado avanzados y / o difíciles de manejar para que la mayoría de los aficionados pueda resolverlo realisticamente por su propia cuenta.

Yo no soy un matemático y no soy un científico. Soy un hombre que trata de comprender al béisbol con el sentido común. En esta era, eso significa abrazar las métricas avanzadas que realmente no entiendo. Eso debería hacerme sentir un poco incómodo, y lo hace. El WAR es un desastre cruzado de rutas que llevan hacia algo que, básicamente, tengo que asumir con la fe.

Y la fe es irracional y anti-intelectual, ¿no? La fe es relativa a las danzas de la lluvia y los dioses del sol, a la espiritualidad, no a la ciencia. En realidad, no. La fe es la forma de organizar un mundo moderno complicado. La fe es lo que tienes cuando el médico entra con una jeringa llena de algo que podría ser cualquier cosa, y le dice que va a evitar que usted contraiga el sarampión. A menos que seas un médico o un científico médico, no entiendes muy bien las vacunas, y ciertamente no se puede preparar una en casa. Usted tiene subcontratado el lado intelectual de su salud a las personas que, según te asegura tu fe, son más inteligentes que tú. Quizás una manera de ver las cosas es que no eres tan inteligente como fueron tus tatara-tatara-tatara-abuelos, porque tenían que asumir la responsabilidad de elaborarse sus propias medicinas. Pero vas a vivir lo suficiente. La complicada naturaleza del WAR, tu incapacidad para tocar las tripas del la misma, no es un argumento en contra. Así es como luce el avance humano en el siglo 21. Y si se puede aceptar que se puede caminar en un tubo construido de 100 toneladas de aluminio, volar a siete millas de la tierra y aterrizar con seguridad a miles de kilómetros de distancia, se puede aceptar el WAR.


3. EL WAR ES HONESTO

Cuando los Bravos firmaron a B.J. Upton en la temporada baja, un aficionado de los Bravos que hubiera visitado FanGraphs se habría animado: Con 13,9 de WAR durante los últimos cuatro años, Upton ha jugado como un miembro del Juego de Estrellas, uno de los 50 mejores jugadores del béisbol. El aficionado de los Bravos que se fue a Baseball-Reference se habría destrozado, al ver que Upton, con sólo 7,2 WAR en esos cuatro años, es en realidad peor que un jugador promedio. Así que Upton es o bien una estrella o está por debajo de la media. FanGraphs se equivoca con Upton, o Baseball-Reference está mal, o son ambas cosas.

No hubo tal desacuerdo que dividiera a los tres sitios en la carrera por el premio al Jugador Más Valioso -- todos apoyaron a Trout por alrededor de tres victorias sobre Cabrera -- pero el punto se cernía sobre el debate: Si los números varían de un sitio a otro, ¿cómo pueden ser confiables? ¿Cómo puede ser veraz un modelo que se equivoca?

Ejemplos como el de Upton, en el que WAR cuenta historias completamente diferentes sobre el mismo jugador, están en el Anexo A en el caso de los escépticos contra WAR. Ellos no son la norma, pero debido a que la defensa y la suerte del pitcher pueden ser tan difíciles de captar, tampoco son raros. El WAR de Zack Greinke a lo largo de las últimas tres temporadas es casi tres veces más alto en FanGraphs que en Baseball-Reference porque FanGraphs se centra más en ponches y bases por bolas y menos en su promedio de efectividad más o menos bueno. Martin Prado (intercambiado en este invierno por Justin, el hermano de Upton) fue candidato a Jugador Más Valioso en FanGraphs (5,9 de WAR en el 2012) y apenas un jugador promedio en Baseball Prospectus, (2,3), sobre todo porque los sitios no estaban de acuerdo con el trabajo de su guante.

Es justo considerar el WAR como algo menos definitivo y más difícil de utilizar en una transmisión por televisión nacional o en el reverso de una tarjeta de béisbol, porque siempre hay las preguntas de "¿cuál WAR?" y "¿por qué?" Entre Baseball-Reference, FanGraphs y Baseball Prospectus, las variaciones empleadas son pequeñas -- Baseball-Reference solamente carece de medir el tiro de relevo desde los jardines -- y muy grandes. Los sistemas utilizan tres métricas defensivas muy diferentes. Cada uno utiliza un diferente nivel de reemplazo de referencia. El WAR de FanGraphs sólo considera los ponches de un lanzador, las caminatas y los jonrones, y el número de carreras que permitió, no importa. Esa es una elección filosófica enorme, y hay razones para estar de acuerdo con ella (en el corto plazo, esas estadísticas son lo único que podemos decir que controla un lanzador) y razones para estar en desacuerdo con ella (como: Se siente raro). En una carta publicada por la revista Baseball-Reference comparando los tres sistemas, hay 43 secciones diferentes en disputa. Sean Forman, el editor de Baseball-Reference, escribió: "Hay cientos de pasos para hacer este cálculo, y docenas de lugares en los que la gente razonable puede discrepar".

Sin embargo, las variaciones que hacen a WAR una herramienta útil y honesta de una manera estadística no puede ser estático. Vamos a empezar con promedio de bateo. FanGraphs refleja el promedio de bateo de BJ Upton de la temporada pasada en .246. Lo mismo ocurre con Baseball-Reference y Baseball Prospectus. Pero a pesar de esa certeza, el promedio de bateo responde sólo una pequeña pregunta y luego se detiene. No nos dice si el estadio de Upton le ayudaba o le hacía daño, si aumentó la producción ofensiva con paseos y extrabases, si añadió valor total con el guante o las piernas. El WAR tiene que ver todo eso. Todo lo que puede decirnos el promedio de bateo es que Upton conectó hits con más frecuencia que el dominicano Jose Bautista y con menos frecuencia que Ronny Paulino.

No se puede detener allí a menos que estés preparado para decir que Paulino es mejor que Upton y ambos son mejores que Bautista. Así que incluso si estás a favor de las estadísticas tradicionales, agregas jonrones a la ecuación para tener una idea del poder de un jugador, y tal vez añades carreras impulsadas, caminatas, bases robadas y porcentaje defensivo. Ahora tienes más que una estadística. Usted tiene una receta. Y debido a que todo el mundo utiliza las recetas en la evaluación de los jugadores, estás a bordo con el concepto del WAR, que sólo utiliza los ingredientes más complejos.

Confío en que las recetas de FanGraphs, Baseball-Reference y Baseball Prospectus porque estos sitios incorporan décadas de investigación, un alcance que nunca podría igualar por mi cuenta. Sus recetas son el resultado de personas inteligentes que se empujan unos a otros a ser más inteligentes y desviarse unos de otros porque el deporte, como el mundo, es complicado. Pero la conclusión es que el WAR trabaja. En 2012, la correlación entre el WAR de Baseball Prospectus y las victorias del equipo fue de 0,86 (1,0 habría significado una correlación perfecta). La correlación entre el promedio de bateo y las victorias fue de 0,27. Los equipos con más WAR ganaron más juegos. Los equipos con mejores promedios de bateo, no. la guerra Estas recetas serán aún mejor, ya que se vuelven más inteligentes con más datos. Baseball Prospectus pronto incorporará al WAR la capacidad de los receptores para enmarcar los lanzamientos. Los números al lado del nombre de cada jugador en ese sitio van a cambiar. ¿Significa eso que los números que tenemos ahora son malos? Por supuesto que están equivocados. Todo el mundo está equivocado acerca de todo, todo el tiempo, y el WAR deja espacio para esta duda. La duda nos ha conducido hacia mejores respuestas por milenios, desde Sócrates con "Sólo sé que no sé nada" hasta muchachos que hicieron miles de millones de apuestas por un mercado de vivienda aparentemente invencible. No acepte cualquier número que no deja lugar a dudas. "Las estadísticas de béisbol," escribió una vez Bill James, "siempre están tratando de engañarlo".


CUESTIONADO EL AÑO PASADO sobre qué sabía acerca del WAR, Mike Trout, dijo: "Esa es una buena pregunta. No mucho". Miguel Cabrera tampoco sabía. "Yo no soy un tipo de computadoras", dijo. A pesar de que todos prestan atención a sus estadísticas, están en el negocio del juego, no del cálculo.

Sin embargo, las oficinas centrales del béisbol, las personas a cargo de nóminas de 100 millones y todas sus esperanzas para la temporada del 2013, se alinean abrumadoramente con los datos. Para los ejecutivos del equipo, el marco básico del WAR -- la medición del rendimiento de los jugadores total contra una base consistente -- es un lugar común, utilizado por casi cada oficina, de acuerdo con información privilegiada. Los escritores que ayudaron a guiar la creación de WAR durante décadas -- incluyendo Bill James, Sean Smith y Keith Woolner -- trabajan ahora para los equipos. Como me dijo James, la guerra sobre WAR ha cesado donde es importante. "Hay una necesidad práctica para las mediciones de ese tipo en una oficina que hacen que sea irrelevante si les gusta o no".

Lo que tú hagas depende en última instancia de ti y sólo es importante para ti. En una perspectiva más amplia, el debate ha terminado, y los datos ganaron. Así que pelea si lo desea. Pero en cierto punto, la pregunta en cualquier debate relacionado con la ciencia es: ¿Por qué estás realmente luchando y por qué?