home *** CD-ROM | disk | FTP | other *** search
/ Total Baseball (1994 Edition) / Total_Baseball_1994_Edition_Creative_Multimedia_1994.iso / dp / 0127 / 01277.txt < prev    next >
Text File  |  1994-01-31  |  20KB  |  284 lines

  1. $Unique_ID{BAS01277}
  2. $Pretitle{}
  3. $Title{Appendix:  Baseball, Computers, and New Statistics}
  4. $Subtitle{}
  5. $Author{
  6. Gillette, Gary}
  7. $Subject{Computers Statistics computer statistic statisticians number numbers
  8. sabermetrics sabermetricians statistical computerized Epstein James Palmer
  9. Elias Stats stat OPS gambling CD-ROM DataDiscman reference CMC Sony Franklin
  10. Electronics statistician}
  11. $Log{}
  12.  
  13. Total Baseball:  Appendixes
  14.  
  15.  
  16. Baseball, Computers, and New Statistics
  17.  
  18. Gary Gillette
  19.  
  20.  
  21.      With the coming of age of the personal computer, the sea of baseball
  22. statistics in recent years has become a veritable flood. With the baseball
  23. world seemingly inundated with numbers, there has been a backlash against
  24. statistics and the statisticians. Many fans--especially those of the "old
  25. school"--believe that baseball already had enough stats, and that the newer
  26. numbers served mostly to obscure the game they love, rather than to illuminate
  27. it.
  28.      Which is true?  Certainly, baseball has been blessed over the years with
  29. a wealth of numbers. Far more than any other major sport, baseball has been
  30. described and preserved in the script of Arabic numerals--it is the primary
  31. way in which the stars of yesterday are remembered. All sports have their
  32. legends, with their apocryphal stories about their superstars. Where baseball
  33. transcends other sports, however, is in the numbers. Baseball statistics give
  34. clarity and perspective to the hallowed yet hazy pictures of the past; numbers
  35. make almost tangible the exploits of players long gone. It is, in fact, the
  36. accuracy and scope of these numbers which make meaningful comparisons of
  37. players across eras at all possible.
  38.      Who is responsible for this flood of numbers?  First, the fans, who have
  39. always looked for evidence to buttress their opinions. Second, the media, who
  40. have latched onto this trend and exploited it commercially. Third, Major
  41. League Baseball, which has aided and abetted the trend for publicity. Fourth,
  42. fantasy baseball players, many of whom were only casual fans before the advent
  43. of Rotisserie leagues. Fifth, authors and analysts, who use these new numbers
  44. to examine and explain the seemingly simple game of baseball.
  45.      Of all the new statistics, the type which has become most popular is the
  46. situational. In contrast to traditional baseball totals or averages like home
  47. runs and batting average, situational stats are an attempt to break baseball
  48. statistics into how and when they happened. The most important situational
  49. breakdowns are how batters perform versus lefthanded and righthanded pitchers
  50. (and pitchers vs. same and opposite handed batters) and how players perform in
  51. their home park as opposed to when they are on the road. In reality, these
  52. situational stats have been part of the game for decades, as generations of
  53. fans have argued about the effect of Yankee Stadium on sluggers like Ruth and
  54. Maris, while generations of managers have platooned their hitters. Aside from
  55. these two key categories, several other types of breakdowns have become
  56. prominent: "clutch" hitting measures, grass/turf splits, and individual
  57. pitcher-batter matchups.
  58.      The biggest problem with this flood of data is that very little analysis
  59. has been done. For example, when a manager chooses to start a right-handed
  60. batter (who would normally be platooned) against a right-handed pitcher, he
  61. can justify it statistically in any number of ways. He could base his
  62. decisions on that hitter's past performance against the opposing team, or by
  63. his performance against the opposing pitcher, or by his performance in day
  64. games, or by his performance against ground-ball pitchers, or even by his
  65. performance in the past week if he's been on a hot streak. All of these
  66. statistics (and many more) are available to teams on a daily basis. Of course,
  67. many of these numbers will be contradictory: a hitter might have done poorly
  68. against right-handed pitchers, but have done well against that team. He could
  69. also carry a pitiful average against that day's starting pitcher, but have
  70. done excellently in day games.
  71.      The real problem, then, is not a lack of available data--the problem is
  72. too little information. Whether you are managing the 1993 World Champion
  73. Toronto Blue Jays or playing armchair manager while watching the home team on
  74. cable, which statistics do you rely upon?  Literally everyone these days comes
  75. armed with reams of statistics--managers, teams, players and their agents, the
  76. media, and the fans. Unfortunately, the answer is that no one really knows.
  77. Precious little work has been done in understanding what these numbers mean;
  78. most of the work has been done in generating still more numbers. No one really
  79. knows if individual pitcher-batter matchups are more reliable predictors of
  80. performance than left/right breakdowns, and while everyone talks about
  81. "clutch" hitters, there are a dozen ways of measuring what might be called
  82. "clutch" hitting. Indeed, many studies have been done which fail to show any
  83. consistent, measurable effect which could be labeled as "clutch" hitting. Just
  84. what is true and what isn't?
  85.      The answer is both true and false. Most of the statistics quoted and
  86. published are literally true. That is, they are accounts of events which
  87. actually happened on the field, and therefore must be true. Stating that a
  88. player batted .390 with runners in scoring position doesn't leave anything to
  89. argue over. What is manifestly false, however, are most of the claims made
  90. about these statistics. If one argues that batting .390 with runners in
  91. scoring position means that the player is a good "clutch" hitter, the validity
  92. of that statement depends not on the actual numbers, but on the interpretation
  93. of those numbers. The interpretation and misinterpretation of the numbers and
  94. the predictions that flow from them are what cause the arguments.
  95.      At their best, these new statistics illuminate the various aspects of the
  96. game, making it easier to understand how and why players and teams win and
  97. lose. The fact that they describe performances in specific situations (hence
  98. their name) is both their strength and their weakness. At their worst,
  99. situational stats divide up the game into irrelevant categories which hinder
  100. understanding. The common parody of situational statistics--how a player hits
  101. "in Tuesday night games at home when facing a southpaw in July with the bases
  102. loaded"--is sometimes all too close to reality. In Game Seven of the 1992
  103. World Series, for example, more than five hundred stats were bandied about by
  104. the network broadcasters or displayed on the screen during the game. With so
  105. many numbers coming fast and furious, the significant ones get lost in the
  106. trivial, and the currency of all analytical statistics is debased.
  107.      The schizoid attitudes in baseball toward new statistics and analysis are
  108. shown by the fact that there isn't even general agreement on the use of the
  109. word sabermetrics: many fans have never heard of the term, and while some
  110. professionals in the field call themselves sabermetricians, others eschew the
  111. word and call themselves statistical analysts. The word sabermetrics was
  112. coined by best-selling author Bill James, who modified the acronym for the
  113. Society for American Baseball Research (SABR) for the root of the word and
  114. added the suffix -metrics to denote measurement.
  115.      While SABR may have lent these new statistics its name, the Society for
  116. American Baseball Research is not the primary purveyor of these new
  117. statistics. There are many outlets for statistics today, but most of these
  118. come from only a few sources. The Major League Baseball-IBM Baseball
  119. Information System, which operates out of the commissioner's office in New
  120. York City, now compiles baseball's official statistics. (Computer giant IBM is
  121. an official sponsor of major-league baseball and provides the computer
  122. hardware.) This system was set up in the late 1980s to provide statistics to
  123. major league teams, and it now also provides much of the material used by the
  124. media. The Elias Sports Bureau, also headquartered in New York, remains the
  125. official statistician for both major leagues and is another major source of
  126. statistics. Howe News Bureau, which had previously served for many years as
  127. the official statisticians of the American League, became the official
  128. statisticians in the late 1980s for all minor leagues and most of the Latin
  129. and Caribbean leagues. Signifying its new business orientation was a change in
  130. name to Howe Sportsdata International, which now provides minor-league
  131. statistics to numerous publications, making the records of tomorrow's stars
  132. available to fans today.
  133.      In the front offices of baseball teams, there have been two primary
  134. usages of these new statistics. Team Public Relations departments, aided by
  135. the computerized MLB-IBM Baseball Information System, have become increasingly
  136. more proficient and prolific at churning out special stats about their
  137. players. Most of these find their way to the fans via the media, who publicize
  138. these stats in print and on the air. The other way in which the new statistics
  139. have penetrated the business end of baseball is through salary arbitration, a
  140. quasilegal proceeding which directly sets salaries for a few dozen players
  141. each year. Indirectly, however, salary arbitration has a much broader impact
  142. on the game's salary structure. Newer statistical measures have been used by
  143. both management and labor in arbitration in recent years, although many
  144. analytical stats are still not admissible in arbitration proceedings by the
  145. mutual agreement of the disputing parties.
  146.      Outside the hearing room, new analytical measures have had a greater
  147. impact. Several major league teams have employed full-time professional
  148. statistical analysts in the past decade, and other teams have employed
  149. statistical analysts as consultants. Of these analysts, Eddie Epstein, now
  150. Director of Research and Statistics for the Baltimore Orioles, has risen the
  151. highest and had the most influence. Some other teams have employed computer
  152. systems to compile and analyze performance data, with the Oakland Athletics
  153. and manager Tony LaRussa getting the most credit for successfully using these
  154. tools. It is clear that the impact of computers (and the analytical statistics
  155. they make possible) will continue to grow in baseball's executive suites in
  156. the future.
  157.      In the publishing world, the main effect of the new statistics has been
  158. to create a new subgenre of baseball books. Celebrity biographies still sell
  159. the most sports books, but the number of statistically oriented titles
  160. released in recent years is astounding. Bill James, a Kansan who was not a
  161. sportswriter, made the best-seller lists year after year in the 1980s on the
  162. strength of his detailed statistical analysis as well as his witty and
  163. satirical prose. Pete Palmer, a computer programmer by trade, blazed the way
  164. for accurate historical comparisons of players and teams by combining his
  165. tireless research and top-notch computer skills to produce a comprehensive
  166. historical data base. Published for the first time in Total Baseball, a
  167. comprehensive reference work, Palmer brought sabermetrics and serious
  168. analytical measures to the general baseball public.
  169.      Many other authors in the last decade have published baseball books which
  170. relied on the numbers. By 1990, well over a hundred baseball books were being
  171. released by major publishers each spring; several dozen of these were devoted
  172. to statistical analysis or intended as reference works. The Elias Sports
  173. Bureau, longtime official statisticians of the National League, made their
  174. mark by publishing their annual eponymous book of situational stats starting
  175. in 1985. These stats, previously available only to major-league teams,
  176. instantly became part of the baseball public's consciousness. The Elias
  177. Baseball Analyst became the best-seller of the annual statistical tomes and is
  178. very widely quoted by the media.
  179.      Just as James, Palmer, and Elias were preceded by the members of the
  180. Society for American Baseball Research, they were also followed by many
  181. others. Project Scoresheet, a nonprofit organization founded by James in 1984,
  182. coordinated the efforts of hundreds of volunteers and produced the first and
  183. only publicly available data base of contemporary baseball. Retrosheet,
  184. another volunteer group founded by David Smith (a longtime SABR member and
  185. professor at the University of Delaware), is now collecting scoresheets from
  186. pre-1984 games. Armed with copies of more than 75,000 scoresheets donated by
  187. teams, sportswriters and fans, Retrosheet will soon make public its first
  188. computerized data (for the 1967 season).
  189.      As the official statisticians, Major League Baseball and the Elias Sports
  190. Bureau are the primary sources from which both the electronic and the print
  191. media get their baseball statistics. Two independent organizations also
  192. maintain baseball data bases, providing both the media and the fans with ready
  193. access to almost any conceivable baseball statistic: Stats, Inc., of Chicago
  194. (run by John Dewan and Dick Cramer), and The Baseball Workshop of Philadelphia
  195. (run by the author). Stats, Inc., has provided greatly improved and expanded
  196. box scores to USA Today, Baseball Weekly, and other newspapers since 1990.
  197. Stats also provides statistics to ESPN and other media outlets, produces the
  198. annual Scouting Report, and self-publishes other baseball reference books. The
  199. Baseball Workshop maintains and updates the former Project Scoresheet data
  200. base while providing statistics and analysis to publishers and to media
  201. clients. The Workshop's annual Great American Baseball Stat Book features
  202. comprehensive situational statistics for all active major-league players.
  203.      On the periodical side, media conglomerate Gannett founded a weekly
  204. newspaper in 1990 devoted solely to baseball--more specifically to baseball
  205. statistics, which take up a large portion of the paper. While the
  206. hundred-year-old Sporting News has deemphasized baseball,  USA Today Baseball
  207. Weekly has found a market hundreds of thousands strong by focusing exclusively
  208. on baseball. It is true, though, that a very large share of the Baseball
  209. Weekly audience is composed of fantasy baseball players, and the format of the
  210. statistics published in BBW is designed for their convenience. Baseball
  211. America, a biweekly newspaper which focuses on minor-league and college
  212. baseball, has also gained a large following among dedicated fans and fantasy
  213. baseball players. The ready availability of information about thousands of
  214. minor-leaguers in Baseball America, and the regular publication by BBW in 1992
  215. of OPS stats (On-Base plus Slugging, an analytical measure developed by Pete
  216. Palmer) show just how far the new statistics have come.
  217.      Probably the most high-profile and controversial element of the new
  218. statistics trend has been the explosion in popularity of fantasy baseball, a
  219. pastime that occupies several million players. An undeniable attraction of
  220. fantasy baseball is that it brings to baseball one element which football has
  221. had for decades: gambling. It is undeniably true that without the wager, there
  222. would be very few fantasy leagues. The excitement of betting on football is
  223. one of the main reasons for its spectacular growth in popularity, and fantasy
  224. games give baseball fans a chance to partake of the action during the summer
  225. as well as in the Gamblers, both fantasy players and others, make extensive
  226. use of the new stats. Fantasy baseball is firmly established and likely to
  227. increase in popularity.
  228.      Another area of great growth has been in baseball games. Baseball board
  229. games, using dice as the element of chance and statistics to recreate
  230. performance, have been played by a small but devoted group since the birth of
  231. APBA Baseball in the early 1950s. In the mid-1980s computer baseball games
  232. took hold and now appear to be the future of baseball gaming. While board
  233. games still have their audience, computer games are much more flexible and are
  234. able to provide fans with a variety of simulated experiences which board games
  235. cannot. Furthermore, the virtues of a computer opponent, when a
  236. flesh-and-blood one is unavailable, are understandable.
  237.      The latest computer games simulate sophisticated opposing managers as
  238. well as recreating player performance. Moreover, the era of almost real-time
  239. baseball games has already dawned. In 1991 the computer service Prodigy
  240. debuted a baseball game which used last night's real-life performances to play
  241. simulated games. The participants in "Big League Manager" send in their
  242. lineups by modem before they go to bed; the next morning, they dial up the
  243. Prodigy computer and see a boxscore for last night's game for their team
  244. displayed along with current league standings. Compuserve and other major
  245. computer on-line services also provide an electronic forum which connects
  246. baseball fans across the country. These services run hundreds of electronic
  247. fantasy baseball leagues which attract thousands of players. Fantasy baseball
  248. contests, made possible by the combination of computers and "800" and "900"
  249. phone lines, have also become big business in the 1990s.
  250.      Yet another electronic milestone was reached in 1991-1992 with the debut
  251. of the electronic baseball encyclopedia, in two forms: Total Baseball became
  252. available in compact disc, read-only memory form (CD-ROM)--in a mini-disc for
  253. Sony's palmtop DataDiscman player and for the desktop computer, MS-DOS or
  254. Macintosh, in a conventional size disc published by CMC; also, Big League
  255. Baseball, a handheld reference device published by Franklin Electronics which
  256. fit into a shirt pocket. The most recent development, as of 1994, is Microsoft
  257. Baseball, which incorporates the statistical database and prose features of
  258. Total Baseball within a larger reference framework, created for the Windows
  259. graphical environment. The advantage of an electronic baseball encyclopedia is
  260. not simply its portability or its compact data storage and retrieval. These
  261. electronic editions invite the user to manipulate the numbers, to make
  262. customized lists and complicated research requests, all of which make the
  263. numbers more meaningful and accessible to the fan than they are on the printed
  264. page.
  265.      Last, and least, is the negative reaction to the new statistics. There
  266. has been a backlash, and it's true that many fans believe the game has
  267. suffered from these stats and their purveyors, but the new statistics don't
  268. change the grand old game; they just provide new ways of looking at it. Almost
  269. all traditional baseball statistics (e.g., batting average, earned run
  270. average, errors) were invented in the nineteenth century or the early
  271. twentieth, and they reflect the way the game was played at that time. The game
  272. on the field is quite different now, and it is appropriate that the statistics
  273. used to describe and analyze the game reflect the way the game is played now.
  274.      As with new strategies on the field, the old stats will persist while
  275. their replacements become established. During this time, the improvement in
  276. analysis will be obscured by the clash of stats and the arguments of the
  277. analysts. Inevitably, though, the best of the new stats will oust the worst of
  278. the old, and the game will look a little different in the future.
  279.      Not too long ago, you know, nobody bothered to count such silly things as
  280. runs batted in, batter strikeouts, times caught stealing, or saves. Players
  281. change, teams change, ballparks change, strategies change--even "the
  282. unchanging game" itself changes. Why shouldn't baseball statistics change
  283. along with them?
  284.