home *** CD-ROM | disk | FTP | other *** search
/ C/C++ Interactive Guide / c-cplusplus-interactive-guide.iso / c_ref / csource4 / 209_01 / ldhfitr.doc < prev    next >
Text File  |  1990-03-05  |  23KB  |  732 lines

  1. LDHFITR.DOC       VERS:- 01.00 DATE:- 09/26/86 TIME:- 10:02:47 PM 
  2.  
  3. description of computer reduction of data from kinetic 
  4.     measurements for the enzyme lactate dehydrogenase 
  5. information on how to run program LDHFIT
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  
  12.         By J. A. Rupley, Tucson, Arizona
  13.  
  14.  
  15.          NOTES ON DATA REDUCTION BY COMPUTER
  16.          AND INFORMATION ON RUNNING THE PROGRAM LDHFIT
  17.     
  18.  
  19.         INTRODUCTION:
  20.  
  21.          In order to obtain conclusions from quantitative measurements,
  22.         there must be some form of data reduction. This can be as simple
  23.         as a comparison by eye of two curves drawn through the data. If,
  24.         however, the data set is large and complex, for example with more
  25.         than one independent variable, and if the questions posed are
  26.         detailed or involve a complicated nonlinear model, then visual or
  27.         graphical methods are less satisfactory than a computer-based
  28.         analysis. Procedures of the latter type are now widely used.
  29.  
  30.          This laboratory is a short introduction to data reduction by use
  31.         of a computer. The intent is to show that a sophisticated
  32.         computer program can be handled easily, that its use saves time
  33.         and effort, that it can treat a more complicated model than can
  34.         be treated graphically, and that it produces information such as
  35.         estimates of uncertainties in the parameters that is difficult or
  36.         impossible to obtain from graphical methods.
  37.  
  38.          The data to be analyzed are initial rate measurements made
  39.         on the lactate dehydrogenase catalyzed reaction of pyruvate with
  40.         NADH, in the presence and absence of lactate as inhibitor. The
  41.         results of the computer fit are the following:  (1) values of the
  42.         kinetic constants V, KmA, KmB, KmAB, KmQ/KmPQ, and KBInhib. The
  43.         first five constants are those that can be evaluated by the
  44.         standard graphical methods of primary and secondary reciprocal
  45.         plots.  The constant KBInhib is the dissociation constant for the
  46.         dead-end complex LDH-NADH-lactate, which is included in the
  47.         mechanism fit by the computer program but cannot be included in
  48.         the mechanism on which the graphical methods are based.  (2)
  49.         Estimates of the standard deviations of the kinetic constants.
  50.         These are needed for an understanding of the reliability and
  51.         significance of the values calculated for the kinetic constants.
  52.         (3) A list of the coordinates of points suitable for construction
  53.         of the lines of the reciprocal plots of the standard graphical
  54.         methods.
  55.  
  56.  
  57.  
  58.  
  59.  
  60.  
  61.  
  62.  
  63.  
  64.  
  65.  
  66.  
  67.  
  68.                                         1
  69.  
  70.  
  71.  
  72.  
  73.  
  74.  
  75.  
  76.  
  77.  
  78.         By J. A. Rupley, Tucson, Arizona
  79.  
  80.         THEORY:
  81.  
  82.         A. REMARKS ON FITTING OF A MODEL TO DATA
  83.  
  84.          In a typical data reduction, a particular model to be tested is
  85.         fit to a set of data points under some criterion for best fit.
  86.         The ith data point of a set of N data points consists of a single
  87.         value for the dependent variable Yobserved(i) measured for
  88.         corresponding single values for the one or more independent
  89.         variables Xobserved(i). The commonly-used least squares criterion
  90.         for quality of fit is the minimum value of the sum of the squares
  91.         of the deviations between the observed values of Y and the values
  92.         of Y calculated according to the model being tested.
  93.  
  94.          Working from the model to be fit to the data, one develops an
  95.         equation relating, for each of the N data points, the dependent
  96.         variable Y to the independent variables X and to a set of M
  97.         variable parameters p:
  98.  
  99.              Ymodel(i) = F(Xobserved(i); p(j), j=1,M)        eq. 1
  100.  
  101.         For example, if the model predicts a linear relationship between
  102.         Y and a single independent variable X :
  103.  
  104.              Ymodel(i) = p(1) + p(2) * Xobserved(i)          eq. 2
  105.  
  106.         The constants p(1) and p(2) of equation (2) are the Y axis
  107.         intercept and the slope, respectively, and of course are the same
  108.         for all data points (for all pairs of values Y(i) and X(i)).
  109.  
  110.          The fitting of a model to data consists of finding the values of
  111.         the M variable parameters p that give the best agreement between
  112.         the N pairs of values of Ymodel(i) and Yobserved(i). Best
  113.         agreement can be defined as the minimum value of the least
  114.         squares function y:
  115.  
  116.                   N
  117.              y = SUM (Yobserved(i) - Ymodel(i))^2 * W(i)     eq. 3
  118.                  i=1
  119.  
  120.  
  121.         The factor W(i) of equation (3) is the normalized reciprocal
  122.         variance (the statistical weighting) of the ith data point, and
  123.         it can be set at unity if the data points are all of equal
  124.         estimated uncertainty.
  125.  
  126.          Combining equations (1) and (3), one sees that the least squares
  127.         function y of equation (3) is a function of the full set of N
  128.         data points and a set of M variable parameters:
  129.  
  130.           y = f(Yobserved(i), Xobserved(i), i=1,N; p(j), j=1,M)   eq. 4
  131.  
  132.  
  133.  
  134.                                         2
  135.  
  136.  
  137.  
  138.  
  139.  
  140.  
  141.  
  142.  
  143.  
  144.          The fitting problem therefore consists of finding the minimum
  145.         value of the least squares function y, which for a given set of
  146.         data depends only on the M variable parameters p (the data points
  147.         Yobserved(i)---Xobserved(i) in equation (4) are constant in the
  148.         fitting). There are several methods commonly used to find the
  149.         minimum of y and thus evaluate the best fit values of the
  150.         parameters p. The more useful of these can handle nonlinear model
  151.         functions F (equation (1)) of arbitrary mathematical form. The
  152.         rate law for lactate dehydrogenase is an example of a nonlinear
  153.         model function.
  154.  
  155.          In the simplex method used here, one constructs an M dimensional
  156.         polyhedron with M + 1 vertices (the simplex). Each dimension of
  157.         the simplex corresponds to a variable parameter of equation (4).
  158.         Each vertex of the simplex is a point in the M dimensional space,
  159.         which is called "parameter space" or "factor space." The M
  160.         coordinates of each vertex are values of the M parameters. Thus
  161.         each vertex of the simplex has an associated value of the least
  162.         squares function y. The starting simplex is constructed to be so
  163.         large as to include within it the point corresponding to the
  164.         minimum value of y. This minimum point has as its coordinates of
  165.         the best fit values of the parameters.
  166.  
  167.          The minimization process shrinks the simplex about the minimum
  168.         point, even though the coordinates of the minimum are not known
  169.         beforehand, until the vertices of the simplex are so close
  170.         together and so nearly equal that an exit test is satisfied. The
  171.         exit test is set so that a desired level of accuracy is obtained.
  172.         The values of the M parameters averaged over all the vertices, ie
  173.         the parameter values for the centroid of the simplex, serve as
  174.         reliable estimates of the best fit parameter values (those for
  175.         the least squares function minimum), because the minimum point is
  176.         known to be inside the shrunken simplex and thus near the
  177.         centroid.
  178.  
  179.          We generally want to estimate the uncertainties in the parameter
  180.         values obtained for a model fit to a particular set of data
  181.         points. Standard deviations of the parameters are calculated by
  182.         the program used here.
  183.  
  184.          There are likely to be large uncertainties in the parameters if
  185.         there are few data points or if there are large deviations
  186.         between Ymodel and Yobserved. As a rule, one should have 5 to 10
  187.         times as many data points as parameters.
  188.  
  189.          The first try at estimating uncertainties of the parameters can
  190.         fail. The calculation involves matrix inversion, the use of
  191.         differences between nearly equal large numbers, and the