home *** CD-ROM | disk | FTP | other *** search
/ OpenStep (Enterprise) / OpenStepENTCD.toast / OEDEV / GNUSRC.Z / gcc.info-17 (.txt) < prev    next >
GNU Info File  |  1995-11-26  |  50KB  |  890 lines

  1. This is Info file gcc.info, produced by Makeinfo-1.55 from the input
  2. file gcc.texi.
  3.    This file documents the use and the internals of the GNU compiler.
  4.    Published by the Free Software Foundation 59 Temple Place - Suite 330
  5. Boston, MA 02111-1307 USA
  6.    Copyright (C) 1988, 1989, 1992, 1993, 1994, 1995 Free Software
  7. Foundation, Inc.
  8.    Permission is granted to make and distribute verbatim copies of this
  9. manual provided the copyright notice and this permission notice are
  10. preserved on all copies.
  11.    Permission is granted to copy and distribute modified versions of
  12. this manual under the conditions for verbatim copying, provided also
  13. that the sections entitled "GNU General Public License," "Funding for
  14. Free Software," and "Protect Your Freedom--Fight `Look And Feel'" are
  15. included exactly as in the original, and provided that the entire
  16. resulting derived work is distributed under the terms of a permission
  17. notice identical to this one.
  18.    Permission is granted to copy and distribute translations of this
  19. manual into another language, under the above conditions for modified
  20. versions, except that the sections entitled "GNU General Public
  21. License," "Funding for Free Software," and "Protect Your Freedom--Fight
  22. `Look And Feel'", and this permission notice, may be included in
  23. translations approved by the Free Software Foundation instead of in the
  24. original English.
  25. File: gcc.info,  Node: Standard Names,  Next: Pattern Ordering,  Prev: Constraints,  Up: Machine Desc
  26. Standard Pattern Names For Generation
  27. =====================================
  28.    Here is a table of the instruction names that are meaningful in the
  29. RTL generation pass of the compiler.  Giving one of these names to an
  30. instruction pattern tells the RTL generation pass that it can use the
  31. pattern in to accomplish a certain task.
  32. `movM'
  33.      Here M stands for a two-letter machine mode name, in lower case.
  34.      This instruction pattern moves data with that machine mode from
  35.      operand 1 to operand 0.  For example, `movsi' moves full-word data.
  36.      If operand 0 is a `subreg' with mode M of a register whose own
  37.      mode is wider than M, the effect of this instruction is to store
  38.      the specified value in the part of the register that corresponds
  39.      to mode M.  The effect on the rest of the register is undefined.
  40.      This class of patterns is special in several ways.  First of all,
  41.      each of these names *must* be defined, because there is no other
  42.      way to copy a datum from one place to another.
  43.      Second, these patterns are not used solely in the RTL generation
  44.      pass.  Even the reload pass can generate move insns to copy values
  45.      from stack slots into temporary registers.  When it does so, one
  46.      of the operands is a hard register and the other is an operand
  47.      that can need to be reloaded into a register.
  48.      Therefore, when given such a pair of operands, the pattern must
  49.      generate RTL which needs no reloading and needs no temporary
  50.      registers--no registers other than the operands.  For example, if
  51.      you support the pattern with a `define_expand', then in such a
  52.      case the `define_expand' mustn't call `force_reg' or any other such
  53.      function which might generate new pseudo registers.
  54.      This requirement exists even for subword modes on a RISC machine
  55.      where fetching those modes from memory normally requires several
  56.      insns and some temporary registers.  Look in `spur.md' to see how
  57.      the requirement can be satisfied.
  58.      During reload a memory reference with an invalid address may be
  59.      passed as an operand.  Such an address will be replaced with a
  60.      valid address later in the reload pass.  In this case, nothing may
  61.      be done with the address except to use it as it stands.  If it is
  62.      copied, it will not be replaced with a valid address.  No attempt
  63.      should be made to make such an address into a valid address and no
  64.      routine (such as `change_address') that will do so may be called.
  65.      Note that `general_operand' will fail when applied to such an
  66.      address.
  67.      The global variable `reload_in_progress' (which must be explicitly
  68.      declared if required) can be used to determine whether such special
  69.      handling is required.
  70.      The variety of operands that have reloads depends on the rest of
  71.      the machine description, but typically on a RISC machine these can
  72.      only be pseudo registers that did not get hard registers, while on
  73.      other machines explicit memory references will get optional
  74.      reloads.
  75.      If a scratch register is required to move an object to or from
  76.      memory, it can be allocated using `gen_reg_rtx' prior to reload.
  77.      But this is impossible during and after reload.  If there are
  78.      cases needing scratch registers after reload, you must define
  79.      `SECONDARY_INPUT_RELOAD_CLASS' and perhaps also
  80.      `SECONDARY_OUTPUT_RELOAD_CLASS' to detect them, and provide
  81.      patterns `reload_inM' or `reload_outM' to handle them.  *Note
  82.      Register Classes::.
  83.      The constraints on a `moveM' must permit moving any hard register
  84.      to any other hard register provided that `HARD_REGNO_MODE_OK'
  85.      permits mode M in both registers and `REGISTER_MOVE_COST' applied
  86.      to their classes returns a value of 2.
  87.      It is obligatory to support floating point `moveM' instructions
  88.      into and out of any registers that can hold fixed point values,
  89.      because unions and structures (which have modes `SImode' or
  90.      `DImode') can be in those registers and they may have floating
  91.      point members.
  92.      There may also be a need to support fixed point `moveM'
  93.      instructions in and out of floating point registers.
  94.      Unfortunately, I have forgotten why this was so, and I don't know
  95.      whether it is still true.  If `HARD_REGNO_MODE_OK' rejects fixed
  96.      point values in floating point registers, then the constraints of
  97.      the fixed point `moveM' instructions must be designed to avoid
  98.      ever trying to reload into a floating point register.
  99. `reload_inM'
  100. `reload_outM'
  101.      Like `movM', but used when a scratch register is required to move
  102.      between operand 0 and operand 1.  Operand 2 describes the scratch
  103.      register.  See the discussion of the `SECONDARY_RELOAD_CLASS'
  104.      macro in *note Register Classes::..
  105. `movstrictM'
  106.      Like `movM' except that if operand 0 is a `subreg' with mode M of
  107.      a register whose natural mode is wider, the `movstrictM'
  108.      instruction is guaranteed not to alter any of the register except
  109.      the part which belongs to mode M.
  110. `load_multiple'
  111.      Load several consecutive memory locations into consecutive
  112.      registers.  Operand 0 is the first of the consecutive registers,
  113.      operand 1 is the first memory location, and operand 2 is a
  114.      constant: the number of consecutive registers.
  115.      Define this only if the target machine really has such an
  116.      instruction; do not define this if the most efficient way of
  117.      loading consecutive registers from memory is to do them one at a
  118.      time.
  119.      On some machines, there are restrictions as to which consecutive
  120.      registers can be stored into memory, such as particular starting or
  121.      ending register numbers or only a range of valid counts.  For those
  122.      machines, use a `define_expand' (*note Expander Definitions::.)
  123.      and make the pattern fail if the restrictions are not met.
  124.      Write the generated insn as a `parallel' with elements being a
  125.      `set' of one register from the appropriate memory location (you may
  126.      also need `use' or `clobber' elements).  Use a `match_parallel'
  127.      (*note RTL Template::.) to recognize the insn.  See `a29k.md' and
  128.      `rs6000.md' for examples of the use of this insn pattern.
  129. `store_multiple'
  130.      Similar to `load_multiple', but store several consecutive registers
  131.      into consecutive memory locations.  Operand 0 is the first of the
  132.      consecutive memory locations, operand 1 is the first register, and
  133.      operand 2 is a constant: the number of consecutive registers.
  134. `addM3'
  135.      Add operand 2 and operand 1, storing the result in operand 0.  All
  136.      operands must have mode M.  This can be used even on two-address
  137.      machines, by means of constraints requiring operands 1 and 0 to be
  138.      the same location.
  139. `subM3', `mulM3'
  140. `divM3', `udivM3', `modM3', `umodM3'
  141. `sminM3', `smaxM3', `uminM3', `umaxM3'
  142. `andM3', `iorM3', `xorM3'
  143.      Similar, for other arithmetic operations.
  144. `mulhisi3'
  145.      Multiply operands 1 and 2, which have mode `HImode', and store a
  146.      `SImode' product in operand 0.
  147. `mulqihi3', `mulsidi3'
  148.      Similar widening-multiplication instructions of other widths.
  149. `umulqihi3', `umulhisi3', `umulsidi3'
  150.      Similar widening-multiplication instructions that do unsigned
  151.      multiplication.
  152. `mulM3_highpart'
  153.      Perform a signed multiplication of operands 1 and 2, which have
  154.      mode M, and store the most significant half of the product in
  155.      operand 0.  The least significant half of the product is discarded.
  156. `umulM3_highpart'
  157.      Similar, but the multiplication is unsigned.
  158. `divmodM4'
  159.      Signed division that produces both a quotient and a remainder.
  160.      Operand 1 is divided by operand 2 to produce a quotient stored in
  161.      operand 0 and a remainder stored in operand 3.
  162.      For machines with an instruction that produces both a quotient and
  163.      a remainder, provide a pattern for `divmodM4' but do not provide
  164.      patterns for `divM3' and `modM3'.  This allows optimization in the
  165.      relatively common case when both the quotient and remainder are
  166.      computed.
  167.      If an instruction that just produces a quotient or just a remainder
  168.      exists and is more efficient than the instruction that produces
  169.      both, write the output routine of `divmodM4' to call
  170.      `find_reg_note' and look for a `REG_UNUSED' note on the quotient
  171.      or remainder and generate the appropriate instruction.
  172. `udivmodM4'
  173.      Similar, but does unsigned division.
  174. `ashlM3'
  175.      Arithmetic-shift operand 1 left by a number of bits specified by
  176.      operand 2, and store the result in operand 0.  Here M is the mode
  177.      of operand 0 and operand 1; operand 2's mode is specified by the
  178.      instruction pattern, and the compiler will convert the operand to
  179.      that mode before generating the instruction.
  180. `ashrM3', `lshrM3', `rotlM3', `rotrM3'
  181.      Other shift and rotate instructions, analogous to the `ashlM3'
  182.      instructions.
  183. `negM2'
  184.      Negate operand 1 and store the result in operand 0.
  185. `absM2'
  186.      Store the absolute value of operand 1 into operand 0.
  187. `sqrtM2'
  188.      Store the square root of operand 1 into operand 0.
  189.      The `sqrt' built-in function of C always uses the mode which
  190.      corresponds to the C data type `double'.
  191. `ffsM2'
  192.      Store into operand 0 one plus the index of the least significant
  193.      1-bit of operand 1.  If operand 1 is zero, store zero.  M is the
  194.      mode of operand 0; operand 1's mode is specified by the instruction
  195.      pattern, and the compiler will convert the operand to that mode
  196.      before generating the instruction.
  197.      The `ffs' built-in function of C always uses the mode which
  198.      corresponds to the C data type `int'.
  199. `one_cmplM2'
  200.      Store the bitwise-complement of operand 1 into operand 0.
  201. `cmpM'
  202.      Compare operand 0 and operand 1, and set the condition codes.  The
  203.      RTL pattern should look like this:
  204.           (set (cc0) (compare (match_operand:M 0 ...)
  205.                               (match_operand:M 1 ...)))
  206. `tstM'
  207.      Compare operand 0 against zero, and set the condition codes.  The
  208.      RTL pattern should look like this:
  209.           (set (cc0) (match_operand:M 0 ...))
  210.      `tstM' patterns should not be defined for machines that do not use
  211.      `(cc0)'.  Doing so would confuse the optimizer since it would no
  212.      longer be clear which `set' operations were comparisons.  The
  213.      `cmpM' patterns should be used instead.
  214. `movstrM'
  215.      Block move instruction.  The addresses of the destination and
  216.      source strings are the first two operands, and both are in mode
  217.      `Pmode'.  The number of bytes to move is the third operand, in
  218.      mode M.
  219.      The fourth operand is the known shared alignment of the source and
  220.      destination, in the form of a `const_int' rtx.  Thus, if the
  221.      compiler knows that both source and destination are word-aligned,
  222.      it may provide the value 4 for this operand.
  223.      These patterns need not give special consideration to the
  224.      possibility that the source and destination strings might overlap.
  225. `cmpstrM'
  226.      Block compare instruction, with five operands.  Operand 0 is the
  227.      output; it has mode M.  The remaining four operands are like the
  228.      operands of `movstrM'.  The two memory blocks specified are
  229.      compared byte by byte in lexicographic order.  The effect of the
  230.      instruction is to store a value in operand 0 whose sign indicates
  231.      the result of the comparison.
  232.      Compute the length of a string, with three operands.  Operand 0 is
  233.      the result (of mode M), operand 1 is a `mem' referring to the
  234.      first character of the string, operand 2 is the character to
  235.      search for (normally zero), and operand 3 is a constant describing
  236.      the known alignment of the beginning of the string.
  237. `floatMN2'
  238.      Convert signed integer operand 1 (valid for fixed point mode M) to
  239.      floating point mode N and store in operand 0 (which has mode N).
  240. `floatunsMN2'
  241.      Convert unsigned integer operand 1 (valid for fixed point mode M)
  242.      to floating point mode N and store in operand 0 (which has mode N).
  243. `fixMN2'
  244.      Convert operand 1 (valid for floating point mode M) to fixed point
  245.      mode N as a signed number and store in operand 0 (which has mode
  246.      N).  This instruction's result is defined only when the value of
  247.      operand 1 is an integer.
  248. `fixunsMN2'
  249.      Convert operand 1 (valid for floating point mode M) to fixed point
  250.      mode N as an unsigned number and store in operand 0 (which has
  251.      mode N).  This instruction's result is defined only when the value
  252.      of operand 1 is an integer.
  253. `ftruncM2'
  254.      Convert operand 1 (valid for floating point mode M) to an integer
  255.      value, still represented in floating point mode M, and store it in
  256.      operand 0 (valid for floating point mode M).
  257. `fix_truncMN2'
  258.      Like `fixMN2' but works for any floating point value of mode M by
  259.      converting the value to an integer.
  260. `fixuns_truncMN2'
  261.      Like `fixunsMN2' but works for any floating point value of mode M
  262.      by converting the value to an integer.
  263. `truncMN'
  264.      Truncate operand 1 (valid for mode M) to mode N and store in
  265.      operand 0 (which has mode N).  Both modes must be fixed point or
  266.      both floating point.
  267. `extendMN'
  268.      Sign-extend operand 1 (valid for mode M) to mode N and store in
  269.      operand 0 (which has mode N).  Both modes must be fixed point or
  270.      both floating point.
  271. `zero_extendMN'
  272.      Zero-extend operand 1 (valid for mode M) to mode N and store in
  273.      operand 0 (which has mode N).  Both modes must be fixed point.
  274. `extv'
  275.      Extract a bit field from operand 1 (a register or memory operand),
  276.      where operand 2 specifies the width in bits and operand 3 the
  277.      starting bit, and store it in operand 0.  Operand 0 must have mode
  278.      `word_mode'.  Operand 1 may have mode `byte_mode' or `word_mode';
  279.      often `word_mode' is allowed only for registers.  Operands 2 and 3
  280.      must be valid for `word_mode'.
  281.      The RTL generation pass generates this instruction only with
  282.      constants for operands 2 and 3.
  283.      The bit-field value is sign-extended to a full word integer before
  284.      it is stored in operand 0.
  285. `extzv'
  286.      Like `extv' except that the bit-field value is zero-extended.
  287. `insv'
  288.      Store operand 3 (which must be valid for `word_mode') into a bit
  289.      field in operand 0, where operand 1 specifies the width in bits and
  290.      operand 2 the starting bit.  Operand 0 may have mode `byte_mode' or
  291.      `word_mode'; often `word_mode' is allowed only for registers.
  292.      Operands 1 and 2 must be valid for `word_mode'.
  293.      The RTL generation pass generates this instruction only with
  294.      constants for operands 1 and 2.
  295. `movMODEcc'
  296.      Conditionally move operand 2 or operand 3 into operand 0 according
  297.      to the comparison in operand 1.  If the comparison is true,
  298.      operand 2 is moved into operand 0, otherwise operand 3 is moved.
  299.      The mode of the operands being compared need not be the same as
  300.      the operands being moved.  Some machines, sparc64 for example,
  301.      have instructions that conditionally move an integer value based
  302.      on the floating point condition codes and vice versa.
  303.      If the machine does not have conditional move instructions, do not
  304.      define these patterns.
  305. `sCOND'
  306.      Store zero or nonzero in the operand according to the condition
  307.      codes.  Value stored is nonzero iff the condition COND is true.
  308.      cOND is the name of a comparison operation expression code, such
  309.      as `eq', `lt' or `leu'.
  310.      You specify the mode that the operand must have when you write the
  311.      `match_operand' expression.  The compiler automatically sees which
  312.      mode you have used and supplies an operand of that mode.
  313.      The value stored for a true condition must have 1 as its low bit,
  314.      or else must be negative.  Otherwise the instruction is not
  315.      suitable and you should omit it from the machine description.  You
  316.      describe to the compiler exactly which value is stored by defining
  317.      the macro `STORE_FLAG_VALUE' (*note Misc::.).  If a description
  318.      cannot be found that can be used for all the `sCOND' patterns, you
  319.      should omit those operations from the machine description.
  320.      These operations may fail, but should do so only in relatively
  321.      uncommon cases; if they would fail for common cases involving
  322.      integer comparisons, it is best to omit these patterns.
  323.      If these operations are omitted, the compiler will usually
  324.      generate code that copies the constant one to the target and
  325.      branches around an assignment of zero to the target.  If this code
  326.      is more efficient than the potential instructions used for the
  327.      `sCOND' pattern followed by those required to convert the result
  328.      into a 1 or a zero in `SImode', you should omit the `sCOND'
  329.      operations from the machine description.
  330. `bCOND'
  331.      Conditional branch instruction.  Operand 0 is a `label_ref' that
  332.      refers to the label to jump to.  Jump if the condition codes meet
  333.      condition COND.
  334.      Some machines do not follow the model assumed here where a
  335.      comparison instruction is followed by a conditional branch
  336.      instruction.  In that case, the `cmpM' (and `tstM') patterns should
  337.      simply store the operands away and generate all the required insns
  338.      in a `define_expand' (*note Expander Definitions::.) for the
  339.      conditional branch operations.  All calls to expand `bCOND'
  340.      patterns are immediately preceded by calls to expand either a
  341.      `cmpM' pattern or a `tstM' pattern.
  342.      Machines that use a pseudo register for the condition code value,
  343.      or where the mode used for the comparison depends on the condition
  344.      being tested, should also use the above mechanism.  *Note Jump
  345.      Patterns::
  346.      The above discussion also applies to the `movMODEcc' and `sCOND'
  347.      patterns.
  348. `call'
  349.      Subroutine call instruction returning no value.  Operand 0 is the
  350.      function to call; operand 1 is the number of bytes of arguments
  351.      pushed (in mode `SImode', except it is normally a `const_int');
  352.      operand 2 is the number of registers used as operands.
  353.      On most machines, operand 2 is not actually stored into the RTL
  354.      pattern.  It is supplied for the sake of some RISC machines which
  355.      need to put this information into the assembler code; they can put
  356.      it in the RTL instead of operand 1.
  357.      Operand 0 should be a `mem' RTX whose address is the address of the
  358.      function.  Note, however, that this address can be a `symbol_ref'
  359.      expression even if it would not be a legitimate memory address on
  360.      the target machine.  If it is also not a valid argument for a call
  361.      instruction, the pattern for this operation should be a
  362.      `define_expand' (*note Expander Definitions::.) that places the
  363.      address into a register and uses that register in the call
  364.      instruction.
  365. `call_value'
  366.      Subroutine call instruction returning a value.  Operand 0 is the
  367.      hard register in which the value is returned.  There are three more
  368.      operands, the same as the three operands of the `call' instruction
  369.      (but with numbers increased by one).
  370.      Subroutines that return `BLKmode' objects use the `call' insn.
  371. `call_pop', `call_value_pop'
  372.      Similar to `call' and `call_value', except used if defined and if
  373.      `RETURN_POPS_ARGS' is non-zero.  They should emit a `parallel'
  374.      that contains both the function call and a `set' to indicate the
  375.      adjustment made to the frame pointer.
  376.      For machines where `RETURN_POPS_ARGS' can be non-zero, the use of
  377.      these patterns increases the number of functions for which the
  378.      frame pointer can be eliminated, if desired.
  379. `untyped_call'
  380.      Subroutine call instruction returning a value of any type.
  381.      Operand 0 is the function to call; operand 1 is a memory location
  382.      where the result of calling the function is to be stored; operand
  383.      2 is a `parallel' expression where each element is a `set'
  384.      expression that indicates the saving of a function return value
  385.      into the result block.
  386.      This instruction pattern should be defined to support
  387.      `__builtin_apply' on machines where special instructions are needed
  388.      to call a subroutine with arbitrary arguments or to save the value
  389.      returned.  This instruction pattern is required on machines that
  390.      have multiple registers that can hold a return value (i.e.
  391.      `FUNCTION_VALUE_REGNO_P' is true for more than one register).
  392. `return'
  393.      Subroutine return instruction.  This instruction pattern name
  394.      should be defined only if a single instruction can do all the work
  395.      of returning from a function.
  396.      Like the `movM' patterns, this pattern is also used after the RTL
  397.      generation phase.  In this case it is to support machines where
  398.      multiple instructions are usually needed to return from a
  399.      function, but some class of functions only requires one
  400.      instruction to implement a return.  Normally, the applicable
  401.      functions are those which do not need to save any registers or
  402.      allocate stack space.
  403.      For such machines, the condition specified in this pattern should
  404.      only be true when `reload_completed' is non-zero and the function's
  405.      epilogue would only be a single instruction.  For machines with
  406.      register windows, the routine `leaf_function_p' may be used to
  407.      determine if a register window push is required.
  408.      Machines that have conditional return instructions should define
  409.      patterns such as
  410.           (define_insn ""
  411.             [(set (pc)
  412.                   (if_then_else (match_operator
  413.                                    0 "comparison_operator"
  414.                                    [(cc0) (const_int 0)])
  415.                                 (return)
  416.                                 (pc)))]
  417.             "CONDITION"
  418.             "...")
  419.      where CONDITION would normally be the same condition specified on
  420.      the named `return' pattern.
  421. `untyped_return'
  422.      Untyped subroutine return instruction.  This instruction pattern
  423.      should be defined to support `__builtin_return' on machines where
  424.      special instructions are needed to return a value of any type.
  425.      Operand 0 is a memory location where the result of calling a
  426.      function with `__builtin_apply' is stored; operand 1 is a
  427.      `parallel' expression where each element is a `set' expression
  428.      that indicates the restoring of a function return value from the
  429.      result block.
  430. `nop'
  431.      No-op instruction.  This instruction pattern name should always be
  432.      defined to output a no-op in assembler code.  `(const_int 0)' will
  433.      do as an RTL pattern.
  434. `indirect_jump'
  435.      An instruction to jump to an address which is operand zero.  This
  436.      pattern name is mandatory on all machines.
  437. `casesi'
  438.      Instruction to jump through a dispatch table, including bounds
  439.      checking.  This instruction takes five operands:
  440.        1. The index to dispatch on, which has mode `SImode'.
  441.        2. The lower bound for indices in the table, an integer constant.
  442.        3. The total range of indices in the table--the largest index
  443.           minus the smallest one (both inclusive).
  444.        4. A label that precedes the table itself.
  445.        5. A label to jump to if the index has a value outside the
  446.           bounds.  (If the machine-description macro
  447.           `CASE_DROPS_THROUGH' is defined, then an out-of-bounds index
  448.           drops through to the code following the jump table instead of
  449.           jumping to this label.  In that case, this label is not
  450.           actually used by the `casesi' instruction, but it is always
  451.           provided as an operand.)
  452.      The table is a `addr_vec' or `addr_diff_vec' inside of a
  453.      `jump_insn'.  The number of elements in the table is one plus the
  454.      difference between the upper bound and the lower bound.
  455. `tablejump'
  456.      Instruction to jump to a variable address.  This is a low-level
  457.      capability which can be used to implement a dispatch table when
  458.      there is no `casesi' pattern.
  459.      This pattern requires two operands: the address or offset, and a
  460.      label which should immediately precede the jump table.  If the
  461.      macro `CASE_VECTOR_PC_RELATIVE' is defined then the first operand
  462.      is an offset which counts from the address of the table;
  463.      otherwise, it is an absolute address to jump to.  In either case,
  464.      the first operand has mode `Pmode'.
  465.      The `tablejump' insn is always the last insn before the jump table
  466.      it uses.  Its assembler code normally has no need to use the
  467.      second operand, but you should incorporate it in the RTL pattern so
  468.      that the jump optimizer will not delete the table as unreachable
  469.      code.
  470. `save_stack_block'
  471. `save_stack_function'
  472. `save_stack_nonlocal'
  473. `restore_stack_block'
  474. `restore_stack_function'
  475. `restore_stack_nonlocal'
  476.      Most machines save and restore the stack pointer by copying it to
  477.      or from an object of mode `Pmode'.  Do not define these patterns on
  478.      such machines.
  479.      Some machines require special handling for stack pointer saves and
  480.      restores.  On those machines, define the patterns corresponding to
  481.      the non-standard cases by using a `define_expand' (*note Expander
  482.      Definitions::.) that produces the required insns.  The three types
  483.      of saves and restores are:
  484.        1. `save_stack_block' saves the stack pointer at the start of a
  485.           block that allocates a variable-sized object, and
  486.           `restore_stack_block' restores the stack pointer when the
  487.           block is exited.
  488.        2. `save_stack_function' and `restore_stack_function' do a
  489.           similar job for the outermost block of a function and are
  490.           used when the function allocates variable-sized objects or
  491.           calls `alloca'.  Only the epilogue uses the restored stack
  492.           pointer, allowing a simpler save or restore sequence on some
  493.           machines.
  494.        3. `save_stack_nonlocal' is used in functions that contain labels
  495.           branched to by nested functions.  It saves the stack pointer
  496.           in such a way that the inner function can use
  497.           `restore_stack_nonlocal' to restore the stack pointer.  The
  498.           compiler generates code to restore the frame and argument
  499.           pointer registers, but some machines require saving and
  500.           restoring additional data such as register window information
  501.           or stack backchains.  Place insns in these patterns to save
  502.           and restore any such required data.
  503.      When saving the stack pointer, operand 0 is the save area and
  504.      operand 1 is the stack pointer.  The mode used to allocate the
  505.      save area is the mode of operand 0.  You must specify an integral
  506.      mode, or `VOIDmode' if no save area is needed for a particular
  507.      type of save (either because no save is needed or because a
  508.      machine-specific save area can be used).  Operand 0 is the stack
  509.      pointer and operand 1 is the save area for restore operations.  If
  510.      `save_stack_block' is defined, operand 0 must not be `VOIDmode'
  511.      since these saves can be arbitrarily nested.
  512.      A save area is a `mem' that is at a constant offset from
  513.      `virtual_stack_vars_rtx' when the stack pointer is saved for use by
  514.      nonlocal gotos and a `reg' in the other two cases.
  515. `allocate_stack'
  516.      Subtract (or add if `STACK_GROWS_DOWNWARD' is undefined) operand 0
  517.      from the stack pointer to create space for dynamically allocated
  518.      data.
  519.      Do not define this pattern if all that must be done is the
  520.      subtraction.  Some machines require other operations such as stack
  521.      probes or maintaining the back chain.  Define this pattern to emit
  522.      those operations in addition to updating the stack pointer.
  523. File: gcc.info,  Node: Pattern Ordering,  Next: Dependent Patterns,  Prev: Standard Names,  Up: Machine Desc
  524. When the Order of Patterns Matters
  525. ==================================
  526.    Sometimes an insn can match more than one instruction pattern.  Then
  527. the pattern that appears first in the machine description is the one
  528. used.  Therefore, more specific patterns (patterns that will match
  529. fewer things) and faster instructions (those that will produce better
  530. code when they do match) should usually go first in the description.
  531.    In some cases the effect of ordering the patterns can be used to hide
  532. a pattern when it is not valid.  For example, the 68000 has an
  533. instruction for converting a fullword to floating point and another for
  534. converting a byte to floating point.  An instruction converting an
  535. integer to floating point could match either one.  We put the pattern
  536. to convert the fullword first to make sure that one will be used rather
  537. than the other.  (Otherwise a large integer might be generated as a
  538. single-byte immediate quantity, which would not work.) Instead of using
  539. this pattern ordering it would be possible to make the pattern for
  540. convert-a-byte smart enough to deal properly with any constant value.
  541. File: gcc.info,  Node: Dependent Patterns,  Next: Jump Patterns,  Prev: Pattern Ordering,  Up: Machine Desc
  542. Interdependence of Patterns
  543. ===========================
  544.    Every machine description must have a named pattern for each of the
  545. conditional branch names `bCOND'.  The recognition template must always
  546. have the form
  547.      (set (pc)
  548.           (if_then_else (COND (cc0) (const_int 0))
  549.                         (label_ref (match_operand 0 "" ""))
  550.                         (pc)))
  551. In addition, every machine description must have an anonymous pattern
  552. for each of the possible reverse-conditional branches.  Their templates
  553. look like
  554.      (set (pc)
  555.           (if_then_else (COND (cc0) (const_int 0))
  556.                         (pc)
  557.                         (label_ref (match_operand 0 "" ""))))
  558. They are necessary because jump optimization can turn direct-conditional
  559. branches into reverse-conditional branches.
  560.    It is often convenient to use the `match_operator' construct to
  561. reduce the number of patterns that must be specified for branches.  For
  562. example,
  563.      (define_insn ""
  564.        [(set (pc)
  565.              (if_then_else (match_operator 0 "comparison_operator"
  566.                                            [(cc0) (const_int 0)])
  567.                            (pc)
  568.                            (label_ref (match_operand 1 "" ""))))]
  569.        "CONDITION"
  570.        "...")
  571.    In some cases machines support instructions identical except for the
  572. machine mode of one or more operands.  For example, there may be
  573. "sign-extend halfword" and "sign-extend byte" instructions whose
  574. patterns are
  575.      (set (match_operand:SI 0 ...)
  576.           (extend:SI (match_operand:HI 1 ...)))
  577.      
  578.      (set (match_operand:SI 0 ...)
  579.           (extend:SI (match_operand:QI 1 ...)))
  580. Constant integers do not specify a machine mode, so an instruction to
  581. extend a constant value could match either pattern.  The pattern it
  582. actually will match is the one that appears first in the file.  For
  583. correct results, this must be the one for the widest possible mode
  584. (`HImode', here).  If the pattern matches the `QImode' instruction, the
  585. results will be incorrect if the constant value does not actually fit
  586. that mode.
  587.    Such instructions to extend constants are rarely generated because
  588. they are optimized away, but they do occasionally happen in nonoptimized
  589. compilations.
  590.    If a constraint in a pattern allows a constant, the reload pass may
  591. replace a register with a constant permitted by the constraint in some
  592. cases.  Similarly for memory references.  Because of this substitution,
  593. you should not provide separate patterns for increment and decrement
  594. instructions.  Instead, they should be generated from the same pattern
  595. that supports register-register add insns by examining the operands and
  596. generating the appropriate machine instruction.
  597. File: gcc.info,  Node: Jump Patterns,  Next: Insn Canonicalizations,  Prev: Dependent Patterns,  Up: Machine Desc
  598. Defining Jump Instruction Patterns
  599. ==================================
  600.    For most machines, GNU CC assumes that the machine has a condition
  601. code.  A comparison insn sets the condition code, recording the results
  602. of both signed and unsigned comparison of the given operands.  A
  603. separate branch insn tests the condition code and branches or not
  604. according its value.  The branch insns come in distinct signed and
  605. unsigned flavors.  Many common machines, such as the Vax, the 68000 and
  606. the 32000, work this way.
  607.    Some machines have distinct signed and unsigned compare
  608. instructions, and only one set of conditional branch instructions.  The
  609. easiest way to handle these machines is to treat them just like the
  610. others until the final stage where assembly code is written.  At this
  611. time, when outputting code for the compare instruction, peek ahead at
  612. the following branch using `next_cc0_user (insn)'.  (The variable
  613. `insn' refers to the insn being output, in the output-writing code in
  614. an instruction pattern.)  If the RTL says that is an unsigned branch,
  615. output an unsigned compare; otherwise output a signed compare.  When
  616. the branch itself is output, you can treat signed and unsigned branches
  617. identically.
  618.    The reason you can do this is that GNU CC always generates a pair of
  619. consecutive RTL insns, possibly separated by `note' insns, one to set
  620. the condition code and one to test it, and keeps the pair inviolate
  621. until the end.
  622.    To go with this technique, you must define the machine-description
  623. macro `NOTICE_UPDATE_CC' to do `CC_STATUS_INIT'; in other words, no
  624. compare instruction is superfluous.
  625.    Some machines have compare-and-branch instructions and no condition
  626. code.  A similar technique works for them.  When it is time to "output"
  627. a compare instruction, record its operands in two static variables.
  628. When outputting the branch-on-condition-code instruction that follows,
  629. actually output a compare-and-branch instruction that uses the
  630. remembered operands.
  631.    It also works to define patterns for compare-and-branch instructions.
  632. In optimizing compilation, the pair of compare and branch instructions
  633. will be combined according to these patterns.  But this does not happen
  634. if optimization is not requested.  So you must use one of the solutions
  635. above in addition to any special patterns you define.
  636.    In many RISC machines, most instructions do not affect the condition
  637. code and there may not even be a separate condition code register.  On
  638. these machines, the restriction that the definition and use of the
  639. condition code be adjacent insns is not necessary and can prevent
  640. important optimizations.  For example, on the IBM RS/6000, there is a
  641. delay for taken branches unless the condition code register is set three
  642. instructions earlier than the conditional branch.  The instruction
  643. scheduler cannot perform this optimization if it is not permitted to
  644. separate the definition and use of the condition code register.
  645.    On these machines, do not use `(cc0)', but instead use a register to
  646. represent the condition code.  If there is a specific condition code
  647. register in the machine, use a hard register.  If the condition code or
  648. comparison result can be placed in any general register, or if there are
  649. multiple condition registers, use a pseudo register.
  650.    On some machines, the type of branch instruction generated may
  651. depend on the way the condition code was produced; for example, on the
  652. 68k and Sparc, setting the condition code directly from an add or
  653. subtract instruction does not clear the overflow bit the way that a test
  654. instruction does, so a different branch instruction must be used for
  655. some conditional branches.  For machines that use `(cc0)', the set and
  656. use of the condition code must be adjacent (separated only by `note'
  657. insns) allowing flags in `cc_status' to be used.  (*Note Condition
  658. Code::.)  Also, the comparison and branch insns can be located from
  659. each other by using the functions `prev_cc0_setter' and `next_cc0_user'.
  660.    However, this is not true on machines that do not use `(cc0)'.  On
  661. those machines, no assumptions can be made about the adjacency of the
  662. compare and branch insns and the above methods cannot be used.  Instead,
  663. we use the machine mode of the condition code register to record
  664. different formats of the condition code register.
  665.    Registers used to store the condition code value should have a mode
  666. that is in class `MODE_CC'.  Normally, it will be `CCmode'.  If
  667. additional modes are required (as for the add example mentioned above in
  668. the Sparc), define the macro `EXTRA_CC_MODES' to list the additional
  669. modes required (*note Condition Code::.).  Also define `EXTRA_CC_NAMES'
  670. to list the names of those modes and `SELECT_CC_MODE' to choose a mode
  671. given an operand of a compare.
  672.    If it is known during RTL generation that a different mode will be
  673. required (for example, if the machine has separate compare instructions
  674. for signed and unsigned quantities, like most IBM processors), they can
  675. be specified at that time.
  676.    If the cases that require different modes would be made by
  677. instruction combination, the macro `SELECT_CC_MODE' determines which
  678. machine mode should be used for the comparison result.  The patterns
  679. should be written using that mode.  To support the case of the add on
  680. the Sparc discussed above, we have the pattern
  681.      (define_insn ""
  682.        [(set (reg:CC_NOOV 0)
  683.              (compare:CC_NOOV
  684.                (plus:SI (match_operand:SI 0 "register_operand" "%r")
  685.                         (match_operand:SI 1 "arith_operand" "rI"))
  686.                (const_int 0)))]
  687.        ""
  688.        "...")
  689.    The `SELECT_CC_MODE' macro on the Sparc returns `CC_NOOVmode' for
  690. comparisons whose argument is a `plus'.
  691. File: gcc.info,  Node: Insn Canonicalizations,  Next: Peephole Definitions,  Prev: Jump Patterns,  Up: Machine Desc
  692. Canonicalization of Instructions
  693. ================================
  694.    There are often cases where multiple RTL expressions could represent
  695. an operation performed by a single machine instruction.  This situation
  696. is most commonly encountered with logical, branch, and
  697. multiply-accumulate instructions.  In such cases, the compiler attempts
  698. to convert these multiple RTL expressions into a single canonical form
  699. to reduce the number of insn patterns required.
  700.    In addition to algebraic simplifications, following canonicalizations
  701. are performed:
  702.    * For commutative and comparison operators, a constant is always
  703.      made the second operand.  If a machine only supports a constant as
  704.      the second operand, only patterns that match a constant in the
  705.      second operand need be supplied.
  706.      For these operators, if only one operand is a `neg', `not',
  707.      `mult', `plus', or `minus' expression, it will be the first
  708.      operand.
  709.    * For the `compare' operator, a constant is always the second operand
  710.      on machines where `cc0' is used (*note Jump Patterns::.).  On other
  711.      machines, there are rare cases where the compiler might want to
  712.      construct a `compare' with a constant as the first operand.
  713.      However, these cases are not common enough for it to be worthwhile
  714.      to provide a pattern matching a constant as the first operand
  715.      unless the machine actually has such an instruction.
  716.      An operand of `neg', `not', `mult', `plus', or `minus' is made the
  717.      first operand under the same conditions as above.
  718.    * `(minus X (const_int N))' is converted to `(plus X (const_int
  719.      -N))'.
  720.    * Within address computations (i.e., inside `mem'), a left shift is
  721.      converted into the appropriate multiplication by a power of two.
  722.      De`Morgan's Law is used to move bitwise negation inside a bitwise
  723.      logical-and or logical-or operation.  If this results in only one
  724.      operand being a `not' expression, it will be the first one.
  725.      A machine that has an instruction that performs a bitwise
  726.      logical-and of one operand with the bitwise negation of the other
  727.      should specify the pattern for that instruction as
  728.           (define_insn ""
  729.             [(set (match_operand:M 0 ...)
  730.                   (and:M (not:M (match_operand:M 1 ...))
  731.                                (match_operand:M 2 ...)))]
  732.             "..."
  733.             "...")
  734.      Similarly, a pattern for a "NAND" instruction should be written
  735.           (define_insn ""
  736.             [(set (match_operand:M 0 ...)
  737.                   (ior:M (not:M (match_operand:M 1 ...))
  738.                                (not:M (match_operand:M 2 ...))))]
  739.             "..."
  740.             "...")
  741.      In both cases, it is not necessary to include patterns for the many
  742.      logically equivalent RTL expressions.
  743.    * The only possible RTL expressions involving both bitwise
  744.      exclusive-or and bitwise negation are `(xor:M X Y)' and `(not:M
  745.      (xor:M X Y))'.
  746.    * The sum of three items, one of which is a constant, will only
  747.      appear in the form
  748.           (plus:M (plus:M X Y) CONSTANT)
  749.    * On machines that do not use `cc0', `(compare X (const_int 0))'
  750.      will be converted to X.
  751.    * Equality comparisons of a group of bits (usually a single bit)
  752.      with zero will be written using `zero_extract' rather than the
  753.      equivalent `and' or `sign_extract' operations.
  754. File: gcc.info,  Node: Peephole Definitions,  Next: Expander Definitions,  Prev: Insn Canonicalizations,  Up: Machine Desc
  755. Machine-Specific Peephole Optimizers
  756. ====================================
  757.    In addition to instruction patterns the `md' file may contain
  758. definitions of machine-specific peephole optimizations.
  759.    The combiner does not notice certain peephole optimizations when the
  760. data flow in the program does not suggest that it should try them.  For
  761. example, sometimes two consecutive insns related in purpose can be
  762. combined even though the second one does not appear to use a register
  763. computed in the first one.  A machine-specific peephole optimizer can
  764. detect such opportunities.
  765.    A definition looks like this:
  766.      (define_peephole
  767.        [INSN-PATTERN-1
  768.         INSN-PATTERN-2
  769.         ...]
  770.        "CONDITION"
  771.        "TEMPLATE"
  772.        "OPTIONAL INSN-ATTRIBUTES")
  773. The last string operand may be omitted if you are not using any
  774. machine-specific information in this machine description.  If present,
  775. it must obey the same rules as in a `define_insn'.
  776.    In this skeleton, INSN-PATTERN-1 and so on are patterns to match
  777. consecutive insns.  The optimization applies to a sequence of insns when
  778. INSN-PATTERN-1 matches the first one, INSN-PATTERN-2 matches the next,
  779. and so on.
  780.    Each of the insns matched by a peephole must also match a
  781. `define_insn'.  Peepholes are checked only at the last stage just
  782. before code generation, and only optionally.  Therefore, any insn which
  783. would match a peephole but no `define_insn' will cause a crash in code
  784. generation in an unoptimized compilation, or at various optimization
  785. stages.
  786.    The operands of the insns are matched with `match_operands',
  787. `match_operator', and `match_dup', as usual.  What is not usual is that
  788. the operand numbers apply to all the insn patterns in the definition.
  789. So, you can check for identical operands in two insns by using
  790. `match_operand' in one insn and `match_dup' in the other.
  791.    The operand constraints used in `match_operand' patterns do not have
  792. any direct effect on the applicability of the peephole, but they will
  793. be validated afterward, so make sure your constraints are general enough
  794. to apply whenever the peephole matches.  If the peephole matches but
  795. the constraints are not satisfied, the compiler will crash.
  796.    It is safe to omit constraints in all the operands of the peephole;
  797. or you can write constraints which serve as a double-check on the
  798. criteria previously tested.
  799.    Once a sequence of insns matches the patterns, the CONDITION is
  800. checked.  This is a C expression which makes the final decision whether
  801. to perform the optimization (we do so if the expression is nonzero).  If
  802. CONDITION is omitted (in other words, the string is empty) then the
  803. optimization is applied to every sequence of insns that matches the
  804. patterns.
  805.    The defined peephole optimizations are applied after register
  806. allocation is complete.  Therefore, the peephole definition can check
  807. which operands have ended up in which kinds of registers, just by
  808. looking at the operands.
  809.    The way to refer to the operands in CONDITION is to write
  810. `operands[I]' for operand number I (as matched by `(match_operand I
  811. ...)').  Use the variable `insn' to refer to the last of the insns
  812. being matched; use `prev_active_insn' to find the preceding insns.
  813.    When optimizing computations with intermediate results, you can use
  814. CONDITION to match only when the intermediate results are not used
  815. elsewhere.  Use the C expression `dead_or_set_p (INSN, OP)', where INSN
  816. is the insn in which you expect the value to be used for the last time
  817. (from the value of `insn', together with use of `prev_nonnote_insn'),
  818. and OP is the intermediate value (from `operands[I]').
  819.    Applying the optimization means replacing the sequence of insns with
  820. one new insn.  The TEMPLATE controls ultimate output of assembler code
  821. for this combined insn.  It works exactly like the template of a
  822. `define_insn'.  Operand numbers in this template are the same ones used
  823. in matching the original sequence of insns.
  824.    The result of a defined peephole optimizer does not need to match
  825. any of the insn patterns in the machine description; it does not even
  826. have an opportunity to match them.  The peephole optimizer definition
  827. itself serves as the insn pattern to control how the insn is output.
  828.    Defined peephole optimizers are run as assembler code is being
  829. output, so the insns they produce are never combined or rearranged in
  830. any way.
  831.    Here is an example, taken from the 68000 machine description:
  832.      (define_peephole
  833.        [(set (reg:SI 15) (plus:SI (reg:SI 15) (const_int 4)))
  834.         (set (match_operand:DF 0 "register_operand" "=f")
  835.              (match_operand:DF 1 "register_operand" "ad"))]
  836.        "FP_REG_P (operands[0]) && ! FP_REG_P (operands[1])"
  837.        "*
  838.      {
  839.        rtx xoperands[2];
  840.        xoperands[1] = gen_rtx (REG, SImode, REGNO (operands[1]) + 1);
  841.      #ifdef MOTOROLA
  842.        output_asm_insn (\"move.l %1,(sp)\", xoperands);
  843.        output_asm_insn (\"move.l %1,-(sp)\", operands);
  844.        return \"fmove.d (sp)+,%0\";
  845.      #else
  846.        output_asm_insn (\"movel %1,sp@\", xoperands);
  847.        output_asm_insn (\"movel %1,sp@-\", operands);
  848.        return \"fmoved sp@+,%0\";
  849.      #endif
  850.      }
  851.      ")
  852.    The effect of this optimization is to change
  853.      jbsr _foobar
  854.      addql #4,sp
  855.      movel d1,sp@-
  856.      movel d0,sp@-
  857.      fmoved sp@+,fp0
  858.      jbsr _foobar
  859.      movel d1,sp@
  860.      movel d0,sp@-
  861.      fmoved sp@+,fp0
  862.    INSN-PATTERN-1 and so on look *almost* like the second operand of
  863. `define_insn'.  There is one important difference: the second operand
  864. of `define_insn' consists of one or more RTX's enclosed in square
  865. brackets.  Usually, there is only one: then the same action can be
  866. written as an element of a `define_peephole'.  But when there are
  867. multiple actions in a `define_insn', they are implicitly enclosed in a
  868. `parallel'.  Then you must explicitly write the `parallel', and the
  869. square brackets within it, in the `define_peephole'.  Thus, if an insn
  870. pattern looks like this,
  871.      (define_insn "divmodsi4"
  872.        [(set (match_operand:SI 0 "general_operand" "=d")
  873.              (div:SI (match_operand:SI 1 "general_operand" "0")
  874.                      (match_operand:SI 2 "general_operand" "dmsK")))
  875.         (set (match_operand:SI 3 "general_operand" "=d")
  876.              (mod:SI (match_dup 1) (match_dup 2)))]
  877.        "TARGET_68020"
  878.        "divsl%.l %2,%3:%0")
  879. then the way to mention this insn in a peephole is as follows:
  880.      (define_peephole
  881.        [...
  882.         (parallel
  883.          [(set (match_operand:SI 0 "general_operand" "=d")
  884.                (div:SI (match_operand:SI 1 "general_operand" "0")
  885.                        (match_operand:SI 2 "general_operand" "dmsK")))
  886.           (set (match_operand:SI 3 "general_operand" "=d")
  887.                (mod:SI (match_dup 1) (match_dup 2)))])
  888.         ...]
  889.        ...)
  890.