cln_mirror/src/float/dfloat/elem/cl_DF_plus.cc


								// binary operator +


								// General includes.

								#include "cl_sysdep.h"


								// Specification.

								#include "cln/dfloat.h"


								// Implementation.


								#include "cl_DF.h"

								#include "cl_F.h"

								#include "cl_xmacros.h"


								namespace cln {


								const cl_DF operator+ (const cl_DF& x1, const cl_DF& x2)

								{

								// Methode (nach [Knuth, II, Seminumerical Algorithms, Abschnitt 4.2.1., S.200]):

								// x1=0.0 -> Ergebnis x2.

								// x2=0.0 -> Ergebnis x1.

								// Falls e1<e2, vertausche x1 und x2.

								// Also e1 >= e2.

								// Falls e1 - e2 >= 52 + 3, Ergebnis x1.

								// Schiebe beide Mantissen um 3 Bits nach links (Vorbereitung der Rundung:

								//   Bei e1-e2=0,1 ist keine Rundung nötig, bei e1-e2>1 ist der Exponent des

								//   Ergebnisses =e1-1, =e1 oder =e1+1. Brauche daher 1 Schutzbit und zwei

								//   Rundungsbits: 00 exakt, 01 1.Hälfte, 10 exakte Mitte, 11 2.Hälfte.)

								// Schiebe die Mantisse von x2 um e0-e1 Bits nach rechts. (Dabei die Rundung

								// ausführen: Bit 0 ist das logische Oder der Bits 0,-1,-2,...)

								// Falls x1,x2 selbes Vorzeichen haben: Addiere dieses zur Mantisse von x1.

								// Falls x1,x2 verschiedenes Vorzeichen haben: Subtrahiere dieses von der

								//   Mantisse von x1. <0 -> (Es war e1=e2) Vertausche die Vorzeichen, negiere.

								//                    =0 -> Ergebnis 0.0

								// Exponent ist e1.

								// Normalisiere, fertig.

								#ifdef FAST_DOUBLE

								      double_to_DF(DF_to_double(x1) + DF_to_double(x2), return ,

								                   TRUE, TRUE, // Overflow und subnormale Zahl abfangen

								                   FALSE, // kein Underflow mit Ergebnis +/- 0.0 möglich

								                          // (nach Definition der subnormalen Zahlen)

								                   FALSE, FALSE // keine Singularität, kein NaN als Ergebnis möglich

								                  );

								#else

								#if (cl_word_size==64)

								      // x1,x2 entpacken:

								      var cl_signean sign1;

								      var sintL exp1;

								      var uint64 mant1;

								      var cl_signean sign2;

								      var sintL exp2;

								      var uint64 mant2;

								      DF_decode(x1, { return x2; }, sign1=,exp1=,mant1=);

								      DF_decode(x2, { return x1; }, sign2=,exp2=,mant2=);

								      var cl_DF max_x1_x2 = x1;

								      if (exp1 < exp2)

								        { max_x1_x2 = x2;

								          swap(cl_signean, sign1,sign2);

								          swap(sintL,      exp1 ,exp2 );

								          swap(uint64,     mant1,mant2);

								        }

								      // Nun ist exp1>=exp2.

								      var uintL expdiff = exp1 - exp2; // Exponentendifferenz

								      if (expdiff >= DF_mant_len+3) // >= 52+3 ?

								        { return max_x1_x2; }

								      mant1 = mant1 << 3; mant2 = mant2 << 3;

								      // Nun 2^(DF_mant_len+3) <= mant1,mant2 < 2^(DF_mant_len+4).

								      {var uint64 mant2_last = mant2 & (bit(expdiff)-1); // letzte expdiff Bits von mant2

								       mant2 = mant2 >> expdiff; if (!(mant2_last==0)) { mant2 |= bit(0); }

								      }

								      // mant2 = um expdiff Bits nach rechts geschobene und gerundete Mantisse

								      // von x2.

								      if (!(sign1==sign2))

								        // verschiedene Vorzeichen -> Mantissen subtrahieren

								        { if (mant1 > mant2) { mant1 = mant1 - mant2; goto norm_2; }

								          if (mant1 == mant2) // Ergebnis 0 ?

								            { return cl_DF_0; }

								          // negatives Subtraktionsergebnis

								          mant1 = mant2 - mant1; sign1 = sign2; goto norm_2;

								        }

								        else

								        // gleiche Vorzeichen -> Mantissen addieren

								        { mant1 = mant1 + mant2; }

								      // mant1 = Ergebnis-Mantisse >0, sign1 = Ergebnis-Vorzeichen,

								      // exp1 = Ergebnis-Exponent.

								      // Außerdem: Bei expdiff=0,1 sind die zwei letzten Bits von mant1 Null,

								      // bei expdiff>=2 ist mant1 >= 2^(DF_mant_len+2).

								      // Stets ist mant1 < 2^(DF_mant_len+5). (Daher werden die 2 Rundungsbits

								      // nachher um höchstens eine Position nach links geschoben werden.)

								      // [Knuth, S.201, leicht modifiziert:

								      //   N1. m>=1 -> goto N4.

								      //   N2. [Hier m<1] m>=1/2 -> goto N5.

								      //       N3. m:=2*m, e:=e-1, goto N2.

								      //   N4. [Hier 1<=m<2] m:=m/2, e:=e+1.

								      //   N5. [Hier 1/2<=m<1] Runde m auf 53 Bits hinterm Komma.

								      //       Falls hierdurch m=1 geworden, setze m:=m/2, e:=e+1.

								      // ]

								      // Bei uns ist m=mant1/2^(DF_mant_len+4),

								      // ab Schritt N5 ist m=mant1/2^(DF_mant_len+1).

								      norm_1: // [Knuth, S.201, Schritt N1]

								      if (mant1 >= bit(DF_mant_len+4)) goto norm_4;

								      norm_2: // [Knuth, S.201, Schritt N2]

								              // Hier ist mant1 < 2^(DF_mant_len+4)

								      if (mant1 >= bit(DF_mant_len+3)) goto norm_5;

								      // [Knuth, S.201, Schritt N3]

								      mant1 = mant1 << 1; exp1 = exp1-1; // Mantisse links schieben

								      goto norm_2;

								      norm_4: // [Knuth, S.201, Schritt N4]

								              // Hier ist 2^(DF_mant_len+4) <= mant1 < 2^(DF_mant_len+5)

								      exp1 = exp1+1;

								      mant1 = (mant1>>1) | (mant1 & bit(0)); // Mantisse rechts schieben

								      norm_5: // [Knuth, S.201, Schritt N5]

								              // Hier ist 2^(DF_mant_len+3) <= mant1 < 2^(DF_mant_len+4)

								      // Auf DF_mant_len echte Mantissenbits runden, d.h. rechte 3 Bits

								      // wegrunden, und dabei mant1 um 3 Bits nach rechts schieben:

								      {var uint64 rounding_bits = mant1 & (bit(3)-1);

								       mant1 = mant1 >> 3;

								       if ( (rounding_bits < bit(2)) // 000,001,010,011 werden abgerundet

								            || ( (rounding_bits == bit(2)) // 100 (genau halbzahlig)

								                 && ((mant1 & bit(0)) ==0) // -> round-to-even

								          )    )

								         // abrunden

								         {}

								         else

								         // aufrunden

								         { mant1 = mant1+1;

								           if (mant1 >= bit(DF_mant_len+1))

								             // Bei Überlauf während der Rundung nochmals rechts schieben

								             // (Runden ist hier überflüssig):

								             { mant1 = mant1>>1; exp1 = exp1+1; } // Mantisse rechts schieben

								         }

								      }// Runden fertig

								      return encode_DF(sign1,exp1,mant1);

								#else

								      // x1,x2 entpacken:

								      var cl_signean sign1;

								      var sintL exp1;

								      var uintL manthi1;

								      var uintL mantlo1;

								      var cl_signean sign2;

								      var sintL exp2;

								      var uintL manthi2;

								      var uintL mantlo2;

								      DF_decode2(x1, { return x2; }, sign1=,exp1=,manthi1=,mantlo1=);

								      DF_decode2(x2, { return x1; }, sign2=,exp2=,manthi2=,mantlo2=);

								      var cl_DF max_x1_x2 = x1;

								      if (exp1 < exp2)

								        { max_x1_x2 = x2;

								          swap(cl_signean, sign1,sign2);

								          swap(sintL,      exp1 ,exp2 );

								          swap(uintL,      manthi1,manthi2);

								          swap(uintL,      mantlo1,mantlo2);

								        }

								      // Nun ist exp1>=exp2.

								      var uintL expdiff = exp1 - exp2; // Exponentendifferenz

								      if (expdiff >= DF_mant_len+3) // >= 52+3 ?

								        { return max_x1_x2; }

								      manthi1 = (manthi1 << 3) | (mantlo1 >> (32-3)); mantlo1 = mantlo1 << 3;

								      manthi2 = (manthi2 << 3) | (mantlo2 >> (32-3)); mantlo2 = mantlo2 << 3;

								      // Nun 2^(DF_mant_len+3) <= mant1,mant2 < 2^(DF_mant_len+4).

								      if (expdiff<32)

								        {if (!(expdiff==0))

								           {var uintL mant2_last = mantlo2 & (bit(expdiff)-1); // letzte expdiff Bits von mant2

								            mantlo2 = (mantlo2 >> expdiff) | (manthi2 << (32-expdiff));

								            manthi2 = manthi2 >> expdiff;

								            if (!(mant2_last==0)) { mantlo2 |= bit(0); }

								        }  }

								        else

								        {var uintL mant2_last = (manthi2 & (bit(expdiff-32)-1)) | mantlo2; // letzte expdiff Bits von mant2

								         mantlo2 = manthi2 >> (expdiff-32); manthi2 = 0;

								         if (!(mant2_last==0)) { mantlo2 |= bit(0); }

								        }

								      // mant2 = um expdiff Bits nach rechts geschobene und gerundete Mantisse

								      // von x2.

								      if (!(sign1==sign2))

								        // verschiedene Vorzeichen -> Mantissen subtrahieren

								        { if (manthi1 > manthi2)

								            { manthi1 = manthi1 - manthi2;

								              if (mantlo1 < mantlo2) { manthi1 -= 1; }

								              mantlo1 = mantlo1 - mantlo2;

								              goto norm_2;

								            }

								          if (manthi1 == manthi2)

								            { if (mantlo1 > mantlo2)

								                { manthi1 = 0; mantlo1 = mantlo1 - mantlo2; goto norm_2; }

								              if (mantlo1 == mantlo2) // Ergebnis 0 ?

								                { return cl_DF_0; }

								            }

								          // Hier ((manthi1 < manthi2) || ((manthi1 == manthi2) && (mantlo1 < mantlo2))).

								          // negatives Subtraktionsergebnis

								          manthi1 = manthi2 - manthi1;

								          if (mantlo2 < mantlo1) { manthi1 -= 1; }

								          mantlo1 = mantlo2 - mantlo1;

								          sign1 = sign2;

								          goto norm_2;

								        }

								        else

								        // gleiche Vorzeichen -> Mantissen addieren

								        { manthi1 = manthi1 + manthi2;

								          if ((mantlo1 = mantlo1 + mantlo2) < mantlo2) { manthi1 += 1; }

								        }

								      // mant1 = Ergebnis-Mantisse >0, sign1 = Ergebnis-Vorzeichen,

								      // exp1 = Ergebnis-Exponent.

								      // Außerdem: Bei expdiff=0,1 sind die zwei letzten Bits von mant1 Null,

								      // bei expdiff>=2 ist mant1 >= 2^(DF_mant_len+2).

								      // Stets ist mant1 < 2^(DF_mant_len+5). (Daher werden die 2 Rundungsbits

								      // nachher um höchstens eine Position nach links geschoben werden.)

								      // [Knuth, S.201, leicht modifiziert:

								      //   N1. m>=1 -> goto N4.

								      //   N2. [Hier m<1] m>=1/2 -> goto N5.

								      //       N3. m:=2*m, e:=e-1, goto N2.

								      //   N4. [Hier 1<=m<2] m:=m/2, e:=e+1.

								      //   N5. [Hier 1/2<=m<1] Runde m auf 53 Bits hinterm Komma.

								      //       Falls hierdurch m=1 geworden, setze m:=m/2, e:=e+1.

								      // ]

								      // Bei uns ist m=mant1/2^(DF_mant_len+4),

								      // ab Schritt N5 ist m=mant1/2^(DF_mant_len+1).

								      norm_1: // [Knuth, S.201, Schritt N1]

								      if (manthi1 >= bit(DF_mant_len-32+4)) goto norm_4;

								      norm_2: // [Knuth, S.201, Schritt N2]

								              // Hier ist mant1 < 2^(DF_mant_len+4)

								      if (manthi1 >= bit(DF_mant_len-32+3)) goto norm_5;

								      // [Knuth, S.201, Schritt N3]

								      manthi1 = (manthi1 << 1) | (mantlo1 >> 31); // Mantisse links schieben

								      mantlo1 = mantlo1 << 1;

								      exp1 = exp1-1;

								      goto norm_2;

								      norm_4: // [Knuth, S.201, Schritt N4]

								              // Hier ist 2^(DF_mant_len+4) <= mant1 < 2^(DF_mant_len+5)

								      exp1 = exp1+1;

								      mantlo1 = (mantlo1 >> 1) | (manthi1 << 31) | (mantlo1 & bit(0)); // Mantisse rechts schieben

								      manthi1 = (manthi1 >> 1);

								      norm_5: // [Knuth, S.201, Schritt N5]

								              // Hier ist 2^(DF_mant_len+3) <= mant1 < 2^(DF_mant_len+4)

								      // Auf DF_mant_len echte Mantissenbits runden, d.h. rechte 3 Bits

								      // wegrunden, und dabei mant1 um 3 Bits nach rechts schieben:

								      {var uintL rounding_bits = mantlo1 & (bit(3)-1);

								       mantlo1 = (mantlo1 >> 3) | (manthi1 << (32-3)); manthi1 = manthi1 >> 3;

								       if ( (rounding_bits < bit(2)) // 000,001,010,011 werden abgerundet

								            || ( (rounding_bits == bit(2)) // 100 (genau halbzahlig)

								                 && ((mantlo1 & bit(0)) ==0) // -> round-to-even

								          )    )

								         // abrunden

								         {}

								         else

								         // aufrunden

								         { mantlo1 = mantlo1+1;

								           if (mantlo1==0)

								             { manthi1 = manthi1+1;

								               if (manthi1 >= bit(DF_mant_len-32+1))

								                 // Bei Überlauf während der Rundung nochmals rechts schieben

								                 // (Runden ist hier überflüssig):

								                 { manthi1 = manthi1>>1; exp1 = exp1+1; } // Mantisse rechts schieben

								         }   }

								      }// Runden fertig

								      return encode_DF(sign1,exp1,manthi1,mantlo1);

								#endif

								#endif

								}


								}  // namespace cln