Gå til innhold

Optimalisere 4D lookup table


Anbefalte innlegg

Jeg har laget en rimelig simpel løsning (for min del) for en lookuptable klasse for inntil 4 variabler (float/double).. I den forbindelse lurer jeg på om noen har innspill om det er noen ting her som lønner seg å optimalisere ? Jeg har vurdert å lære meg å bruke SSE2 intrinsics, er dette noe jeg kan dra nytte av her?

/*
    X = input 1 (number of results / table size)
    Y = input 2 (number of LUT's)
    Z = input 3 (number of 2D LUT's)
    W = input 4 (number of 3D LUT's)
*/

template <int X, typename T=double>
class LookUpTable
{
public:
    LookUpTable()
    {
        for (int i=0; i<X; i++)
        {
            val[i] = 2.0;
        }
        imax = X-1;
    }
    
    void setup(T xMax, T xMin)
    {
        mX = (T) X*1.0 / (xMax - xMin);
        limH = xMax;
        limL = xMin;
        
        cLimH = xMax;
        cLimL = xMin;
    }
    
    T *getTable() { return val; }
    
    inline void setX(uint &x, T &value)
    {
        val[x] = value;
    }
    
    inline const T get(T &x_val)
    {
// Sjekk at vi ikke overstiger øvre/nedre grense
        if (x_val >= (limH)) x_val = limH;
        else if (x_val <= limL) x_val = limL;
        
        const T x0 = (limH - x_val) * mX;
        const uint row = (uint) x0;
        const T x = x0 - (T) row;
        const T y0 = val[row] * (1.0-x);
        const T y1 = val[row+1] * x;
        return y0+y1;
    }
    
    
private:
    uint imax;
    T mX, limH, limL, cLimH, cLimL;
    T val[X];
};


template <int X=0, int Y=0, typename T=double>
class LookUpTable2D
{
public:
    LookUpTable2D()
    {

    }
    
    void setup(T xMax, T xMin, T yMax, T yMin)
    {
        mY = (T) Y / (yMax - yMin);
        limH = yMax;
        limL = yMin;
        
        for (int i=0; i<Y; i++)
        {
            lut[i].setup(xMax, xMin);
        }
    }
    
    inline void setXY(uint &x, uint &y, T &value)
    {
        lut[y].setX(x, value);
    }
    
    inline const T get(T &x_val, T &y_val)
    {
        if (y_val >= limH) y_val = limH;
        else if (y_val <= limL) y_val = limL;
        
        const T x0 = (limH - y_val) * mY;
        const uint row = (uint) x0;
        const T x = x0 - (double) row;
        const T y0 = lut[row].get(x_val) * (1.0-x);
        const T y1 = lut[row+1].get(x_val) * x;
        return y0+y1;
    }
    
private:
    T mY, limH, limL;
    
    LookUpTable<X, T> lut[Y];
};


template <int X, int Y=0, int Z=0, typename T=double>
class LookUpTable3D
{
public:
    
    LookUpTable3D()
    {

    }
    
    void setup(T xMax, T xMin, T yMax, T yMin, T zMax, T zMin)
    {
        mZ = (T) Z / (zMax - zMin);
        limH = zMax;
        limL = zMin;
        
        for (int i=0; i<Z; i++)
        {
            lut2D[i].setup(xMax, xMin, yMax, yMin);
        }
    }
    
    
    inline void setXYZ(uint &x, uint &y, uint &z, T &value)
    {
        lut2D[z].setXY(x, y, value);
    }
    
    inline const T get(T &x_val, T &y_val, T &z_val)
    {
        if (z_val >= limH) z_val = limH;
        else if (z_val <= limL) z_val = limL;
        
        const T x0 = (limH - z_val) * mZ;
        const uint row = x0;
        const T x = x0 - (T) row;
        const T y0 = lut2D[row].get(x_val, y_val) * (1.0-x);
        const T y1 = lut2D[row+1].get(x_val, y_val) * x;
        return y0+y1;
    }
    
    
private:
    T mZ;
    T limH, limL;
    
    LookUpTable2D<X, Y, T> lut2D[Z];
};


template <int X, int Y=0, int Z=0, int W=0, typename T=double>
class LookUpTable4D
{
public:
    LookUpTable4D()
    {
        
    }
    
    void setup(T xMax, T xMin, T yMax, T yMin, T zMax, T zMin, T wMax, T wMin)
    {
        mW = (T) W / (wMax - wMin);
        limH = wMax;
        limL = wMin;
        
        for (int i=0; i<W; i++)
        {
            lut3D[i].setup(xMax, xMin, yMax, yMin, zMax, zMin);
        }
    }
    
    inline void setXYZW(uint &x, uint &y, uint &z, uint &w, T value)
    {
        lut3D[w].setXYZ(x, y, z, value);
    }
    
    inline const T get(T &x_val, T &y_val, T &z_val, T &w_val)
    {
        if (w_val >= limH) w_val = limH;
        else if (w_val <= limL) w_val = limL;
        
        const T x0 = (limH - w_val) * mW;
        const uint row = x0;
        const T x = x0 - (T) row;
        const T y0 = lut3D[row].get(x_val, y_val, z_val) * (1.0-x);
        const T y1 = lut3D[row+1].get(x_val, y_val, z_val) * x;
        return y0+y1;
    }
    
    
private:
    T mW;
    T limH, limL;
    
    LookUpTable3D<X, Y, Z, T> lut3D[W];
};



using namespace std;

int main(int argc, const char * argv[])
{
// Størrelse = X*Y*Z*W
    const uint X = 60;
    const uint Y = 20;
    const uint Z = 20;
    const uint W = 20;
    
    LookUpTable4D<X, Y, Z, W, float> lut4D;

    double xmin = -10.0;
    double xmax = 10.25;
    double x_step = (xmax - xmin) / (double) X;
    
    double ymin = -10.0;
    double ymax = 10.14;
    double y_step = (ymax - ymin) / (double) Y;
    
    double zmin = -10.0;
    double zmax = 10.25;
    double z_step = (zmax - zmin) / (double) Z;
    
    double wmin = -10.0;
    double wmax = 10.0;
    double w_step = (wmax - wmin) / (double) W;
    
    double x = xmax;
    double y = ymax;
    double z = zmax;
    double w = wmax;
    
    lut4D.setup(xmax, xmin, ymax, ymin, zmax, zmin, wmax, wmin);
    
    uint i, j, k, l;
   
// Fyll opp med test-verdier
    for (i=0; i<W; i++)
    {
        z = zmax;
        for (j=0; j<Z; j++)
        {
            y = ymax;

            for (k=0; k<Y; k++)
            {
                x = xmax;
                for (l=0; l<X; l++)
                {
                    float val = x/2.0+y*3.0+z-1.0+w*w;
                    lut4D.setXYZW(l, k, j, i, val);
                    // X decrement
                    x -= x_step;
                }
                // Y decrement
                y -= y_step;
            }
            // Z decrement
            z -= z_step;
        }
        // W decrement
        w -= w_step;
    }
    
    x = 3.3;
    y = 5.5;
    z = 1.562;
    w = 3.45;
    
    cout.precision(12);
    cout << x/2.0+y*3.0+z-1.0+w*w << endl;
    
    float a = x;
    float b = y;
    float c = z;
    float d = w;
    
    float tmp = lut4D.get(a, b, c, d);
    cout << tmp << endl;

    return 0;
}


Beklager litt rotete kode, og burde kanskje kalle det LookupTable i stedet for LookUpTable :p

Endret av onqel
Lenke til kommentar
  • 2 uker senere...
Videoannonse
Annonse

Det kommer an på

  • Forventet peak størrelse på tabell
  • Hvor ofte skal den brukes (hyppighet)
  • Hva slags data og størrelse på data

Det er meget komplekst å vurdere oppslagstabeller, det er ikke bare å sette den opp og så forvente gevinst. Som sagt, det er en meget kompleks ting å analysere.

Lenke til kommentar

Start med å lage noe som bruker klassen din, helst på en realistisk måte. Deretter profilerer du koden, og finner ut av hva som skaper flaskehalser. Noe av det værste en gjør er å optimalisere før en har data å jobbe etter.

 

Sse instruksjoner kan være en vei å gå her, men husk at kompilatoren forsøker å benytte seg av det der det er mulig. Ved å hoppe rett til sse instruksjoner kan du faktisk ende opp med mindre optimal kode enn uten, da det kan være instruksjoner som gjør det samme i færre sykler enn de du bruker. Derfor er det også viktig å profilere både før og etter, for å se om kompilatoren er smartere enn deg (du vil bli overrasket over hvor ofte dette er tilfellet).

 

F. Eks. For Intel sin kompilator er det dokumentert hvilke patterns som blir gjort om til sse/avx instruksjoner, hvis du virkelig vil lære deg optimalisering av kode vil jeg anbefale deg å se på det, samt Intel sin kompilator. Sse/avx instruksjoner er vanskelige å lese, men ved å følge slike patterns vil du kunne skrive pen, optimal kode. Som også vil bli kompilert til enda raskere kode når de kommer med nytt instruksjonssett.

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...