source: 3DVCSoftware/branches/0.2-poznan-univ/source/Lib/TLibCommon/TComPrediction.cpp

Last change on this file was 12, checked in by poznan-univ, 13 years ago

Poznan Tools

  • Depth base motion vector prediction
  • Property svn:eol-style set to native
File size: 120.1 KB
Line 
1/* The copyright in this software is being made available under the BSD
2 * License, included below. This software may be subject to other third party
3 * and contributor rights, including patent rights, and no such rights are
4 * granted under this license.
5 *
6 * Copyright (c) 2010-2011, ISO/IEC
7 * All rights reserved.
8 *
9 * Redistribution and use in source and binary forms, with or without
10 * modification, are permitted provided that the following conditions are met:
11 *
12 *  * Redistributions of source code must retain the above copyright notice,
13 *    this list of conditions and the following disclaimer.
14 *  * Redistributions in binary form must reproduce the above copyright notice,
15 *    this list of conditions and the following disclaimer in the documentation
16 *    and/or other materials provided with the distribution.
17 *  * Neither the name of the ISO/IEC nor the names of its contributors may
18 *    be used to endorse or promote products derived from this software without
19 *    specific prior written permission.
20 *
21 * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
22 * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
23 * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
24 * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS
25 * BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
26 * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
27 * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
28 * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
29 * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
30 * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF
31 * THE POSSIBILITY OF SUCH DAMAGE.
32 */
33
34
35
36/** \file     TComPrediction.cpp
37    \brief    prediction class
38*/
39
40#include <memory.h>
41#include "TComPrediction.h"
42
43// ====================================================================================================================
44// Constructor / destructor / initialize
45// ====================================================================================================================
46
47TComPrediction::TComPrediction()
48: m_pLumaRecBuffer(0)
49{
50  m_piYuvExt = NULL;
51}
52
53TComPrediction::~TComPrediction()
54{
55  m_cYuvExt.destroy();
56
57  delete[] m_piYuvExt;
58
59  m_acYuvPred[0].destroy();
60  m_acYuvPred[1].destroy();
61
62  m_cYuvPredTemp.destroy();
63
64#if LM_CHROMA 
65  if( m_pLumaRecBuffer )
66    delete [] m_pLumaRecBuffer; 
67#endif
68}
69
70Void TComPrediction::initTempBuff()
71{
72  if( m_piYuvExt == NULL )
73  {
74    m_iYuvExtHeight  = ((g_uiMaxCUHeight + 2) << 4);
75    m_iYuvExtStride = ((g_uiMaxCUWidth  + 8) << 4);
76    m_cYuvExt.create( m_iYuvExtStride, m_iYuvExtHeight );
77    m_piYuvExt = new Int[ m_iYuvExtStride * m_iYuvExtHeight ];
78
79    // new structure
80    m_acYuvPred[0] .create( g_uiMaxCUWidth, g_uiMaxCUHeight );
81    m_acYuvPred[1] .create( g_uiMaxCUWidth, g_uiMaxCUHeight );
82
83    m_cYuvPredTemp.create( g_uiMaxCUWidth, g_uiMaxCUHeight );
84  }
85
86#if LM_CHROMA                     
87  m_iLumaRecStride =  (g_uiMaxCUWidth>>1) + 1;
88  m_pLumaRecBuffer = new Pel[ m_iLumaRecStride * m_iLumaRecStride ];
89
90  for( Int i = 1; i < 66; i++ )
91    m_uiaShift[i-1] = ( (1 << 15) + i/2 ) / i;
92#endif
93}
94
95// ====================================================================================================================
96// Public member functions
97// ====================================================================================================================
98
99// Function for calculating DC value of the reference samples used in Intra prediction
100Pel TComPrediction::predIntraGetPredValDC( Int* pSrc, Int iSrcStride, UInt iWidth, UInt iHeight, Bool bAbove, Bool bLeft )
101{
102  Int iInd, iSum = 0;
103  Pel pDcVal;
104
105  if (bAbove)
106  {
107    for (iInd = 0;iInd < iWidth;iInd++)
108      iSum += pSrc[iInd-iSrcStride];
109  }
110  if (bLeft)
111  {
112    for (iInd = 0;iInd < iHeight;iInd++)
113      iSum += pSrc[iInd*iSrcStride-1];
114  }
115
116  if (bAbove && bLeft)
117    pDcVal = (iSum + iWidth) / (iWidth + iHeight);
118  else if (bAbove)
119    pDcVal = (iSum + iWidth/2) / iWidth;
120  else if (bLeft)
121    pDcVal = (iSum + iHeight/2) / iHeight;
122  else
123    pDcVal = pSrc[-1]; // Default DC value already calculated and placed in the prediction array if no neighbors are available
124
125  return pDcVal;
126}
127
128// Function for deriving the angular Intra predictions
129
130/** Function for deriving the simplified angular intra predictions.
131 * \param pSrc pointer to reconstructed sample array
132 * \param srcStride the stride of the reconstructed sample array
133 * \param rpDst reference to pointer for the prediction sample array
134 * \param dstStride the stride of the prediction sample array
135 * \param width the width of the block
136 * \param height the height of the block
137 * \param dirMode the intra prediction mode index
138 * \param blkAboveAvailable boolean indication if the block above is available
139 * \param blkLeftAvailable boolean indication if the block to the left is available
140 *
141 * This function derives the prediction samples for the angular mode based on the prediction direction indicated by
142 * the prediction mode index. The prediction direction is given by the displacement of the bottom row of the block and
143 * the reference row above the block in the case of vertical prediction or displacement of the rightmost column
144 * of the block and reference column left from the block in the case of the horizontal prediction. The displacement
145 * is signalled at 1/32 pixel accuracy. When projection of the predicted pixel falls inbetween reference samples,
146 * the predicted value for the pixel is linearly interpolated from the reference samples. All reference samples are taken
147 * from the extended main reference.
148 */
149Void TComPrediction::xPredIntraAng( Int* pSrc, Int srcStride, Pel*& rpDst, Int dstStride, UInt width, UInt height, UInt dirMode, Bool blkAboveAvailable, Bool blkLeftAvailable )
150{
151  Int k,l;
152  Int blkSize        = width;
153  Pel* pDst          = rpDst;
154
155  // Map the mode index to main prediction direction and angle
156  Bool modeDC        = dirMode == 0;
157  Bool modeVer       = !modeDC && (dirMode < 18);
158  Bool modeHor       = !modeDC && !modeVer;
159  Int intraPredAngle = modeVer ? dirMode - 9 : modeHor ? dirMode - 25 : 0;
160  Int absAng         = abs(intraPredAngle);
161  Int signAng        = intraPredAngle < 0 ? -1 : 1;
162
163  // Set bitshifts and scale the angle parameter to block size
164  Int angTable[9]    = {0,    2,    5,   9,  13,  17,  21,  26,  32};
165  Int invAngTable[9] = {0, 4096, 1638, 910, 630, 482, 390, 315, 256}; // (256 * 32) / Angle
166  Int invAngle       = invAngTable[absAng];
167  absAng             = angTable[absAng];
168  intraPredAngle     = signAng * absAng;
169
170  // Do the DC prediction
171  if (modeDC)
172  {
173    Pel dcval = predIntraGetPredValDC(pSrc, srcStride, width, height, blkAboveAvailable, blkLeftAvailable);
174
175    for (k=0;k<blkSize;k++)
176    {
177      for (l=0;l<blkSize;l++)
178      {
179        pDst[k*dstStride+l] = dcval;
180      }
181    }
182  }
183
184  // Do angular predictions
185  else
186  {
187    Pel* refMain;
188    Pel* refSide;
189    Pel  refAbove[2*MAX_CU_SIZE+1];
190    Pel  refLeft[2*MAX_CU_SIZE+1];
191
192    // Initialise the Main and Left reference array.
193    if (intraPredAngle < 0)
194    {
195      for (k=0;k<blkSize+1;k++)
196      {
197        refAbove[k+blkSize-1] = pSrc[k-srcStride-1];
198      }
199      for (k=0;k<blkSize+1;k++)
200      {
201        refLeft[k+blkSize-1] = pSrc[(k-1)*srcStride-1];
202      }
203      refMain = (modeVer ? refAbove : refLeft) + (blkSize-1);
204      refSide = (modeVer ? refLeft : refAbove) + (blkSize-1);
205
206      // Extend the Main reference to the left.
207      Int invAngleSum    = 128;       // rounding for (shift by 8)
208      for (k=-1; k>blkSize*intraPredAngle>>5; k--)
209      {
210        invAngleSum += invAngle;
211        refMain[k] = refSide[invAngleSum>>8];
212      }
213    }
214    else
215    {
216      for (k=0;k<2*blkSize+1;k++)
217      {
218        refAbove[k] = pSrc[k-srcStride-1];
219      }
220      for (k=0;k<2*blkSize+1;k++)
221      {
222        refLeft[k] = pSrc[(k-1)*srcStride-1];
223      }
224      refMain = modeVer ? refAbove : refLeft;
225    }
226
227    if (intraPredAngle == 0)
228    {
229      for (k=0;k<blkSize;k++)
230      {
231        for (l=0;l<blkSize;l++)
232        {
233          pDst[k*dstStride+l] = refMain[l+1];
234        }
235      }
236    }
237    else
238    {
239      Int deltaPos=0;
240      Int deltaInt;
241      Int deltaFract;
242      Int refMainIndex;
243
244      for (k=0;k<blkSize;k++)
245      {
246        deltaPos += intraPredAngle;
247        deltaInt   = deltaPos >> 5;
248        deltaFract = deltaPos & (32 - 1);
249
250        if (deltaFract)
251        {
252          // Do linear filtering
253          for (l=0;l<blkSize;l++)
254          {
255            refMainIndex        = l+deltaInt+1;
256            pDst[k*dstStride+l] = (Pel) ( ((32-deltaFract)*refMain[refMainIndex]+deltaFract*refMain[refMainIndex+1]+16) >> 5 );
257          }
258        }
259        else
260        {
261          // Just copy the integer samples
262          for (l=0;l<blkSize;l++)
263          {
264            pDst[k*dstStride+l] = refMain[l+deltaInt+1];
265          }
266        }
267      }
268    }
269
270    // Flip the block if this is the horizontal mode
271    if (modeHor)
272    {
273      Pel  tmp;
274      for (k=0;k<blkSize-1;k++)
275      {
276        for (l=k+1;l<blkSize;l++)
277        {
278          tmp                 = pDst[k*dstStride+l];
279          pDst[k*dstStride+l] = pDst[l*dstStride+k];
280          pDst[l*dstStride+k] = tmp;
281        }
282      }
283    }
284  }
285}
286
287Void TComPrediction::predIntraLumaAng(TComPattern* pcTComPattern, UInt uiDirMode, Pel* piPred, UInt uiStride, Int iWidth, Int iHeight,  TComDataCU* pcCU, Bool bAbove, Bool bLeft )
288{
289  Pel *pDst = piPred;
290  Int *ptrSrc;
291
292  // only assign variable in debug mode
293#ifndef NDEBUG
294  // get intra direction
295  Int iIntraSizeIdx = g_aucConvertToBit[ iWidth ] + 1;
296
297  assert( iIntraSizeIdx >= 1 ); //   4x  4
298  assert( iIntraSizeIdx <= 6 ); // 128x128
299  assert( iWidth == iHeight  );
300#endif //NDEBUG
301
302#if QC_MDIS
303  ptrSrc = pcTComPattern->getPredictorPtr( uiDirMode, g_aucConvertToBit[ iWidth ] + 1, iWidth, iHeight, m_piYuvExt );
304#else
305  ptrSrc = pcTComPattern->getAdiOrgBuf( iWidth, iHeight, m_piYuvExt );
306#endif //QC_MDIS
307
308  // get starting pixel in block
309  Int sw = ( iWidth<<1 ) + 1;
310
311#if ADD_PLANAR_MODE
312  if ( uiDirMode == PLANAR_IDX )
313  {
314#if REFERENCE_SAMPLE_PADDING
315    xPredIntraPlanar( ptrSrc+sw+1, sw, pDst, uiStride, iWidth, iHeight );
316#else
317    xPredIntraPlanar( ptrSrc+sw+1, sw, pDst, uiStride, iWidth, iHeight, bAbove, bLeft );
318#endif
319    return;
320  }
321#endif
322
323  // get converted direction
324  uiDirMode = g_aucAngIntraModeOrder[ uiDirMode ];
325
326  // Create the prediction
327  xPredIntraAng( ptrSrc+sw+1, sw, pDst, uiStride, iWidth, iHeight, uiDirMode, bAbove,  bLeft );
328
329#if MN_DC_PRED_FILTER
330  if ((uiDirMode == 0) && pcTComPattern->getDCPredFilterFlag())
331    xDCPredFiltering( ptrSrc+sw+1, sw, pDst, uiStride, iWidth, iHeight);
332#endif
333}
334
335
336Void
337TComPrediction::predIntraDepthAng(TComPattern* pcTComPattern, UInt uiDirMode, Pel* piPred, UInt uiStride, Int iWidth, Int iHeight )
338{
339  Pel*  pDst    = piPred;
340  Int*  ptrSrc  = pcTComPattern->getAdiOrgBuf( iWidth, iHeight, m_piYuvExt );
341  Int   sw      = ( iWidth<<1 ) + 1;
342  uiDirMode     = g_aucAngIntraModeOrder[ uiDirMode ];
343  xPredIntraAngDepth( ptrSrc+sw+1, sw, pDst, uiStride, iWidth, iHeight, uiDirMode );
344}
345
346Int
347TComPrediction::xGetDCDepth( Int* pSrc, Int iDelta, Int iBlkSize )
348{
349  Int iDC    = PDM_UNDEFINED_DEPTH;
350  Int iSum   = 0;
351  Int iNum   = 0;
352  for( Int k = 0; k < iBlkSize; k++, pSrc += iDelta )
353  {
354    if( *pSrc != PDM_UNDEFINED_DEPTH )
355    {
356      iSum += *pSrc;
357      iNum ++;
358    }
359  }
360  if( iNum )
361  {
362    iDC = ( iSum + ( iNum >> 1 ) ) / iNum;
363  }
364  return iDC;
365}
366
367Int
368TComPrediction::xGetDCValDepth( Int iVal1, Int iVal2, Int iVal3, Int iVal4 )
369{
370  if     ( iVal1 != PDM_UNDEFINED_DEPTH )   return iVal1;
371  else if( iVal2 != PDM_UNDEFINED_DEPTH )   return iVal2;
372  else if( iVal3 != PDM_UNDEFINED_DEPTH )   return iVal3;
373  return   iVal4;
374}
375
376Void
377TComPrediction::xPredIntraAngDepth( Int* pSrc, Int srcStride, Pel* pDst, Int dstStride, UInt width, UInt height, UInt dirMode )
378{
379  AOF( width == height );
380  Int blkSize       = width;
381  Int iDCAbove      = xGetDCDepth( pSrc - srcStride,                               1, blkSize );
382  Int iDCAboveRight = xGetDCDepth( pSrc - srcStride + blkSize,                     1, blkSize );
383  Int iDCLeft       = xGetDCDepth( pSrc -         1,                       srcStride, blkSize );
384  Int iDCBelowLeft  = xGetDCDepth( pSrc -         1 + blkSize * srcStride, srcStride, blkSize );
385  Int iWgt, iDC1, iDC2;
386  if( dirMode == 0 ) // 0
387  {
388    iDC1  = xGetDCValDepth( iDCAbove, iDCAboveRight, iDCLeft,  iDCBelowLeft  );
389    iDC2  = xGetDCValDepth( iDCLeft,  iDCBelowLeft,  iDCAbove, iDCAboveRight );
390    iWgt  = 8;
391  }
392  else if( dirMode < 10 ) // 1..9
393  {
394    iDC1  = xGetDCValDepth( iDCAbove, iDCAboveRight, iDCLeft,  iDCBelowLeft  );
395    iDC2  = xGetDCValDepth( iDCLeft,  iDCBelowLeft,  iDCAbove, iDCAboveRight );
396    iWgt  = 7 + dirMode;
397  }
398  else if( dirMode < 18 ) // 10..17
399  {
400    iDC1  = xGetDCValDepth( iDCAbove, iDCAboveRight, iDCLeft,  iDCBelowLeft  );
401    iDC2  = xGetDCValDepth( iDCAboveRight, iDCAbove, iDCLeft,  iDCBelowLeft  );
402    iWgt  = 25 - dirMode;
403  }
404  else if( dirMode < 26 ) // 18..25
405  {
406    iDC1  = xGetDCValDepth( iDCAbove, iDCAboveRight, iDCLeft,  iDCBelowLeft  );
407    iDC2  = xGetDCValDepth( iDCLeft,  iDCBelowLeft,  iDCAbove, iDCAboveRight );
408    iWgt  = 25 - dirMode;
409  }
410  else if( dirMode < 34 )  // 26..33
411  {
412    iDC1  = xGetDCValDepth( iDCLeft,  iDCBelowLeft,  iDCAbove, iDCAboveRight );
413    iDC2  = xGetDCValDepth( iDCBelowLeft,  iDCLeft,  iDCAbove, iDCAboveRight );
414    iWgt  = 41 - dirMode;
415  }
416  else // 34 (wedgelet -> use simple DC prediction
417  {
418    iDC1  = xGetDCValDepth( iDCAbove, iDCAboveRight, iDCLeft,  iDCBelowLeft  );
419    iDC2  = xGetDCValDepth( iDCLeft,  iDCBelowLeft,  iDCAbove, iDCAboveRight );
420    iWgt  = 8;
421  }
422  Int iWgt2   = 16 - iWgt;
423  Int iDCVal  = ( iWgt * iDC1 + iWgt2 * iDC2 + 8 ) >> 4;
424 
425  // set depth
426  for( Int iY = 0; iY < blkSize; iY++, pDst += dstStride )
427  {
428    for( Int iX = 0; iX < blkSize; iX++ )
429    {
430      pDst[ iX ] = iDCVal;
431    }
432  }
433}
434
435
436// Angular chroma
437Void TComPrediction::predIntraChromaAng( TComPattern* pcTComPattern, Int* piSrc, UInt uiDirMode, Pel* piPred, UInt uiStride, Int iWidth, Int iHeight, TComDataCU* pcCU, Bool bAbove, Bool bLeft )
438{
439  Pel *pDst = piPred;
440  Int *ptrSrc = piSrc;
441
442  // get starting pixel in block
443  Int sw = ( iWidth<<1 ) + 1;
444
445#if ADD_PLANAR_MODE
446  if ( uiDirMode == PLANAR_IDX )
447  {
448#if REFERENCE_SAMPLE_PADDING
449    xPredIntraPlanar( ptrSrc+sw+1, sw, pDst, uiStride, iWidth, iHeight );
450#else
451    xPredIntraPlanar( ptrSrc+sw+1, sw, pDst, uiStride, iWidth, iHeight, bAbove, bLeft );
452#endif
453    return;
454  }
455#endif
456
457  // get converted direction
458  uiDirMode = g_aucAngIntraModeOrder[ uiDirMode ];
459
460  // Create the prediction
461  xPredIntraAng( ptrSrc+sw+1, sw, pDst, uiStride, iWidth, iHeight, uiDirMode, bAbove,  bLeft );
462}
463
464#if HHI_DMM_WEDGE_INTRA || HHI_DMM_PRED_TEX
465Void TComPrediction::predIntraLumaDMM( TComDataCU* pcCU, UInt uiAbsPartIdx, UInt uiMode, Pel* piPred, UInt uiStride, Int iWidth, Int iHeight, Bool bAbove, Bool bLeft, Bool bEncoder )
466{
467#if HHI_DMM_WEDGE_INTRA
468  if( uiMode == DMM_WEDGE_FULL_IDX          ) { xPredIntraWedgeFull      ( pcCU, uiAbsPartIdx, piPred, uiStride, iWidth, iHeight, bAbove, bLeft, bEncoder, false, pcCU->getWedgeFullTabIdx ( uiAbsPartIdx ) ); }
469  if( uiMode == DMM_WEDGE_FULL_D_IDX        ) { xPredIntraWedgeFull      ( pcCU, uiAbsPartIdx, piPred, uiStride, iWidth, iHeight, bAbove, bLeft, bEncoder, true,  pcCU->getWedgeFullTabIdx( uiAbsPartIdx ), pcCU->getWedgeFullDeltaDC1( uiAbsPartIdx ), pcCU->getWedgeFullDeltaDC2( uiAbsPartIdx ) ); }
470  if( uiMode == DMM_WEDGE_PREDDIR_IDX     ) { xPredIntraWedgeDir       ( pcCU, uiAbsPartIdx, piPred, uiStride, iWidth, iHeight, bAbove, bLeft, bEncoder, false, pcCU->getWedgePredDirDeltaEnd( uiAbsPartIdx ) ); }
471  if( uiMode == DMM_WEDGE_PREDDIR_D_IDX   ) { xPredIntraWedgeDir       ( pcCU, uiAbsPartIdx, piPred, uiStride, iWidth, iHeight, bAbove, bLeft, bEncoder, true,  pcCU->getWedgePredDirDeltaEnd( uiAbsPartIdx ), pcCU->getWedgePredDirDeltaDC1( uiAbsPartIdx ), pcCU->getWedgePredDirDeltaDC2( uiAbsPartIdx ) ); }
472#endif
473#if HHI_DMM_PRED_TEX
474  if( uiMode == DMM_WEDGE_PREDTEX_IDX       ) { xPredIntraWedgeTex       ( pcCU, uiAbsPartIdx, piPred, uiStride, iWidth, iHeight, bAbove, bLeft, bEncoder, false ); }
475  if( uiMode == DMM_WEDGE_PREDTEX_D_IDX     ) { xPredIntraWedgeTex       ( pcCU, uiAbsPartIdx, piPred, uiStride, iWidth, iHeight, bAbove, bLeft, bEncoder, true, pcCU->getWedgePredTexDeltaDC1( uiAbsPartIdx ), pcCU->getWedgePredTexDeltaDC2( uiAbsPartIdx ) ); }
476  if( uiMode == DMM_CONTOUR_PREDTEX_IDX     ) { xPredIntraContourTex     ( pcCU, uiAbsPartIdx, piPred, uiStride, iWidth, iHeight, bAbove, bLeft, bEncoder, false ); }
477  if( uiMode == DMM_CONTOUR_PREDTEX_D_IDX   ) { xPredIntraContourTex     ( pcCU, uiAbsPartIdx, piPred, uiStride, iWidth, iHeight, bAbove, bLeft, bEncoder, true, pcCU->getContourPredTexDeltaDC1( uiAbsPartIdx ), pcCU->getContourPredTexDeltaDC2( uiAbsPartIdx ) ); }
478#endif
479}
480
481Void TComPrediction::xDeltaDCQuantScaleUp( TComDataCU* pcCU, Int& riDeltaDC )
482{
483  Int  iSign  = riDeltaDC < 0 ? -1 : 1;
484  UInt uiAbs  = abs( riDeltaDC );
485
486  Int iQp = pcCU->getQP(0);
487  Int iMax = ( 1<<( g_uiBitDepth + g_uiBitIncrement - 1) );
488  Double dStepSize = Clip3( 1, iMax, pow( 2.0, iQp/10.0 + g_dDeltaDCsQuantOffset ) );
489
490  riDeltaDC = iSign * roftoi( uiAbs * dStepSize );
491  return;
492}
493
494Void TComPrediction::calcWedgeDCs( TComWedgelet* pcWedgelet, Pel* piOrig, UInt uiStride, Int& riDC1, Int& riDC2 )
495{
496  UInt uiDC1 = 0;
497  UInt uiDC2 = 0;
498  UInt uiNumPixDC1 = 0, uiNumPixDC2 = 0;
499  Bool* pabWedgePattern = pcWedgelet->getPattern();
500  if( uiStride == pcWedgelet->getStride() )
501  {
502    for( UInt k = 0; k < (pcWedgelet->getWidth() * pcWedgelet->getHeight()); k++ )
503    {
504      if( true == pabWedgePattern[k] ) 
505      {
506        uiDC2 += piOrig[k];
507        uiNumPixDC2++;
508      }
509      else
510      {
511        uiDC1 += piOrig[k];
512        uiNumPixDC1++;
513      }
514    }
515  }
516  else
517  {
518    Pel* piTemp = piOrig;
519    UInt uiWedgeStride = pcWedgelet->getStride();
520    for( UInt uiY = 0; uiY < pcWedgelet->getHeight(); uiY++ )
521    {
522      for( UInt uiX = 0; uiX < pcWedgelet->getWidth(); uiX++ )
523      {
524        if( true == pabWedgePattern[uiX] ) 
525        {
526          uiDC2 += piTemp[uiX];
527          uiNumPixDC2++;
528        }
529        else
530        {
531          uiDC1 += piTemp[uiX];
532          uiNumPixDC1++;
533        }
534      }
535      piTemp          += uiStride;
536      pabWedgePattern += uiWedgeStride;
537    }
538  }
539
540  if( uiNumPixDC1 > 0 ) { riDC1 = uiDC1 / uiNumPixDC1; }
541  else                  { riDC1 = ( 1<<( g_uiBitDepth + g_uiBitIncrement - 1) ); }
542
543  if( uiNumPixDC2 > 0 ) { riDC2 = uiDC2 / uiNumPixDC2; }
544  else                  { riDC2 = ( 1<<( g_uiBitDepth + g_uiBitIncrement - 1) ); }
545}
546
547Void TComPrediction::assignWedgeDCs2Pred( TComWedgelet* pcWedgelet, Pel* piPred, UInt uiStride, Int iDC1, Int iDC2 )
548{
549  Bool* pabWedgePattern = pcWedgelet->getPattern();
550
551  if( uiStride == pcWedgelet->getStride() )
552  {
553    for( UInt k = 0; k < (pcWedgelet->getWidth() * pcWedgelet->getHeight()); k++ )
554    {
555      if( true == pabWedgePattern[k] ) 
556      {
557        piPred[k] = iDC2;
558      }
559      else
560      {
561        piPred[k] = iDC1;
562      }
563    }
564  }
565  else
566  {
567    Pel* piTemp = piPred;
568    UInt uiWedgeStride = pcWedgelet->getStride();
569    for( UInt uiY = 0; uiY < pcWedgelet->getHeight(); uiY++ )
570    {
571      for( UInt uiX = 0; uiX < pcWedgelet->getWidth(); uiX++ )
572      {
573        if( true == pabWedgePattern[uiX] ) 
574        {
575          piTemp[uiX] = iDC2;
576        }
577        else
578  {
579          piTemp[uiX] = iDC1;
580        }
581      }
582      piTemp          += uiStride;
583      pabWedgePattern += uiWedgeStride;
584    }
585  }
586}
587
588Void TComPrediction::getWedgePredDCs( TComWedgelet* pcWedgelet, Int* piMask, Int iMaskStride, Int& riPredDC1, Int& riPredDC2, Bool bAbove, Bool bLeft )
589{
590  riPredDC1 = ( 1<<( g_uiBitDepth + g_uiBitIncrement - 1) ); //pred val, if no neighbors are available
591  riPredDC2 = ( 1<<( g_uiBitDepth + g_uiBitIncrement - 1) );
592
593  if( !bAbove && !bLeft ) { return; }
594
595  UInt uiNumSmpDC1 = 0, uiNumSmpDC2 = 0;
596  Int iPredDC1 = 0, iPredDC2 = 0;
597
598  Bool* pabWedgePattern = pcWedgelet->getPattern();
599  UInt  uiWedgeStride   = pcWedgelet->getStride();
600
601  if( bAbove )
602  {
603    for( Int k = 0; k < pcWedgelet->getWidth(); k++ )
604    {
605      if( true == pabWedgePattern[k] )
606      {
607        iPredDC2 += piMask[k-iMaskStride];
608        uiNumSmpDC2++;
609      }
610      else
611      {
612        iPredDC1 += piMask[k-iMaskStride];
613        uiNumSmpDC1++;
614      }
615    }
616  }
617  if( bLeft )
618  {
619    for( Int k = 0; k < pcWedgelet->getHeight(); k++ )
620    {
621      if( true == pabWedgePattern[k*uiWedgeStride] )
622      {
623        iPredDC2 += piMask[k*iMaskStride-1];
624        uiNumSmpDC2++;
625      } 
626      else
627      {
628        iPredDC1 += piMask[k*iMaskStride-1];
629        uiNumSmpDC1++;
630      }
631    }
632  }
633
634  if( uiNumSmpDC1 > 0 )
635  {
636    iPredDC1 /= uiNumSmpDC1;
637    riPredDC1 = iPredDC1;
638  }
639  if( uiNumSmpDC2 > 0 )
640  {
641    iPredDC2 /= uiNumSmpDC2;
642    riPredDC2 = iPredDC2;
643  }
644}
645#endif
646
647#if HHI_DMM_WEDGE_INTRA
648Void TComPrediction::xPredIntraWedgeFull( TComDataCU* pcCU, UInt uiAbsPartIdx, Pel* piPred, UInt uiStride, Int iWidth, Int iHeight, Bool bAbove, Bool bLeft, Bool bEncoder, Bool bDelta, UInt uiTabIdx, Int iDeltaDC1, Int iDeltaDC2 )
649{
650  assert( iWidth >= DMM_WEDGEMODEL_MIN_SIZE && iWidth <= DMM_WEDGEMODEL_MAX_SIZE );
651  WedgeList* pacWedgeList = &g_aacWedgeLists[(g_aucConvertToBit[iWidth])];
652  TComWedgelet* pcWedgelet = &(pacWedgeList->at(uiTabIdx));
653
654  // get wedge pred DCs
655  Int iPredDC1 = 0;
656  Int iPredDC2 = 0;
657
658  Int* piMask = pcCU->getPattern()->getAdiOrgBuf( iWidth, iHeight, m_piYuvExt );
659  Int iMaskStride = ( iWidth<<1 ) + 1;
660  piMask += iMaskStride+1;
661  getWedgePredDCs( pcWedgelet, piMask, iMaskStride, iPredDC1, iPredDC2, bAbove, bLeft );
662
663  if( bDelta ) 
664  {
665    xDeltaDCQuantScaleUp( pcCU, iDeltaDC1 );
666    xDeltaDCQuantScaleUp( pcCU, iDeltaDC2 );
667  }
668
669  // assign wedge pred DCs to prediction
670  if( bDelta ) { assignWedgeDCs2Pred( pcWedgelet, piPred, uiStride, Clip( iPredDC1+iDeltaDC1 ), Clip( iPredDC2+iDeltaDC2 ) ); }
671  else         { assignWedgeDCs2Pred( pcWedgelet, piPred, uiStride, iPredDC1,           iPredDC2           ); }
672}
673
674UInt TComPrediction::getBestContinueWedge( TComDataCU* pcCU, UInt uiAbsPartIdx, UInt uiWidth, UInt uiHeight, Int iDeltaEnd )
675{
676  UInt uiThisBlockSize = uiWidth;
677  assert( uiThisBlockSize >= DMM_WEDGEMODEL_MIN_SIZE && uiThisBlockSize <= DMM_WEDGEMODEL_MAX_SIZE );
678  WedgeList*    pacContDWedgeList    = &g_aacWedgeLists   [(g_aucConvertToBit[uiThisBlockSize])];
679  WedgeRefList* pacContDWedgeRefList = &g_aacWedgeRefLists[(g_aucConvertToBit[uiThisBlockSize])];
680
681  UInt uiPredDirWedgeTabIdx = 0;
682  TComDataCU* pcTempCU;
683  UInt        uiTempPartIdx;
684  // 1st: try continue above wedgelet
685  pcTempCU = pcCU->getPUAbove( uiTempPartIdx, pcCU->getZorderIdxInCU() + uiAbsPartIdx );
686  if( pcTempCU )
687  {
688    UChar uhLumaIntraDir = pcTempCU->getLumaIntraDir( uiTempPartIdx );
689    if( DMM_WEDGE_FULL_IDX      == uhLumaIntraDir || 
690        DMM_WEDGE_FULL_D_IDX    == uhLumaIntraDir || 
691        DMM_WEDGE_PREDDIR_IDX   == uhLumaIntraDir || 
692        DMM_WEDGE_PREDDIR_D_IDX == uhLumaIntraDir
693#if HHI_DMM_PRED_TEX
694                                                  ||
695        DMM_WEDGE_PREDTEX_IDX   == uhLumaIntraDir ||
696        DMM_WEDGE_PREDTEX_D_IDX == uhLumaIntraDir   
697#endif
698       )
699    {
700      UInt uiRefWedgeSize = (UInt)g_aucIntraSizeIdxToWedgeSize[pcTempCU->getIntraSizeIdx( uiTempPartIdx )];
701      WedgeList* pacWedgeList = &g_aacWedgeLists[(g_aucConvertToBit[uiRefWedgeSize])];
702
703      // get offset between current and reference block
704      UInt uiOffsetX = 0;
705      UInt uiOffsetY = 0;
706      xGetBlockOffset( pcCU, uiAbsPartIdx, pcTempCU, uiTempPartIdx, uiOffsetX, uiOffsetY );
707
708      // get reference wedgelet
709  UInt uiRefWedgeTabIdx = 0;
710      switch( uhLumaIntraDir )
711      {
712      case( DMM_WEDGE_FULL_IDX      ): { uiRefWedgeTabIdx = pcTempCU->getWedgeFullTabIdx   ( uiTempPartIdx ); } break;
713      case( DMM_WEDGE_FULL_D_IDX    ): { uiRefWedgeTabIdx = pcTempCU->getWedgeFullTabIdx   ( uiTempPartIdx ); } break;
714      case( DMM_WEDGE_PREDDIR_IDX   ): { uiRefWedgeTabIdx = pcTempCU->getWedgePredDirTabIdx( uiTempPartIdx ); } break;
715      case( DMM_WEDGE_PREDDIR_D_IDX ): { uiRefWedgeTabIdx = pcTempCU->getWedgePredDirTabIdx( uiTempPartIdx ); } break;
716#if HHI_DMM_PRED_TEX
717      case( DMM_WEDGE_PREDTEX_IDX   ): { uiRefWedgeTabIdx = pcTempCU->getWedgePredTexTabIdx( uiTempPartIdx ); } break;
718      case( DMM_WEDGE_PREDTEX_D_IDX ): { uiRefWedgeTabIdx = pcTempCU->getWedgePredTexTabIdx( uiTempPartIdx ); } break;
719#endif
720      default: { assert( 0 ); return uiPredDirWedgeTabIdx; }
721      }
722      TComWedgelet* pcRefWedgelet;
723      pcRefWedgelet = &(pacWedgeList->at( uiRefWedgeTabIdx ));
724     
725      // find reference wedgelet, if direction is suitable for continue wedge
726      if( pcRefWedgelet->checkPredDirAbovePossible( uiThisBlockSize, uiOffsetX ) )
727      {
728        UChar uhContD_Xs, uhContD_Ys, uhContD_Xe, uhContD_Ye;
729        pcRefWedgelet->getPredDirStartEndAbove( uhContD_Xs, uhContD_Ys, uhContD_Xe, uhContD_Ye, uiThisBlockSize, uiOffsetX, iDeltaEnd );
730        getWedgeListIdx( pacContDWedgeList, pacContDWedgeRefList, uiPredDirWedgeTabIdx, uhContD_Xs, uhContD_Ys, uhContD_Xe, uhContD_Ye );
731        return uiPredDirWedgeTabIdx;
732      }
733    }
734  }
735
736  // 2nd: try continue left wedglelet
737  pcTempCU = pcCU->getPULeft( uiTempPartIdx, pcCU->getZorderIdxInCU() + uiAbsPartIdx );
738  if( pcTempCU )
739  {
740    UChar uhLumaIntraDir = pcTempCU->getLumaIntraDir( uiTempPartIdx );
741    if( DMM_WEDGE_FULL_IDX      == uhLumaIntraDir || 
742        DMM_WEDGE_FULL_D_IDX    == uhLumaIntraDir || 
743        DMM_WEDGE_PREDDIR_IDX   == uhLumaIntraDir || 
744        DMM_WEDGE_PREDDIR_D_IDX == uhLumaIntraDir
745#if HHI_DMM_PRED_TEX
746                                                  ||
747        DMM_WEDGE_PREDTEX_IDX   == uhLumaIntraDir ||
748        DMM_WEDGE_PREDTEX_D_IDX == uhLumaIntraDir   
749#endif
750      )
751    {
752      UInt uiRefWedgeSize = (UInt)g_aucIntraSizeIdxToWedgeSize[pcTempCU->getIntraSizeIdx( uiTempPartIdx )];
753      WedgeList* pacWedgeList = &g_aacWedgeLists[(g_aucConvertToBit[uiRefWedgeSize])];
754
755      // get offset between current and reference block
756      UInt uiOffsetX = 0;
757      UInt uiOffsetY = 0;
758      xGetBlockOffset( pcCU, uiAbsPartIdx, pcTempCU, uiTempPartIdx, uiOffsetX, uiOffsetY );
759
760      // get reference wedgelet
761      UInt uiRefWedgeTabIdx = 0;
762      switch( uhLumaIntraDir )
763      {
764      case( DMM_WEDGE_FULL_IDX      ): { uiRefWedgeTabIdx = pcTempCU->getWedgeFullTabIdx   ( uiTempPartIdx ); } break;
765      case( DMM_WEDGE_FULL_D_IDX    ): { uiRefWedgeTabIdx = pcTempCU->getWedgeFullTabIdx   ( uiTempPartIdx ); } break;
766      case( DMM_WEDGE_PREDDIR_IDX   ): { uiRefWedgeTabIdx = pcTempCU->getWedgePredDirTabIdx( uiTempPartIdx ); } break;
767      case( DMM_WEDGE_PREDDIR_D_IDX ): { uiRefWedgeTabIdx = pcTempCU->getWedgePredDirTabIdx( uiTempPartIdx ); } break;
768#if HHI_DMM_PRED_TEX
769      case( DMM_WEDGE_PREDTEX_IDX   ): { uiRefWedgeTabIdx = pcTempCU->getWedgePredTexTabIdx( uiTempPartIdx ); } break;
770      case( DMM_WEDGE_PREDTEX_D_IDX ): { uiRefWedgeTabIdx = pcTempCU->getWedgePredTexTabIdx( uiTempPartIdx ); } break;
771#endif
772      default: { assert( 0 ); return uiPredDirWedgeTabIdx; }
773      }
774      TComWedgelet* pcRefWedgelet;
775      pcRefWedgelet = &(pacWedgeList->at( uiRefWedgeTabIdx ));
776
777      // find reference wedgelet, if direction is suitable for continue wedge
778      if( pcRefWedgelet->checkPredDirLeftPossible( uiThisBlockSize, uiOffsetY ) )
779      {
780        UChar uhContD_Xs, uhContD_Ys, uhContD_Xe, uhContD_Ye;
781        pcRefWedgelet->getPredDirStartEndLeft( uhContD_Xs, uhContD_Ys, uhContD_Xe, uhContD_Ye, uiThisBlockSize, uiOffsetY, iDeltaEnd );
782        getWedgeListIdx( pacContDWedgeList, pacContDWedgeRefList, uiPredDirWedgeTabIdx, uhContD_Xs, uhContD_Ys, uhContD_Xe, uhContD_Ye );
783        return uiPredDirWedgeTabIdx;
784      }
785    }
786  }
787
788  // 3rd: (default) make wedglet from intra dir and max slope point
789  Int iSlopeX = 0;
790  Int iSlopeY = 0;
791  UInt uiStartPosX = 0;
792  UInt uiStartPosY = 0;
793  if( xGetWedgeIntraDirPredData( pcCU, uiAbsPartIdx, uiThisBlockSize, iSlopeX, iSlopeY, uiStartPosX, uiStartPosY ) )
794  {
795    UChar uhContD_Xs, uhContD_Ys, uhContD_Xe, uhContD_Ye;
796    xGetWedgeIntraDirStartEnd( pcCU, uiAbsPartIdx, uiThisBlockSize, iSlopeX, iSlopeY, uiStartPosX, uiStartPosY, uhContD_Xs, uhContD_Ys, uhContD_Xe, uhContD_Ye, iDeltaEnd );
797    getWedgeListIdx( pacContDWedgeList, pacContDWedgeRefList, uiPredDirWedgeTabIdx, uhContD_Xs, uhContD_Ys, uhContD_Xe, uhContD_Ye );
798    return uiPredDirWedgeTabIdx;
799  }
800
801  return uiPredDirWedgeTabIdx;
802}
803
804Void TComPrediction::xGetBlockOffset( TComDataCU* pcCU, UInt uiAbsPartIdx, TComDataCU* pcRefCU, UInt uiRefAbsPartIdx, UInt& ruiOffsetX, UInt& ruiOffsetY )
805{
806  ruiOffsetX = 0;
807  ruiOffsetY = 0;
808
809  // get offset between current and above/left block
810  UInt uiThisOriginX = pcCU->getCUPelX() + g_auiRasterToPelX[ g_auiZscanToRaster[uiAbsPartIdx] ];
811  UInt uiThisOriginY = pcCU->getCUPelY() + g_auiRasterToPelY[ g_auiZscanToRaster[uiAbsPartIdx] ];
812
813  UInt uiNumPartInRefCU = pcRefCU->getTotalNumPart();
814  UInt uiMaxDepthRefCU = 0;
815  while( uiNumPartInRefCU > 1 )
816  {
817    uiNumPartInRefCU >>= 2;
818    uiMaxDepthRefCU++;
819  }
820
821  UInt uiDepthRefPU = (pcRefCU->getDepth(uiRefAbsPartIdx)) + (pcRefCU->getPartitionSize(uiRefAbsPartIdx) == SIZE_2Nx2N ? 0 : 1);
822  UInt uiShifts = (uiMaxDepthRefCU - uiDepthRefPU)*2;
823  UInt uiRefBlockOriginPartIdx = (uiRefAbsPartIdx>>uiShifts)<<uiShifts;
824
825  UInt uiRefOriginX = pcRefCU->getCUPelX() + g_auiRasterToPelX[ g_auiZscanToRaster[uiRefBlockOriginPartIdx] ];
826  UInt uiRefOriginY = pcRefCU->getCUPelY() + g_auiRasterToPelY[ g_auiZscanToRaster[uiRefBlockOriginPartIdx] ];
827
828  if( (uiThisOriginX - uiRefOriginX) > 0 ) { ruiOffsetX = (UInt)(uiThisOriginX - uiRefOriginX); }
829  if( (uiThisOriginY - uiRefOriginY) > 0 ) { ruiOffsetY = (UInt)(uiThisOriginY - uiRefOriginY); }
830}
831
832Bool TComPrediction::xGetWedgeIntraDirPredData( TComDataCU* pcCU, UInt uiAbsPartIdx, UInt uiBlockSize, Int& riSlopeX, Int& riSlopeY, UInt& ruiStartPosX, UInt& ruiStartPosY )
833{
834  riSlopeX     = 0;
835  riSlopeY     = 0;
836  ruiStartPosX = 0;
837  ruiStartPosY = 0;
838
839  // 1st step: get wedge start point (max. slope)
840  Int* piSource = pcCU->getPattern()->getAdiOrgBuf( uiBlockSize, uiBlockSize, m_piYuvExt );
841  Int iSourceStride = ( uiBlockSize<<1 ) + 1;
842
843  UInt uiSlopeMaxAbove = 0;
844  UInt uiPosSlopeMaxAbove = 0;
845  for( UInt uiPosHor = 0; uiPosHor < (uiBlockSize-1); uiPosHor++ )
846  {
847    if( abs( piSource[uiPosHor+1] - piSource[uiPosHor] ) > uiSlopeMaxAbove )
848    {
849      uiSlopeMaxAbove = abs( piSource[uiPosHor+1] - piSource[uiPosHor] );
850      uiPosSlopeMaxAbove = uiPosHor;
851    }
852  }
853
854  UInt uiSlopeMaxLeft = 0;
855  UInt uiPosSlopeMaxLeft = 0;
856  for( UInt uiPosVer = 0; uiPosVer < (uiBlockSize-1); uiPosVer++ )
857  {
858    if( abs( piSource[(uiPosVer+1)*iSourceStride] - piSource[uiPosVer*iSourceStride] ) > uiSlopeMaxLeft )
859    {
860      uiSlopeMaxLeft = abs( piSource[(uiPosVer+1)*iSourceStride] - piSource[uiPosVer*iSourceStride] );
861      uiPosSlopeMaxLeft = uiPosVer;
862    }
863  }
864
865  if( uiSlopeMaxAbove == 0 && uiSlopeMaxLeft == 0 ) 
866  { 
867    return false; 
868  }
869
870  if( uiSlopeMaxAbove > uiSlopeMaxLeft )
871  {
872    ruiStartPosX = uiPosSlopeMaxAbove;
873    ruiStartPosY = 0;
874  }
875  else
876  {
877    ruiStartPosX = 0;
878    ruiStartPosY = uiPosSlopeMaxLeft;
879  }
880
881  // 2nd step: derive wedge direction
882  Int angTable[9] = {0,2,5,9,13,17,21,26,32};
883
884  Int uiPreds[2] = {-1, -1};
885  Int uiPredNum = pcCU->getIntraDirLumaPredictor( uiAbsPartIdx, uiPreds );
886
887  UInt uiDirMode = 0;
888  if( uiPredNum == 1 )
889  {
890    uiDirMode = g_aucAngIntraModeOrder[uiPreds[0]];
891  }
892  else if( uiPredNum == 2 )
893  {
894    uiDirMode = g_aucAngIntraModeOrder[uiPreds[1]];
895  }
896
897  if( uiDirMode == 0 ) 
898  { 
899    return false; 
900  }
901
902  Bool modeVer       = (uiDirMode < 18);
903  Bool modeHor       = !modeVer;
904  Int intraPredAngle = modeVer ? uiDirMode - 9 : modeHor ? uiDirMode - 25 : 0;
905  Int absAng         = abs(intraPredAngle);
906  Int signAng        = intraPredAngle < 0 ? -1 : 1;
907  absAng             = angTable[absAng];
908  intraPredAngle     = signAng * absAng;
909
910  // 3rd step: set slope for direction
911  if( modeHor )
912    {
913    if( intraPredAngle > 0 )
914    {
915      riSlopeX = -32;
916      riSlopeY = intraPredAngle;
917    }
918    else
919    {
920      riSlopeX = 32;
921      riSlopeY = -intraPredAngle;
922    }
923    }
924  else if( modeVer )
925  {
926    if( intraPredAngle > 0 )
927    {
928      riSlopeX = intraPredAngle;
929      riSlopeY = -32;
930  }
931  else
932  {
933      riSlopeX = -intraPredAngle;
934      riSlopeY = 32;
935    }
936  }
937
938    return true;
939}
940
941Void TComPrediction::xGetWedgeIntraDirStartEnd( TComDataCU* pcCU, UInt uiAbsPartIdx, UInt uiBlockSize, Int iDeltaX, Int iDeltaY, UInt uiPMSPosX, UInt uiPMSPosY, UChar& ruhXs, UChar& ruhYs, UChar& ruhXe, UChar& ruhYe, Int iDeltaEnd )
942{
943  ruhXs = 0;
944  ruhYs = 0;
945  ruhXe = 0;
946  ruhYe = 0;
947  UInt uiOri;
948
949  // scaling of start pos and block size to wedge resolution
950  UInt uiScaledStartPosX = 0;
951  UInt uiScaledStartPosY = 0;
952  UInt uiScaledBlockSize = 0;
953  WedgeResolution eWedgeRes = g_aeWedgeResolutionList[(UInt)g_aucConvertToBit[uiBlockSize]];
954  switch( eWedgeRes )
955  {
956  case( DOUBLE_PEL ): { uiScaledStartPosX = (uiPMSPosX>>1); uiScaledStartPosY = (uiPMSPosY>>1); uiScaledBlockSize = (uiBlockSize>>1); break; }
957  case(   FULL_PEL ): { uiScaledStartPosX =  uiPMSPosX;     uiScaledStartPosY =  uiPMSPosY;     uiScaledBlockSize =  uiBlockSize;     break; }
958  case(   HALF_PEL ): { uiScaledStartPosX = (uiPMSPosX<<1); uiScaledStartPosY = (uiPMSPosY<<1); uiScaledBlockSize = (uiBlockSize<<1); break; }
959}
960
961  // case above
962  if( uiScaledStartPosX > 0 && uiScaledStartPosY == 0 )
963  {
964    ruhXs = (UChar)uiScaledStartPosX;
965    ruhYs = 0;
966
967    if( iDeltaY == 0 )
968{
969      if( iDeltaX < 0 )
970      {
971        uiOri = 0;
972        ruhXe = 0;
973        ruhYe = (UChar)Min( Max( iDeltaEnd, 0 ), (uiScaledBlockSize-1) );
974        return;
975      }
976      else
977      {
978        uiOri = 1;
979        ruhXe = (UChar)(uiScaledBlockSize-1); ;
980        ruhYe = (UChar)Min( Max( -iDeltaEnd, 0 ), (uiScaledBlockSize-1) );
981        std::swap( ruhXs, ruhXe );
982        std::swap( ruhYs, ruhYe );
983        return;
984      }
985    }
986
987    // regular case
988    Int iVirtualEndX = (Int)ruhXs + roftoi( (Double)(uiScaledBlockSize-1) * ((Double)iDeltaX / (Double)iDeltaY) );
989
990    if( iVirtualEndX < 0 )
991    {
992      Int iYe = roftoi( (Double)(0 - (Int)ruhXs) * ((Double)iDeltaY / (Double)iDeltaX) ) + iDeltaEnd;
993      if( iYe < (Int)uiScaledBlockSize )
994      {
995        uiOri = 0;
996        ruhXe = 0;
997        ruhYe = (UChar)Max( iYe, 0 );
998        return;
999      }
1000      else
1001      {
1002        uiOri = 4;
1003        ruhXe = (UChar)Min( (iYe - (uiScaledBlockSize-1)), (uiScaledBlockSize-1) );
1004        ruhYe = (UChar)(uiScaledBlockSize-1);
1005        return;
1006      }
1007    }
1008    else if( iVirtualEndX > (uiScaledBlockSize-1) )
1009    {
1010      Int iYe = roftoi( (Double)((Int)(uiScaledBlockSize-1) - (Int)ruhXs) * ((Double)iDeltaY / (Double)iDeltaX) ) - iDeltaEnd;
1011      if( iYe < (Int)uiScaledBlockSize )
1012      {
1013        uiOri = 1;
1014        ruhXe = (UChar)(uiScaledBlockSize-1);
1015        ruhYe = (UChar)Max( iYe, 0 );
1016        std::swap( ruhXs, ruhXe );
1017        std::swap( ruhYs, ruhYe );
1018        return;
1019      }
1020      else
1021      {
1022        uiOri = 4;
1023        ruhXe = (UChar)Max( ((uiScaledBlockSize-1) - (iYe - (uiScaledBlockSize-1))), 0 );
1024        ruhYe = (UChar)(uiScaledBlockSize-1);
1025        return;
1026      }
1027    }
1028    else
1029    {
1030      Int iXe = iVirtualEndX + iDeltaEnd;
1031      if( iXe < 0 )
1032      {
1033        uiOri = 0;
1034        ruhXe = 0;
1035        ruhYe = (UChar)Max( ((uiScaledBlockSize-1) + iXe), 0 );
1036        return;
1037      }
1038      else if( iXe > (uiScaledBlockSize-1) )
1039      {
1040        uiOri = 1;
1041        ruhXe = (UChar)(uiScaledBlockSize-1);
1042        ruhYe = (UChar)Max( ((uiScaledBlockSize-1) - (iXe - (uiScaledBlockSize-1))), 0 );
1043        std::swap( ruhXs, ruhXe );
1044        std::swap( ruhYs, ruhYe );
1045        return;
1046      }
1047      else
1048      {
1049        uiOri = 4;
1050        ruhXe = (UChar)iXe;
1051        ruhYe = (UChar)(uiScaledBlockSize-1);
1052        return;
1053      }
1054    }
1055  }
1056
1057  // case left
1058  if( uiScaledStartPosY > 0 && uiScaledStartPosX == 0 )
1059  {
1060    ruhXs = 0;
1061    ruhYs = (UChar)uiScaledStartPosY;
1062
1063    if( iDeltaX == 0 )
1064    {
1065      if( iDeltaY < 0 )
1066      {
1067        uiOri = 0;
1068        ruhXe = (UChar)Min( Max( -iDeltaEnd, 0 ), (uiScaledBlockSize-1) );
1069        ruhYe = 0;
1070        std::swap( ruhXs, ruhXe );
1071        std::swap( ruhYs, ruhYe );
1072        return;
1073      }
1074      else
1075      {
1076        uiOri = 3;
1077        ruhXe = (UChar)Min( Max( iDeltaEnd, 0 ), (uiScaledBlockSize-1) );
1078        ruhYe = (UChar)(uiScaledBlockSize-1); 
1079        return; 
1080      }
1081    }
1082
1083    // regular case
1084    Int iVirtualEndY = (Int)ruhYs + roftoi( (Double)(uiScaledBlockSize-1) * ((Double)iDeltaY / (Double)iDeltaX) );
1085
1086    if( iVirtualEndY < 0 )
1087    {
1088      Int iXe = roftoi( (Double)(0 - (Int)ruhYs ) * ((Double)iDeltaX / (Double)iDeltaY) ) - iDeltaEnd;
1089      if( iXe < (Int)uiScaledBlockSize )
1090      {
1091        uiOri = 0;
1092        ruhXe = (UChar)Max( iXe, 0 );
1093        ruhYe = 0;
1094        std::swap( ruhXs, ruhXe );
1095        std::swap( ruhYs, ruhYe );
1096        return;
1097      }
1098      else
1099      {
1100        uiOri = 5;
1101        ruhXe = (UChar)(uiScaledBlockSize-1);
1102        ruhYe = (UChar)Min( (iXe - (uiScaledBlockSize-1)), (uiScaledBlockSize-1) );
1103        std::swap( ruhXs, ruhXe );
1104        std::swap( ruhYs, ruhYe );
1105        return;
1106      }
1107    }
1108    else if( iVirtualEndY > (uiScaledBlockSize-1) )
1109    {
1110      Int iXe = roftoi( (Double)((Int)(uiScaledBlockSize-1) - (Int)ruhYs ) * ((Double)iDeltaX / (Double)iDeltaY) ) + iDeltaEnd;
1111      if( iXe < (Int)uiScaledBlockSize )
1112      {
1113        uiOri = 3;
1114        ruhXe = (UChar)Max( iXe, 0 );
1115        ruhYe = (UChar)(uiScaledBlockSize-1);
1116        return;
1117      }
1118      else
1119      {
1120        uiOri = 5;
1121        ruhXe = (UChar)(uiScaledBlockSize-1);
1122        ruhYe = (UChar)Max( ((uiScaledBlockSize-1) - (iXe - (uiScaledBlockSize-1))), 0 );
1123        std::swap( ruhXs, ruhXe );
1124        std::swap( ruhYs, ruhYe );
1125        return;
1126      }
1127    }
1128    else
1129    {
1130      Int iYe = iVirtualEndY - iDeltaEnd;
1131      if( iYe < 0 )
1132      {
1133        uiOri = 0;
1134        ruhXe = (UChar)Max( ((uiScaledBlockSize-1) + iYe), 0 );
1135        ruhYe = 0;
1136        std::swap( ruhXs, ruhXe );
1137        std::swap( ruhYs, ruhYe );
1138        return;
1139      }
1140      else if( iYe > (uiScaledBlockSize-1) )
1141      {
1142        uiOri = 3;
1143        ruhXe = (UChar)Max( ((uiScaledBlockSize-1) - (iYe - (uiScaledBlockSize-1))), 0 );
1144        ruhYe = (UChar)(uiScaledBlockSize-1);
1145        return;
1146      }
1147      else
1148      {
1149        uiOri = 5;
1150        ruhXe = (UChar)(uiScaledBlockSize-1);
1151        ruhYe = (UChar)iYe;
1152        std::swap( ruhXs, ruhXe );
1153        std::swap( ruhYs, ruhYe );
1154        return;
1155      }
1156    }
1157  }
1158
1159  // case origin
1160  if( uiScaledStartPosX == 0 && uiScaledStartPosY == 0 )
1161  {
1162    if( iDeltaX*iDeltaY < 0 )
1163    {
1164      return;
1165    }
1166
1167    ruhXs = 0;
1168    ruhYs = 0;
1169
1170    if( iDeltaY == 0 )
1171    {
1172      uiOri = 1;
1173      ruhXe = (UChar)(uiScaledBlockSize-1);
1174      ruhYe = 0;
1175      std::swap( ruhXs, ruhXe );
1176      std::swap( ruhYs, ruhYe );
1177      return;
1178  }
1179
1180    if( iDeltaX == 0 )
1181    {
1182      uiOri = 0;
1183      ruhXe = 0;
1184      ruhYe = (UChar)(uiScaledBlockSize-1);
1185      return;
1186  }
1187
1188    Int iVirtualEndX = (Int)ruhXs + roftoi( (Double)(uiScaledBlockSize-1) * ((Double)iDeltaX / (Double)iDeltaY) );
1189
1190    if( iVirtualEndX > (uiScaledBlockSize-1) )
1191    {
1192      Int iYe = roftoi( (Double)((Int)(uiScaledBlockSize-1) - (Int)ruhXs) * ((Double)iDeltaY / (Double)iDeltaX) ) - iDeltaEnd;
1193      if( iYe < (Int)uiScaledBlockSize )
1194      {
1195        uiOri = 1;
1196        ruhXe = (UChar)(uiScaledBlockSize-1);
1197        ruhYe = (UChar)Max( iYe, 0 );
1198        std::swap( ruhXs, ruhXe );
1199        std::swap( ruhYs, ruhYe );
1200        return;
1201      }
1202      else
1203      {
1204        uiOri = 3;
1205        ruhXe = (UChar)Max( ((uiScaledBlockSize-1) - (iYe - (uiScaledBlockSize-1))), 0 );
1206        ruhYe = (UChar)(uiScaledBlockSize-1);
1207        return;
1208      }
1209    }
1210    else
1211    {
1212      Int iXe = iVirtualEndX + iDeltaEnd;
1213      if( iXe < 0 )
1214      {
1215        uiOri = 0;
1216        ruhXe = 0;
1217        ruhYe = (UChar)Max( ((uiScaledBlockSize-1) + iXe), 0 );
1218        return;
1219      }
1220      else if( iXe > (uiScaledBlockSize-1) )
1221      {
1222        uiOri = 1;
1223        ruhXe = (UChar)(uiScaledBlockSize-1);
1224        ruhYe = (UChar)Max( ((uiScaledBlockSize-1) - (iXe - (uiScaledBlockSize-1))), 0 );
1225        std::swap( ruhXs, ruhXe );
1226        std::swap( ruhYs, ruhYe );
1227        return;
1228      }
1229      else
1230      {
1231        uiOri = 3;
1232        ruhXe = (UChar)iXe;
1233        ruhYe = (UChar)(uiScaledBlockSize-1);
1234        return;
1235      }
1236    }
1237  }
1238}
1239
1240Bool TComPrediction::getWedgeListIdx( WedgeList* pcWedgeList, WedgeRefList* pcWedgeRefList, UInt& ruiTabIdx, UChar uhXs, UChar uhYs, UChar uhXe, UChar uhYe )
1241{
1242  ruiTabIdx = 0;
1243
1244  for( UInt uiIdx = 0; uiIdx < pcWedgeList->size(); uiIdx++ )
1245  {
1246    TComWedgelet* pcTestWedge = &(pcWedgeList->at(uiIdx));
1247
1248    if( pcTestWedge->getStartX() == uhXs &&
1249        pcTestWedge->getStartY() == uhYs &&
1250        pcTestWedge->getEndX()   == uhXe &&
1251        pcTestWedge->getEndY()   == uhYe    )
1252    {
1253      ruiTabIdx = uiIdx;
1254      return true;
1255    }
1256  }
1257
1258  // additionally search in WedgeRef lists of duplicated patterns
1259  for( UInt uiIdx = 0; uiIdx < pcWedgeRefList->size(); uiIdx++ )
1260  {
1261    TComWedgeRef* pcTestWedgeRef = &(pcWedgeRefList->at(uiIdx));
1262
1263    if( pcTestWedgeRef->getStartX() == uhXs &&
1264        pcTestWedgeRef->getStartY() == uhYs &&
1265        pcTestWedgeRef->getEndX()   == uhXe &&
1266        pcTestWedgeRef->getEndY()   == uhYe    )
1267    {
1268      ruiTabIdx = pcTestWedgeRef->getRefIdx();
1269      return true;
1270    }
1271  }
1272
1273  return false;
1274}
1275
1276Void TComPrediction::xPredIntraWedgeDir( TComDataCU* pcCU, UInt uiAbsPartIdx, Pel* piPred, UInt uiStride, Int iWidth, Int iHeight, Bool bAbove, Bool bLeft, Bool bEncoder, Bool bDelta, Int iWedgeDeltaEnd, Int iDeltaDC1, Int iDeltaDC2 )
1277{
1278  assert( iWidth >= DMM_WEDGEMODEL_MIN_SIZE && iWidth <= DMM_WEDGEMODEL_MAX_SIZE );
1279  WedgeList* pacWedgeList = &g_aacWedgeLists[(g_aucConvertToBit[iWidth])];
1280
1281  // get wedge pattern
1282  UInt uiDirWedgeTabIdx = 0;
1283  if( bEncoder )
1284  {
1285    // encoder: load stored wedge pattern from CU
1286    uiDirWedgeTabIdx = pcCU->getWedgePredDirTabIdx( uiAbsPartIdx );
1287  }
1288  else
1289  {
1290    uiDirWedgeTabIdx = getBestContinueWedge( pcCU, uiAbsPartIdx, iWidth, iHeight, iWedgeDeltaEnd );
1291
1292    UInt uiDepth = (pcCU->getDepth(0)) + (pcCU->getPartitionSize(0) == SIZE_2Nx2N ? 0 : 1);
1293    pcCU->setWedgePredDirTabIdxSubParts( uiDirWedgeTabIdx, uiAbsPartIdx, uiDepth );
1294  }
1295  TComWedgelet* pcWedgelet = &(pacWedgeList->at(uiDirWedgeTabIdx));
1296
1297  // get wedge pred DCs
1298  Int iPredDC1 = 0;
1299  Int iPredDC2 = 0;
1300
1301  Int* piMask = pcCU->getPattern()->getAdiOrgBuf( iWidth, iHeight, m_piYuvExt );
1302  Int iMaskStride = ( iWidth<<1 ) + 1;
1303  piMask += iMaskStride+1;
1304  getWedgePredDCs( pcWedgelet, piMask, iMaskStride, iPredDC1, iPredDC2, bAbove, bLeft );
1305
1306  if( bDelta ) 
1307  {
1308    xDeltaDCQuantScaleUp( pcCU, iDeltaDC1 );
1309    xDeltaDCQuantScaleUp( pcCU, iDeltaDC2 );
1310  }
1311
1312  // assign wedge pred DCs to prediction
1313  if( bDelta ) { assignWedgeDCs2Pred( pcWedgelet, piPred, uiStride, Clip ( iPredDC1+iDeltaDC1 ), Clip( iPredDC2+iDeltaDC2 ) ); }
1314  else         { assignWedgeDCs2Pred( pcWedgelet, piPred, uiStride,        iPredDC1,                   iPredDC2             ); }
1315}
1316#endif
1317
1318#if HHI_DMM_PRED_TEX
1319Void TComPrediction::xPredIntraWedgeTex( TComDataCU* pcCU, UInt uiAbsPartIdx, Pel* piPred, UInt uiStride, Int iWidth, Int iHeight, Bool bAbove, Bool bLeft, Bool bEncoder, Bool bDelta, Int iDeltaDC1, Int iDeltaDC2 )
1320{
1321  assert( iWidth >= DMM_WEDGEMODEL_MIN_SIZE && iWidth <= DMM_WEDGEMODEL_MAX_SIZE );
1322  WedgeList* pacWedgeList = &g_aacWedgeLists[(g_aucConvertToBit[iWidth])];
1323
1324  // get wedge pattern
1325  UInt uiTextureWedgeTabIdx = 0;
1326  if( bEncoder ) 
1327  {
1328     // encoder: load stored wedge pattern from CU
1329    uiTextureWedgeTabIdx = pcCU->getWedgePredTexTabIdx( uiAbsPartIdx );
1330  }
1331  else
1332  {
1333    // decoder: get and store wedge pattern in CU
1334    uiTextureWedgeTabIdx = getBestWedgeFromText( pcCU, uiAbsPartIdx, (UInt)iWidth, (UInt)iHeight );
1335    UInt uiDepth = (pcCU->getDepth(0)) + (pcCU->getPartitionSize(0) == SIZE_2Nx2N ? 0 : 1);
1336    pcCU->setWedgePredTexTabIdxSubParts( uiTextureWedgeTabIdx, uiAbsPartIdx, uiDepth );
1337  }
1338  TComWedgelet* pcWedgelet = &(pacWedgeList->at(uiTextureWedgeTabIdx));
1339
1340  // get wedge pred DCs
1341  Int iPredDC1 = 0;
1342  Int iPredDC2 = 0;
1343  Int* piMask = pcCU->getPattern()->getAdiOrgBuf( iWidth, iHeight, m_piYuvExt );
1344  Int iMaskStride = ( iWidth<<1 ) + 1;
1345  piMask += iMaskStride+1;
1346  getWedgePredDCs( pcWedgelet, piMask, iMaskStride, iPredDC1, iPredDC2, bAbove, bLeft );
1347
1348  if( bDelta ) 
1349  {
1350    xDeltaDCQuantScaleUp( pcCU, iDeltaDC1 );
1351    xDeltaDCQuantScaleUp( pcCU, iDeltaDC2 );
1352  }
1353
1354  // assign wedge pred DCs to prediction
1355  if( bDelta ) { assignWedgeDCs2Pred( pcWedgelet, piPred, uiStride, Clip ( iPredDC1+iDeltaDC1 ), Clip( iPredDC2+iDeltaDC2 ) ); }
1356  else         { assignWedgeDCs2Pred( pcWedgelet, piPred, uiStride,        iPredDC1,                   iPredDC2           ); }
1357}
1358
1359Void TComPrediction::xPredIntraContourTex( TComDataCU* pcCU, UInt uiAbsPartIdx, Pel* piPred, UInt uiStride, Int iWidth, Int iHeight, Bool bAbove, Bool bLeft, Bool bEncoder, Bool bDelta, Int iDeltaDC1, Int iDeltaDC2 )
1360{
1361  // get contour pattern
1362  TComWedgelet* pcContourWedge = new TComWedgelet( iWidth, iHeight );
1363  getBestContourFromText( pcCU, uiAbsPartIdx, (UInt)iWidth, (UInt)iHeight, pcContourWedge );
1364
1365  // get wedge pred DCs
1366  Int iPredDC1 = 0;
1367  Int iPredDC2 = 0;
1368  Int* piMask = pcCU->getPattern()->getAdiOrgBuf( iWidth, iHeight, m_piYuvExt );
1369  Int iMaskStride = ( iWidth<<1 ) + 1;
1370  piMask += iMaskStride+1;
1371  getWedgePredDCs( pcContourWedge, piMask, iMaskStride, iPredDC1, iPredDC2, bAbove, bLeft );
1372
1373  if( bDelta ) 
1374  {
1375    xDeltaDCQuantScaleUp( pcCU, iDeltaDC1 );
1376    xDeltaDCQuantScaleUp( pcCU, iDeltaDC2 );
1377  }
1378
1379  // assign wedge pred DCs to prediction
1380  if( bDelta ) { assignWedgeDCs2Pred( pcContourWedge, piPred, uiStride, Clip ( iPredDC1+iDeltaDC1 ), Clip( iPredDC2+iDeltaDC2 ) ); }
1381  else         { assignWedgeDCs2Pred( pcContourWedge, piPred, uiStride,        iPredDC1,                   iPredDC2           ); }
1382
1383  pcContourWedge->destroy();
1384  delete pcContourWedge;
1385}
1386
1387Void TComPrediction::getBestContourFromText( TComDataCU* pcCU, UInt uiAbsPartIdx, UInt uiWidth, UInt uiHeight, TComWedgelet* pcContourWedge, Pel* piTextureBlock )
1388{
1389  pcContourWedge->clear();
1390  Bool* pabContourPattern = pcContourWedge->getPattern();
1391
1392  // get copy of according texture luma block
1393  Pel* piTempY = NULL;
1394  TComYuv cTempYuv;
1395
1396  if ( piTextureBlock )
1397  {
1398    piTempY = piTextureBlock;
1399  }
1400  else
1401  {
1402    cTempYuv.create( uiWidth, uiHeight ); cTempYuv.clear();
1403    piTempY      = cTempYuv.getLumaAddr();
1404
1405    fillTexturePicTempBlock( pcCU, uiAbsPartIdx, piTempY, uiWidth, uiHeight );
1406
1407    piTempY = cTempYuv.getLumaAddr();
1408  }
1409
1410  // find contour for texture luma block
1411  UInt iDC = 0;
1412  for( UInt k = 0; k < (uiWidth*uiHeight); k++ ) { iDC += piTempY[k]; }
1413  iDC /= (uiWidth*uiHeight);
1414
1415  if ( piTextureBlock )
1416  {
1417    piTempY = piTextureBlock;
1418  }
1419  else
1420  {
1421    piTempY = cTempYuv.getLumaAddr();
1422  }
1423
1424  for( UInt k = 0; k < (uiWidth*uiHeight); k++ ) 
1425  { 
1426    pabContourPattern[k] = (piTempY[k] > iDC) ? true : false;
1427  }
1428
1429  cTempYuv.destroy();
1430}
1431
1432UInt TComPrediction::getBestWedgeFromText( TComDataCU* pcCU, UInt uiAbsPartIdx, UInt uiWidth, UInt uiHeight, WedgeDist eWedgeDist, Pel* piTextureBlock )
1433{
1434  assert( uiWidth >= DMM_WEDGEMODEL_MIN_SIZE && uiWidth <= DMM_WEDGEMODEL_MAX_SIZE );
1435  WedgeList* pacWedgeList = &g_aacWedgeLists[(g_aucConvertToBit[uiWidth])];
1436
1437  // get copy of according texture luma block
1438  Pel* piTempY = NULL;   
1439  TComYuv     cTempYuv; 
1440
1441  if ( piTextureBlock )
1442  {
1443    piTempY = piTextureBlock;
1444  } 
1445  else
1446  {
1447    cTempYuv.create( uiWidth, uiHeight ); cTempYuv.clear();
1448    piTempY      = cTempYuv.getLumaAddr();
1449
1450    fillTexturePicTempBlock( pcCU, uiAbsPartIdx, piTempY, uiWidth, uiHeight );
1451
1452    piTempY = cTempYuv.getLumaAddr();
1453  }
1454 
1455  TComWedgeDist cWedgeDist;
1456  UInt uiTextureWedgeTabIdx = 0;
1457
1458  // local pred buffer
1459  TComYuv cPredYuv; 
1460  cPredYuv.create( uiWidth, uiHeight ); 
1461  cPredYuv.clear();
1462
1463  UInt uiPredStride = cPredYuv.getStride();
1464  Pel* piPred       = cPredYuv.getLumaAddr();
1465
1466  Int  iDC1 = 0;
1467  Int  iDC2 = 0;
1468  // regular wedge search
1469  UInt uiBestDist   = MAX_UINT;
1470  UInt uiBestTabIdx = 0;
1471
1472  for( UInt uiIdx = 0; uiIdx < pacWedgeList->size(); uiIdx++ )
1473  {
1474    calcWedgeDCs       ( &(pacWedgeList->at(uiIdx)), piTempY,  uiWidth,  iDC1, iDC2 );
1475    assignWedgeDCs2Pred( &(pacWedgeList->at(uiIdx)), piPred, uiPredStride, iDC1, iDC2 );
1476
1477    UInt uiActDist = cWedgeDist.getDistPart( piPred, uiPredStride, piTempY, uiWidth, uiWidth, uiHeight, eWedgeDist );
1478
1479    if( uiActDist < uiBestDist || uiBestDist == MAX_UINT )
1480    {
1481      uiBestDist   = uiActDist;
1482      uiBestTabIdx = uiIdx;
1483    }
1484  }
1485  uiTextureWedgeTabIdx = uiBestTabIdx;
1486
1487  cPredYuv.destroy();
1488  cTempYuv.destroy();
1489  return uiTextureWedgeTabIdx;
1490}
1491
1492Void TComPrediction::fillTexturePicTempBlock( TComDataCU* pcCU, UInt uiAbsPartIdx, Pel* piTempBlockY, UInt uiWidth, UInt uiHeight )
1493{
1494  TComPicYuv* pcPicYuvRef = pcCU->getSlice()->getTexturePic()->getPicYuvRec();
1495  Int         iRefStride = pcPicYuvRef->getStride();
1496  Pel*        piRefY;
1497
1498  piRefY = pcPicYuvRef->getLumaAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiAbsPartIdx );
1499
1500  for ( Int y = 0; y < uiHeight; y++ )
1501  {
1502    ::memcpy(piTempBlockY, piRefY, sizeof(Pel)*uiWidth);
1503    piTempBlockY += uiWidth;
1504    piRefY += iRefStride;
1505  }
1506}
1507#endif
1508
1509Void TComPrediction::motionCompensation ( TComDataCU* pcCU, TComYuv* pcYuvPred, RefPicList eRefPicList, Int iPartIdx, Bool bPrdDepthMap )
1510{
1511  Int         iWidth;
1512  Int         iHeight;
1513  UInt        uiPartAddr;
1514
1515  if ( iPartIdx >= 0 )
1516  {
1517    pcCU->getPartIndexAndSize( iPartIdx, uiPartAddr, iWidth, iHeight );
1518
1519#if POZNAN_EIVD
1520        if(pcCU->getMergeIndex(uiPartAddr)==POZNAN_EIVD_MRG_CAND) 
1521        {
1522                motionCompensation_EIVD( pcCU, pcYuvPred, eRefPicList, iPartIdx, bPrdDepthMap );
1523                return;
1524        }
1525#endif
1526
1527    if ( eRefPicList != REF_PIC_LIST_X )
1528    {
1529      xPredInterUni (pcCU, uiPartAddr, iWidth, iHeight, eRefPicList, pcYuvPred, iPartIdx, bPrdDepthMap );
1530#ifdef WEIGHT_PRED
1531      if ( pcCU->getSlice()->getPPS()->getUseWP() )
1532      {
1533        xWeightedPredictionUni( pcCU, pcYuvPred, uiPartAddr, iWidth, iHeight, eRefPicList, pcYuvPred, iPartIdx );
1534      }
1535#endif   
1536    }
1537    else
1538    {
1539      xPredInterBi  (pcCU, uiPartAddr, iWidth, iHeight, pcYuvPred, iPartIdx, bPrdDepthMap );
1540
1541    }
1542    return;
1543  }
1544
1545  for ( iPartIdx = 0; iPartIdx < pcCU->getNumPartInter(); iPartIdx++ )
1546  {
1547    pcCU->getPartIndexAndSize( iPartIdx, uiPartAddr, iWidth, iHeight );
1548
1549#if POZNAN_EIVD
1550        if(pcCU->getMergeIndex(uiPartAddr)==POZNAN_EIVD_MRG_CAND) 
1551        {
1552                motionCompensation_EIVD( pcCU, pcYuvPred, eRefPicList, iPartIdx, bPrdDepthMap );
1553                continue;
1554        }
1555#endif
1556
1557    if ( eRefPicList != REF_PIC_LIST_X )
1558    {
1559      xPredInterUni (pcCU, uiPartAddr, iWidth, iHeight, eRefPicList, pcYuvPred, iPartIdx, bPrdDepthMap );
1560#ifdef WEIGHT_PRED
1561      if ( pcCU->getSlice()->getPPS()->getUseWP() )
1562      {
1563        xWeightedPredictionUni( pcCU, pcYuvPred, uiPartAddr, iWidth, iHeight, eRefPicList, pcYuvPred, iPartIdx );
1564      }
1565#endif
1566    }
1567    else
1568    {
1569      xPredInterBi  (pcCU, uiPartAddr, iWidth, iHeight, pcYuvPred, iPartIdx, bPrdDepthMap );
1570    }
1571  }
1572  return;
1573}
1574
1575#if POZNAN_EIVD
1576Void TComPrediction::motionCompensation_EIVD ( TComDataCU* pcCU, TComYuv* pcYuvPred, RefPicList eRefPicList, Int iPartIdx, Bool bPrdDepthMap )
1577{
1578  if(!pcCU->getSlice()->getMP()->isEIVDEnabled()) return;
1579
1580  Int         iPartIdxOrg = iPartIdx;
1581  Int         iWidth;
1582  Int         iHeight;
1583  UInt        uiPartAddr;
1584
1585  Int             x,y;
1586  Int             px,py,iCUBaseX,iCUBaseY;
1587  Int             ref_frame0, ref_frame1;
1588  Int             ref_frame0_idx, ref_frame1_idx;
1589  TComMv          mv0,mv1;
1590 
1591  Int             ref_frame0_idx_2nd, ref_frame1_idx_2nd;
1592  TComMv          mv0_2nd,mv1_2nd;
1593
1594  Pel* piDstCb;
1595  Pel* piDstCr;
1596  Pel aiUTab[MAX_CU_SIZE];
1597  Pel aiVTab[MAX_CU_SIZE];
1598  Pel iULast;
1599  Pel iVLast;
1600  Pel iTemp;
1601
1602  TComMP* pcMP = pcCU->getSlice()->getMP();
1603  UInt uiViewId = pcCU->getSlice()->getSPS()->getViewId();
1604  Bool bIsDepth = pcCU->getSlice()->getSPS()->isDepth();
1605
1606#if POZNAN_EIVD_CALC_PRED_DATA
1607  UInt uiPointCnt;
1608#endif
1609   
1610  for ( iPartIdx = 0; iPartIdx < pcCU->getNumPartInter(); iPartIdx++ )
1611  {
1612        if ( iPartIdxOrg >= 0 ) iPartIdx = iPartIdxOrg;
1613
1614    pcCU->getPartIndexAndSize( iPartIdx, uiPartAddr, iWidth, iHeight );
1615
1616        //get motion data used for no-MP predicted points
1617#if POZNAN_EIVD_CALC_PRED_DATA
1618        ref_frame0_idx_2nd = pcCU->getCUMvField2nd(REF_PIC_LIST_0)->getRefIdx(uiPartAddr);
1619        mv0_2nd = pcCU->getCUMvField2nd( REF_PIC_LIST_0 )->getMv( uiPartAddr );
1620
1621        ref_frame1_idx_2nd = pcCU->getCUMvField2nd(REF_PIC_LIST_1)->getRefIdx(uiPartAddr);
1622        mv1_2nd = pcCU->getCUMvField2nd( REF_PIC_LIST_1 )->getMv( uiPartAddr );
1623#else
1624        ref_frame0_idx_2nd = pcCU->getCUMvField(REF_PIC_LIST_0)->getRefIdx(uiPartAddr);
1625        mv0_2nd = pcCU->getCUMvField( REF_PIC_LIST_0 )->getMv( uiPartAddr );
1626
1627        ref_frame1_idx_2nd = pcCU->getCUMvField(REF_PIC_LIST_1)->getRefIdx(uiPartAddr);
1628        mv1_2nd = pcCU->getCUMvField( REF_PIC_LIST_1 )->getMv( uiPartAddr );
1629#endif
1630
1631        iCUBaseX = pcCU->getCUPelX()+g_auiRasterToPelX[ g_auiZscanToRaster[uiPartAddr] ];
1632        iCUBaseY = pcCU->getCUPelY()+g_auiRasterToPelY[ g_auiZscanToRaster[uiPartAddr] ];
1633
1634#if POZNAN_EIVD_CALC_PRED_DATA
1635        uiPointCnt = 0;
1636#endif
1637
1638        for( py = 0; py < iHeight; py++)
1639        {
1640                for( px = 0; px < iWidth; px++)
1641                {
1642                        x = iCUBaseX+px;
1643                        y = iCUBaseY+py;
1644
1645                        pcMP->getEIVDPredData(pcCU, x, y, ref_frame0, ref_frame0_idx, mv0, ref_frame0_idx_2nd, mv0_2nd, 
1646                                                                                ref_frame1, ref_frame1_idx, mv1, ref_frame1_idx_2nd, mv1_2nd);
1647
1648                        pcCU->getCUMvField(REF_PIC_LIST_0)->setRefIdx(ref_frame0_idx, uiPartAddr);
1649                        pcCU->getCUMvField( REF_PIC_LIST_0 )->setMv( mv0, uiPartAddr );
1650
1651                        pcCU->getCUMvField(REF_PIC_LIST_1)->setRefIdx(ref_frame1_idx, uiPartAddr);
1652                        pcCU->getCUMvField( REF_PIC_LIST_1 )->setMv( mv1, uiPartAddr );
1653
1654                        if ( eRefPicList != REF_PIC_LIST_X )
1655                        {
1656                          xPredInterUni_EIVD (pcCU, uiPartAddr, px, py, eRefPicList, pcYuvPred, iPartIdx, bPrdDepthMap );
1657#ifdef WEIGHT_PRED
1658                          if ( pcCU->getSlice()->getPPS()->getUseWP() )
1659                          {
1660                                xWeightedPredictionUni_EIVD( pcCU, pcYuvPred, uiPartAddr, px, py, eRefPicList, pcYuvPred, iPartIdx );
1661                          }
1662#endif 
1663                        }
1664                        else
1665                        {
1666                          xPredInterBi_EIVD  (pcCU, uiPartAddr, px, py, pcYuvPred, iPartIdx, bPrdDepthMap );
1667                        }                       
1668
1669                        if(!pcCU->getSlice()->getSPS()->isDepth()) // Chroma check only for non depth
1670                        {
1671                        piDstCb = pcYuvPred->getCbAddr( uiPartAddr ) + (py>>1)*pcYuvPred->getCStride();
1672                        piDstCr = pcYuvPred->getCrAddr( uiPartAddr ) + (py>>1)*pcYuvPred->getCStride();
1673
1674                        //Chroma decimation 16x16 -> 8x8:
1675                        if(py%2 && px%2)
1676                        {
1677                                iTemp = (aiUTab[px-1] + aiUTab[px] + iULast + piDstCb[px>>1] + 2)>>2;
1678                                aiUTab[px-1] = iULast;
1679                                iULast = piDstCb[px>>1];
1680                                piDstCb[px>>1] = iTemp;
1681
1682                                iTemp = (aiVTab[px-1] + aiVTab[px] + iVLast + piDstCr[px>>1] + 2)>>2;
1683                                aiVTab[px-1] = iVLast;
1684                                iVLast = piDstCr[px>>1];
1685                                piDstCr[px>>1] = iTemp;
1686                        }
1687                        else
1688                        {
1689                                aiUTab[(px==0)? iWidth-1 : (px-1)] = iULast;   
1690                                iULast = piDstCb[px>>1];
1691
1692                                aiVTab[(px==0)? iWidth-1 : (px-1)] = iVLast;                           
1693                                iVLast = piDstCr[px>>1];
1694                        }       
1695                        }
1696
1697#if !POZNAN_EIVD_COMPRESS_ME_DATA
1698                        //save motion data for every CU point
1699                        pcMP->setL0RefPOC(uiViewId,bIsDepth,x,y,ref_frame0);
1700                        pcMP->setL0MvX(uiViewId,bIsDepth,x,y,mv0.getHor());
1701                        pcMP->setL0MvY(uiViewId,bIsDepth,x,y,mv0.getVer());
1702
1703                        pcMP->setL1RefPOC(uiViewId,bIsDepth,x,y,ref_frame1);
1704                        pcMP->setL1MvX(uiViewId,bIsDepth,x,y,mv1.getHor());
1705                        pcMP->setL1MvY(uiViewId,bIsDepth,x,y,mv1.getVer());
1706#endif
1707
1708#if POZNAN_EIVD_CALC_PRED_DATA
1709                        pcMP->getTempL0RefIdx()[uiPointCnt] = ref_frame0_idx;
1710                        pcMP->getTempL0MvX()[uiPointCnt] = mv0.getHor();
1711                        pcMP->getTempL0MvY()[uiPointCnt] = mv0.getVer();
1712
1713                        pcMP->getTempL1RefIdx()[uiPointCnt] = ref_frame1_idx;
1714                        pcMP->getTempL1MvX()[uiPointCnt] = mv1.getHor();
1715                        pcMP->getTempL1MvY()[uiPointCnt] = mv1.getVer();                       
1716                       
1717                        uiPointCnt++;
1718#endif
1719
1720                }
1721        }
1722
1723        //set motion data representing CU with EIVD
1724        PartSize ePartSize = pcCU->getPartitionSize( uiPartAddr ); //PartSize ePartSize = pcCU->getPartitionSize( 0 );
1725#if POZNAN_EIVD_CALC_PRED_DATA
1726        pcMP->xCalcEIVDPredData(uiPointCnt, ref_frame0_idx, mv0, ref_frame1_idx, mv1);
1727       
1728        pcCU->getCUMvField( REF_PIC_LIST_0 )->setAllMvField( mv0, ref_frame0_idx, ePartSize, uiPartAddr, iPartIdx, 0 );
1729        //pcCU->getCUMvField(REF_PIC_LIST_0)->setRefIdx(ref_frame0_idx,uiPartAddr);
1730        //pcCU->getCUMvField( REF_PIC_LIST_0 )->setMv(mv0, uiPartAddr);
1731       
1732        pcCU->getCUMvField( REF_PIC_LIST_1 )->setAllMvField( mv1, ref_frame1_idx, ePartSize, uiPartAddr, iPartIdx, 0 );
1733        //pcCU->getCUMvField(REF_PIC_LIST_1)->setRefIdx(ref_frame1_idx,uiPartAddr);
1734        //pcCU->getCUMvField( REF_PIC_LIST_1 )->setMv(mv1, uiPartAddr);
1735#else
1736        pcCU->getCUMvField( REF_PIC_LIST_0 )->setAllMvField( mv0_2nd, ref_frame0_idx_2nd, ePartSize, uiPartAddr, iPartIdx, 0 );
1737        //pcCU->getCUMvField(REF_PIC_LIST_0)->setRefIdx(ref_frame0_idx_2nd,uiPartAddr);
1738        //pcCU->getCUMvField( REF_PIC_LIST_0 )->setMv(mv0_2nd, uiPartAddr);
1739        //pcCU->getCUMvField( REF_PIC_LIST_0 )->setMv(mv0.setZero(), uiPartAddr);
1740
1741        pcCU->getCUMvField( REF_PIC_LIST_1 )->setAllMvField( mv1_2nd, ref_frame1_idx_2nd, ePartSize, uiPartAddr, iPartIdx, 0 );
1742        //pcCU->getCUMvField(REF_PIC_LIST_1)->setRefIdx(ref_frame1_idx_2nd,uiPartAddr);
1743        //pcCU->getCUMvField( REF_PIC_LIST_1 )->setMv(mv1_2nd, uiPartAddr);
1744        //pcCU->getCUMvField( REF_PIC_LIST_1 )->setMv(mv1.setZero(), uiPartAddr);
1745#endif
1746
1747        if ( iPartIdxOrg >= 0 ) break;
1748  }
1749  return;
1750}
1751#endif
1752
1753#if HIGH_ACCURACY_BI
1754#if DEPTH_MAP_GENERATION
1755Void TComPrediction::xPredInterUni ( TComDataCU* pcCU, UInt uiPartAddr, Int iWidth, Int iHeight, RefPicList eRefPicList, TComYuv*& rpcYuvPred, Int iPartIdx, Bool bPrdDepthMap, Bool bi )
1756#else
1757Void TComPrediction::xPredInterUni ( TComDataCU* pcCU, UInt uiPartAddr, Int iWidth, Int iHeight, RefPicList eRefPicList, TComYuv*& rpcYuvPred, Int iPartIdx, Bool bi )
1758#endif
1759#else
1760#if DEPTH_MAP_GENERATION
1761Void TComPrediction::xPredInterUni ( TComDataCU* pcCU, UInt uiPartAddr, Int iWidth, Int iHeight, RefPicList eRefPicList, TComYuv*& rpcYuvPred, Int iPartIdx, Bool bPrdDepthMap )
1762#else
1763Void TComPrediction::xPredInterUni ( TComDataCU* pcCU, UInt uiPartAddr, Int iWidth, Int iHeight, RefPicList eRefPicList, TComYuv*& rpcYuvPred, Int iPartIdx )
1764#endif
1765#endif
1766{
1767  Int         iRefIdx     = pcCU->getCUMvField( eRefPicList )->getRefIdx( uiPartAddr );           assert (iRefIdx >= 0);
1768  TComMv      cMv         = pcCU->getCUMvField( eRefPicList )->getMv( uiPartAddr );
1769  pcCU->clipMv(cMv);
1770
1771#if DEPTH_MAP_GENERATION
1772  if( bPrdDepthMap )
1773  {
1774#if HIGH_ACCURACY_BI
1775    UInt uiRShift = ( bi ? 14-g_uiBitDepth-g_uiBitIncrement : 0 );
1776#else
1777    UInt uiRShift = 0;
1778#endif
1779    xPredInterPrdDepthMap( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPredDepthMap(), uiPartAddr, &cMv, iWidth, iHeight, rpcYuvPred, uiRShift, PDM_DEPTH_MAP_MCP_FILTER );
1780    return;
1781  }
1782#endif
1783
1784#if HHI_FULL_PEL_DEPTH_MAP_MV_ACC
1785  if( pcCU->getSlice()->getSPS()->isDepth() )
1786  {
1787#if HIGH_ACCURACY_BI
1788    UInt uiRShift = ( bi ? 14-g_uiBitDepth-g_uiBitIncrement : 0 );
1789#else
1790    UInt uiRShift = 0;
1791#endif
1792    xPredInterPrdDepthMap( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec(), uiPartAddr, &cMv, iWidth, iHeight, rpcYuvPred, uiRShift, 2 );
1793  }
1794  else
1795  {
1796#endif
1797#if HIGH_ACCURACY_BI
1798  if(!bi)
1799  {
1800    xPredInterLumaBlk ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec()    , uiPartAddr, &cMv, iWidth, iHeight, rpcYuvPred );
1801  }
1802  else
1803  {
1804    xPredInterLumaBlk_ha  ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec()    , uiPartAddr, &cMv, iWidth, iHeight, rpcYuvPred );
1805  }
1806#else
1807  xPredInterLumaBlk       ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec(), uiPartAddr, &cMv, iWidth, iHeight, rpcYuvPred );
1808#endif
1809#if HHI_FULL_PEL_DEPTH_MAP_MV_ACC
1810  }
1811#endif
1812
1813#if HIGH_ACCURACY_BI
1814  if (!bi)
1815  {
1816    xPredInterChromaBlk     ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec(), uiPartAddr, &cMv, iWidth, iHeight, rpcYuvPred );
1817  }
1818  else
1819  {
1820    xPredInterChromaBlk_ha ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec()    , uiPartAddr, &cMv, iWidth, iHeight, rpcYuvPred );
1821  }
1822#else
1823  xPredInterChromaBlk     ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec(), uiPartAddr, &cMv, iWidth, iHeight, rpcYuvPred );
1824#endif
1825}
1826
1827Void TComPrediction::xPredInterBi ( TComDataCU* pcCU, UInt uiPartAddr, Int iWidth, Int iHeight, TComYuv*& rpcYuvPred, Int iPartIdx, Bool bPrdDepthMap )
1828{
1829  TComYuv* pcMbYuv;
1830  Int      iRefIdx[2] = {-1, -1};
1831
1832  for ( Int iRefList = 0; iRefList < 2; iRefList++ )
1833  {
1834    RefPicList eRefPicList = (iRefList ? REF_PIC_LIST_1 : REF_PIC_LIST_0);
1835    iRefIdx[iRefList] = pcCU->getCUMvField( eRefPicList )->getRefIdx( uiPartAddr );
1836
1837    if ( iRefIdx[iRefList] < 0 )
1838    {
1839      continue;
1840    }
1841
1842    assert( iRefIdx[iRefList] < pcCU->getSlice()->getNumRefIdx(eRefPicList) );
1843
1844    pcMbYuv = &m_acYuvPred[iRefList];
1845#if HIGH_ACCURACY_BI
1846    if( pcCU->getCUMvField( REF_PIC_LIST_0 )->getRefIdx( uiPartAddr ) >= 0 && pcCU->getCUMvField( REF_PIC_LIST_1 )->getRefIdx( uiPartAddr ) >= 0 )
1847#if DEPTH_MAP_GENERATION
1848      xPredInterUni ( pcCU, uiPartAddr, iWidth, iHeight, eRefPicList, pcMbYuv, iPartIdx, bPrdDepthMap, true );
1849#else
1850      xPredInterUni ( pcCU, uiPartAddr, iWidth, iHeight, eRefPicList, pcMbYuv, iPartIdx, true );
1851#endif
1852    else
1853#if DEPTH_MAP_GENERATION
1854     xPredInterUni ( pcCU, uiPartAddr, iWidth, iHeight, eRefPicList, pcMbYuv, iPartIdx, bPrdDepthMap );
1855#else
1856     xPredInterUni ( pcCU, uiPartAddr, iWidth, iHeight, eRefPicList, pcMbYuv, iPartIdx );
1857#endif
1858#else
1859#if DEPTH_MAP_GENERATION
1860    xPredInterUni ( pcCU, uiPartAddr, iWidth, iHeight, eRefPicList, pcMbYuv, iPartIdx, bPrdDepthMap );
1861#else
1862    xPredInterUni ( pcCU, uiPartAddr, iWidth, iHeight, eRefPicList, pcMbYuv, iPartIdx );
1863#endif
1864#endif
1865  }
1866
1867#ifdef WEIGHT_PRED
1868  if ( pcCU->getSlice()->getPPS()->getWPBiPredIdc() )
1869  {
1870    xWeightedPredictionBi( pcCU, &m_acYuvPred[0], &m_acYuvPred[1], iRefIdx[0], iRefIdx[1], uiPartAddr, iWidth, iHeight, rpcYuvPred );
1871  }
1872  else
1873#endif
1874  xWeightedAverage( pcCU, &m_acYuvPred[0], &m_acYuvPred[1], iRefIdx[0], iRefIdx[1], uiPartAddr, iWidth, iHeight, rpcYuvPred );
1875}
1876
1877
1878Void
1879TComPrediction::xPredInterPrdDepthMap( TComDataCU* pcCU, TComPicYuv* pcPicYuvRef, UInt uiPartAddr, TComMv* pcMv, Int iWidth, Int iHeight, TComYuv*& rpcYuv, UInt uiRShift, UInt uiFilterMode ) // 0:std, 1:bilin, 2:nearest neighbour
1880{
1881  AOF( uiFilterMode <= 2 );
1882
1883  Int     iFPelMask   = ~3;
1884  Int     iRefStride  = pcPicYuvRef->getStride();
1885  Int     iDstStride  = rpcYuv->getStride();
1886  Int     iHor        = ( uiFilterMode == 2 ? ( pcMv->getHor() + 2 ) & iFPelMask : pcMv->getHor() );
1887  Int     iVer        = ( uiFilterMode == 2 ? ( pcMv->getVer() + 2 ) & iFPelMask : pcMv->getVer() );
1888#if HHI_FULL_PEL_DEPTH_MAP_MV_ACC
1889  if( pcCU->getSlice()->getSPS()->isDepth() )
1890  {
1891    assert( uiFilterMode == 2 );
1892    iHor = pcMv->getHor() * 4;
1893    iVer = pcMv->getVer() * 4;
1894  }
1895#endif
1896  Int     iRefOffset  = ( iHor >> 2 ) + ( iVer >> 2 ) * iRefStride;
1897  Int     ixFrac      = iHor & 0x3;
1898  Int     iyFrac      = iVer & 0x3;
1899  Pel*    piRefY      = pcPicYuvRef->getLumaAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
1900  Pel*    piDstY      = rpcYuv->getLumaAddr( uiPartAddr );
1901
1902  //  Integer position
1903  if( ixFrac == 0 && iyFrac == 0 )
1904  {
1905    for( Int y = 0; y < iHeight; y++, piDstY += iDstStride, piRefY += iRefStride )
1906    {
1907      for( Int x = 0; x < iWidth; x++ )
1908      {
1909        piDstY[ x ] = piRefY[ x ] << uiRShift;
1910      }
1911    }
1912    return;
1913  }
1914
1915  // bi-linear interpolation
1916  if( uiFilterMode == 1 )
1917  {
1918    Int   iW00    = ( 4 - ixFrac ) * ( 4 - iyFrac );
1919    Int   iW01    = (     ixFrac ) * ( 4 - iyFrac );
1920    Int   iW10    = ( 4 - ixFrac ) * (     iyFrac );
1921    Int   iW11    = (     ixFrac ) * (     iyFrac );
1922    Pel*  piRefY1 = piRefY + iRefStride;
1923    for( Int y = 0; y < iHeight; y++, piDstY += iDstStride, piRefY += iRefStride, piRefY1 += iRefStride )
1924    {
1925      for( Int x = 0; x < iWidth; x++ )
1926      {
1927        Int iSV     = iW00 * piRefY [ x ] + iW01 * piRefY [ x + 1 ]
1928                    + iW10 * piRefY1[ x ] + iW11 * piRefY1[ x + 1 ];
1929        iSV       <<= uiRShift;
1930        piDstY[ x ] = ( iSV + 8 ) >> 4;
1931      }
1932    }
1933    return;
1934  }
1935
1936  xPredInterLumaBlk( pcCU, pcPicYuvRef, uiPartAddr, pcMv, iWidth, iHeight, rpcYuv );
1937  return;
1938}
1939
1940
1941
1942#if HIGH_ACCURACY_BI
1943
1944Void  TComPrediction::xPredInterLumaBlk_ha( TComDataCU* pcCU, TComPicYuv* pcPicYuvRef, UInt uiPartAddr, TComMv* pcMv, Int iWidth, Int iHeight, TComYuv*& rpcYuv )
1945{
1946  Int     iRefStride = pcPicYuvRef->getStride();
1947  Int     iDstStride = rpcYuv->getStride();
1948
1949  Int     iRefOffset = ( pcMv->getHor() >> 2 ) + ( pcMv->getVer() >> 2 ) * iRefStride;
1950  Pel*    piRefY     = pcPicYuvRef->getLumaAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
1951
1952  Int     ixFrac  = pcMv->getHor() & 0x3;
1953  Int     iyFrac  = pcMv->getVer() & 0x3;
1954
1955  Pel* piDstY = rpcYuv->getLumaAddr( uiPartAddr );
1956    UInt shiftNum = 14-g_uiBitDepth-g_uiBitIncrement;
1957  //  Integer point
1958  if ( ixFrac == 0 && iyFrac == 0 )
1959  {
1960    for ( Int y = 0; y < iHeight; y++ )
1961    {
1962      for(Int x=0; x<iWidth; x++)
1963        piDstY[x] = piRefY[x]<<shiftNum;
1964      piDstY += iDstStride;
1965      piRefY += iRefStride;
1966    }
1967    return;
1968  }
1969
1970  //  Half-pel horizontal
1971  if ( ixFrac == 2 && iyFrac == 0 )
1972  {
1973    xCTI_FilterHalfHor_ha ( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
1974    return;
1975  }
1976
1977  //  Half-pel vertical
1978  if ( ixFrac == 0 && iyFrac == 2 )
1979  {
1980    xCTI_FilterHalfVer_ha ( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
1981    return;
1982  }
1983
1984  Int   iExtStride = m_iYuvExtStride;//m_cYuvExt.getStride();
1985  Int*  piExtY     = m_piYuvExt;//m_cYuvExt.getLumaAddr();
1986
1987  //  Half-pel center
1988  if ( ixFrac == 2 && iyFrac == 2 )
1989  {
1990    xCTI_FilterHalfVer (piRefY - 3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
1991    xCTI_FilterHalfHor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
1992    return;
1993  }
1994
1995  //  Quater-pel horizontal
1996  if ( iyFrac == 0)
1997  {
1998    if ( ixFrac == 1)
1999    {
2000      xCTI_FilterQuarter0Hor_ha( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2001      return;
2002    }
2003    if ( ixFrac == 3)
2004    {
2005      xCTI_FilterQuarter1Hor_ha( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2006      return;
2007    }
2008  }
2009  if ( iyFrac == 2 )
2010  {
2011    if ( ixFrac == 1)
2012    {
2013      xCTI_FilterHalfVer (piRefY -3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
2014      xCTI_FilterQuarter0Hor_ha (piExtY + 3,  iExtStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2015      return;
2016    }
2017    if ( ixFrac == 3)
2018    {
2019      xCTI_FilterHalfVer (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2020      xCTI_FilterQuarter1Hor_ha (piExtY + 3,  iExtStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2021      return;
2022    }
2023  }
2024
2025  //  Quater-pel vertical
2026  if( ixFrac == 0 )
2027  {
2028    if( iyFrac == 1 )
2029    {
2030      xCTI_FilterQuarter0Ver_ha( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2031      return;
2032    }
2033    if( iyFrac == 3 )
2034    {
2035      xCTI_FilterQuarter1Ver_ha( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2036      return;
2037    }
2038  }
2039
2040  if( ixFrac == 2 )
2041  {
2042    if( iyFrac == 1 )
2043    {
2044      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2045      xCTI_FilterHalfHor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2046
2047      return;
2048    }
2049    if( iyFrac == 3 )
2050    {
2051      xCTI_FilterQuarter1Ver (piRefY -3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2052      xCTI_FilterHalfHor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2053      return;
2054    }
2055  }
2056
2057  /// Quarter-pel center
2058  if ( iyFrac == 1)
2059  {
2060    if ( ixFrac == 1)
2061    {
2062      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2063      xCTI_FilterQuarter0Hor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2064      return;
2065    }
2066    if ( ixFrac == 3)
2067    {
2068      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
2069      xCTI_FilterQuarter1Hor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2070
2071      return;
2072    }
2073  }
2074  if ( iyFrac == 3 )
2075  {
2076    if ( ixFrac == 1)
2077    {
2078      xCTI_FilterQuarter1Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2079      xCTI_FilterQuarter0Hor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2080      return;
2081    }
2082    if ( ixFrac == 3)
2083    {
2084      xCTI_FilterQuarter1Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2085      xCTI_FilterQuarter1Hor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2086      return;
2087    }
2088  }
2089}
2090
2091#endif
2092
2093Void  TComPrediction::xPredInterLumaBlk( TComDataCU* pcCU, TComPicYuv* pcPicYuvRef, UInt uiPartAddr, TComMv* pcMv, Int iWidth, Int iHeight, TComYuv*& rpcYuv )
2094{
2095  Int     iRefStride = pcPicYuvRef->getStride();
2096  Int     iDstStride = rpcYuv->getStride();
2097
2098  Int     iRefOffset = ( pcMv->getHor() >> 2 ) + ( pcMv->getVer() >> 2 ) * iRefStride;
2099  Pel*    piRefY     = pcPicYuvRef->getLumaAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2100
2101  Int     ixFrac  = pcMv->getHor() & 0x3;
2102  Int     iyFrac  = pcMv->getVer() & 0x3;
2103
2104  Pel* piDstY = rpcYuv->getLumaAddr( uiPartAddr );
2105
2106  //  Integer point
2107  if ( ixFrac == 0 && iyFrac == 0 )
2108  {
2109    for ( Int y = 0; y < iHeight; y++ )
2110    {
2111      ::memcpy(piDstY, piRefY, sizeof(Pel)*iWidth);
2112      piDstY += iDstStride;
2113      piRefY += iRefStride;
2114    }
2115    return;
2116  }
2117
2118  //  Half-pel horizontal
2119  if ( ixFrac == 2 && iyFrac == 0 )
2120  {
2121    xCTI_FilterHalfHor ( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2122    return;
2123  }
2124
2125  //  Half-pel vertical
2126  if ( ixFrac == 0 && iyFrac == 2 )
2127  {
2128    xCTI_FilterHalfVer ( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2129    return;
2130  }
2131
2132  Int   iExtStride = m_iYuvExtStride;//m_cYuvExt.getStride();
2133  Int*  piExtY     = m_piYuvExt;//m_cYuvExt.getLumaAddr();
2134
2135  //  Half-pel center
2136  if ( ixFrac == 2 && iyFrac == 2 )
2137  {
2138
2139    xCTI_FilterHalfVer (piRefY - 3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
2140    xCTI_FilterHalfHor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2141    return;
2142  }
2143
2144  //  Quater-pel horizontal
2145  if ( iyFrac == 0)
2146  {
2147    if ( ixFrac == 1)
2148    {
2149      xCTI_FilterQuarter0Hor( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2150      return;
2151    }
2152    if ( ixFrac == 3)
2153    {
2154      xCTI_FilterQuarter1Hor( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2155      return;
2156    }
2157  }
2158  if ( iyFrac == 2 )
2159  {
2160    if ( ixFrac == 1)
2161    {
2162      xCTI_FilterHalfVer (piRefY -3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
2163      xCTI_FilterQuarter0Hor (piExtY + 3,  iExtStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2164      return;
2165    }
2166    if ( ixFrac == 3)
2167    {
2168      xCTI_FilterHalfVer (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2169      xCTI_FilterQuarter1Hor (piExtY + 3,  iExtStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2170      return;
2171    }
2172  }
2173
2174  //  Quater-pel vertical
2175  if( ixFrac == 0 )
2176  {
2177    if( iyFrac == 1 )
2178    {
2179      xCTI_FilterQuarter0Ver( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2180      return;
2181    }
2182    if( iyFrac == 3 )
2183    {
2184      xCTI_FilterQuarter1Ver( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2185      return;
2186    }
2187  }
2188
2189  if( ixFrac == 2 )
2190  {
2191    if( iyFrac == 1 )
2192    {
2193      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2194      xCTI_FilterHalfHor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2195      return;
2196    }
2197    if( iyFrac == 3 )
2198    {
2199      xCTI_FilterQuarter1Ver (piRefY -3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2200      xCTI_FilterHalfHor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2201      return;
2202    }
2203  }
2204
2205  /// Quarter-pel center
2206  if ( iyFrac == 1)
2207  {
2208    if ( ixFrac == 1)
2209    {
2210      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2211      xCTI_FilterQuarter0Hor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2212      return;
2213    }
2214    if ( ixFrac == 3)
2215    {
2216      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
2217      xCTI_FilterQuarter1Hor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2218      return;
2219    }
2220  }
2221  if ( iyFrac == 3 )
2222  {
2223    if ( ixFrac == 1)
2224    {
2225      xCTI_FilterQuarter1Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2226      xCTI_FilterQuarter0Hor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2227      return;
2228    }
2229    if ( ixFrac == 3)
2230    {
2231      xCTI_FilterQuarter1Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2232      xCTI_FilterQuarter1Hor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2233      return;
2234    }
2235  }
2236}
2237
2238#if HIGH_ACCURACY_BI
2239Void TComPrediction::xPredInterChromaBlk_ha( TComDataCU* pcCU, TComPicYuv* pcPicYuvRef, UInt uiPartAddr, TComMv* pcMv, Int iWidth, Int iHeight, TComYuv*& rpcYuv )
2240{
2241  Int     iRefStride  = pcPicYuvRef->getCStride();
2242  Int     iDstStride  = rpcYuv->getCStride();
2243
2244  Int     iRefOffset  = (pcMv->getHor() >> 3) + (pcMv->getVer() >> 3) * iRefStride;
2245
2246  Pel*    piRefCb     = pcPicYuvRef->getCbAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2247  Pel*    piRefCr     = pcPicYuvRef->getCrAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2248
2249  Pel* piDstCb = rpcYuv->getCbAddr( uiPartAddr );
2250  Pel* piDstCr = rpcYuv->getCrAddr( uiPartAddr );
2251
2252  Int     ixFrac  = pcMv->getHor() & 0x7;
2253  Int     iyFrac  = pcMv->getVer() & 0x7;
2254  UInt    uiCWidth  = iWidth  >> 1;
2255  UInt    uiCHeight = iHeight >> 1;
2256
2257  xDCTIF_FilterC_ha(piRefCb, iRefStride,piDstCb,iDstStride,uiCWidth,uiCHeight, iyFrac, ixFrac);
2258  xDCTIF_FilterC_ha(piRefCr, iRefStride,piDstCr,iDstStride,uiCWidth,uiCHeight, iyFrac, ixFrac);
2259  return;
2260}
2261#endif
2262
2263//--
2264Void TComPrediction::xPredInterChromaBlk( TComDataCU* pcCU, TComPicYuv* pcPicYuvRef, UInt uiPartAddr, TComMv* pcMv, Int iWidth, Int iHeight, TComYuv*& rpcYuv )
2265{
2266  Int     iRefStride  = pcPicYuvRef->getCStride();
2267  Int     iDstStride  = rpcYuv->getCStride();
2268
2269  Int     iRefOffset  = (pcMv->getHor() >> 3) + (pcMv->getVer() >> 3) * iRefStride;
2270
2271  Pel*    piRefCb     = pcPicYuvRef->getCbAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2272  Pel*    piRefCr     = pcPicYuvRef->getCrAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2273
2274  Pel* piDstCb = rpcYuv->getCbAddr( uiPartAddr );
2275  Pel* piDstCr = rpcYuv->getCrAddr( uiPartAddr );
2276
2277  Int     ixFrac  = pcMv->getHor() & 0x7;
2278  Int     iyFrac  = pcMv->getVer() & 0x7;
2279  UInt    uiCWidth  = iWidth  >> 1;
2280  UInt    uiCHeight = iHeight >> 1;
2281
2282  xDCTIF_FilterC(piRefCb, iRefStride,piDstCb,iDstStride,uiCWidth,uiCHeight, iyFrac, ixFrac);
2283  xDCTIF_FilterC(piRefCr, iRefStride,piDstCr,iDstStride,uiCWidth,uiCHeight, iyFrac, ixFrac);
2284  return;
2285}
2286
2287
2288
2289#if POZNAN_EIVD
2290
2291#if HIGH_ACCURACY_BI
2292Void TComPrediction::xPredInterUni_EIVD ( TComDataCU* pcCU, UInt uiPartAddr, Int iPosX, Int iPosY, RefPicList eRefPicList, TComYuv*& rpcYuvPred, Int iPartIdx, Bool bPrdDepthMap, Bool bi )
2293#else
2294Void TComPrediction::xPredInterUni_EIVD ( TComDataCU* pcCU, UInt uiPartAddr, Int iPosX, Int iPosY, RefPicList eRefPicList, TComYuv*& rpcYuvPred, Int iPartIdx, Bool bPrdDepthMap )
2295#endif
2296{
2297  Int         iRefIdx     = pcCU->getCUMvField( eRefPicList )->getRefIdx( uiPartAddr );           assert (iRefIdx >= 0);
2298  TComMv      cMv         = pcCU->getCUMvField( eRefPicList )->getMv( uiPartAddr );
2299  pcCU->clipMv(cMv);
2300
2301#if DEPTH_MAP_GENERATION
2302  if( bPrdDepthMap )
2303  {
2304#if HIGH_ACCURACY_BI
2305    UInt uiRShift = ( bi ? 14-g_uiBitDepth-g_uiBitIncrement : 0 );
2306#else
2307    UInt uiRShift = 0;
2308#endif
2309    xPredInterPrdDepthMap_EIVD( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPredDepthMap(), uiPartAddr, &cMv, iPosX, iPosY, rpcYuvPred, uiRShift, PDM_DEPTH_MAP_MCP_FILTER );
2310    return;
2311  }
2312#endif
2313
2314#if HHI_FULL_PEL_DEPTH_MAP_MV_ACC
2315  if( pcCU->getSlice()->getSPS()->isDepth() )
2316  {
2317#if HIGH_ACCURACY_BI
2318    UInt uiRShift = ( bi ? 14-g_uiBitDepth-g_uiBitIncrement : 0 );
2319#else
2320    UInt uiRShift = 0;
2321#endif
2322    xPredInterPrdDepthMap_EIVD( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec(), uiPartAddr, &cMv, iPosX, iPosY, rpcYuvPred, uiRShift, 2 );
2323  }
2324  else
2325  {
2326#endif
2327#if HIGH_ACCURACY_BI
2328  if(!bi)
2329  {
2330    xPredInterLumaBlk_EIVD ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec(), uiPartAddr, &cMv, iPosX, iPosY, rpcYuvPred );
2331  }
2332  else
2333  {
2334    xPredInterLumaBlk_EIVD_ha  ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec(), uiPartAddr, &cMv, iPosX, iPosY, rpcYuvPred );
2335  }
2336#else
2337  xPredInterLumaBlk_EIVD       ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec(), uiPartAddr, &cMv, iPosX, iPosY, rpcYuvPred );
2338#endif
2339#if HHI_FULL_PEL_DEPTH_MAP_MV_ACC
2340  }
2341#endif
2342
2343#if HIGH_ACCURACY_BI
2344  if (!bi)
2345  {
2346        xPredInterChromaBlk_EIVD     ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec(), uiPartAddr, &cMv, iPosX, iPosY, rpcYuvPred );
2347  }
2348  else
2349  {
2350        xPredInterChromaBlk_EIVD_ha ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec()    , uiPartAddr, &cMv, iPosX, iPosY, rpcYuvPred );
2351  }
2352#else
2353  xPredInterChromaBlk_EIVD     ( pcCU, pcCU->getSlice()->getRefPic( eRefPicList, iRefIdx )->getPicYuvRec(), uiPartAddr, &cMv, iPosX, iPosY, rpcYuvPred );
2354#endif
2355}
2356
2357Void TComPrediction::xPredInterBi_EIVD ( TComDataCU* pcCU, UInt uiPartAddr, Int iPosX, Int iPosY, TComYuv*& rpcYuvPred, Int iPartIdx, Bool bPrdDepthMap )
2358{
2359  TComYuv* pcMbYuv;
2360  Int      iRefIdx[2] = {-1, -1};
2361
2362  for ( Int iRefList = 0; iRefList < 2; iRefList++ )
2363  {
2364    RefPicList eRefPicList = (iRefList ? REF_PIC_LIST_1 : REF_PIC_LIST_0);
2365    iRefIdx[iRefList] = pcCU->getCUMvField( eRefPicList )->getRefIdx( uiPartAddr );
2366
2367    if ( iRefIdx[iRefList] < 0 )
2368    {
2369      continue;
2370    }
2371
2372    assert( iRefIdx[iRefList] < pcCU->getSlice()->getNumRefIdx(eRefPicList) );
2373
2374    pcMbYuv = &m_acYuvPred[iRefList];
2375#if HIGH_ACCURACY_BI
2376    if( pcCU->getCUMvField( REF_PIC_LIST_0 )->getRefIdx( uiPartAddr ) >= 0 && pcCU->getCUMvField( REF_PIC_LIST_1 )->getRefIdx( uiPartAddr ) >= 0 )
2377      xPredInterUni_EIVD ( pcCU, uiPartAddr, iPosX, iPosY, eRefPicList, pcMbYuv, iPartIdx, bPrdDepthMap, true );
2378    else
2379      xPredInterUni_EIVD ( pcCU, uiPartAddr, iPosX, iPosY, eRefPicList, pcMbYuv, iPartIdx, bPrdDepthMap );
2380#else
2381    xPredInterUni_EIVD ( pcCU, uiPartAddr, iPosX, iPosY, eRefPicList, pcMbYuv, iPartIdx, bPrdDepthMap );
2382#endif
2383  }
2384
2385#ifdef WEIGHT_PRED
2386  if ( pcCU->getSlice()->getPPS()->getWPBiPredIdc() )
2387  {
2388    xWeightedPredictionBi_EIVD( pcCU, &m_acYuvPred[0], &m_acYuvPred[1], iRefIdx[0], iRefIdx[1], uiPartAddr, iPosX, iPosY, rpcYuvPred );
2389  }
2390  else
2391#endif
2392    xWeightedAverage_EIVD( pcCU, &m_acYuvPred[0], &m_acYuvPred[1], iRefIdx[0], iRefIdx[1], uiPartAddr, iPosX, iPosY, rpcYuvPred );
2393}
2394
2395Void TComPrediction::xPredInterPrdDepthMap_EIVD( TComDataCU* pcCU, TComPicYuv* pcPicYuvRef, UInt uiPartAddr, TComMv* pcMv, Int iPosX, Int iPosY, TComYuv*& rpcYuv, UInt uiRShift, UInt uiFilterMode ) // 0:std, 1:bilin, 2:nearest neighbour
2396{
2397  AOF( uiFilterMode <= 2 );
2398
2399  Int     iFPelMask   = ~3;
2400  Int     iRefStride  = pcPicYuvRef->getStride();
2401  Int     iDstStride  = rpcYuv->getStride();
2402  Int     iHor        = ( uiFilterMode == 2 ? ( pcMv->getHor() + 2 ) & iFPelMask : pcMv->getHor() );
2403  Int     iVer        = ( uiFilterMode == 2 ? ( pcMv->getVer() + 2 ) & iFPelMask : pcMv->getVer() );
2404#if HHI_FULL_PEL_DEPTH_MAP_MV_ACC
2405  if( pcCU->getSlice()->getSPS()->isDepth() )
2406  {
2407    assert( uiFilterMode == 2 );
2408    iHor = pcMv->getHor() * 4;
2409    iVer = pcMv->getVer() * 4;
2410  }
2411#endif
2412  Int     iRefOffset  = ( iHor >> 2 ) + ( iVer >> 2 ) * iRefStride;
2413  Int     ixFrac      = iHor & 0x3;
2414  Int     iyFrac      = iVer & 0x3;
2415  Pel*    piRefY      = pcPicYuvRef->getLumaAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2416  Pel*    piDstY      = rpcYuv->getLumaAddr( uiPartAddr );
2417
2418  piRefY += iPosY*iRefStride+iPosX;
2419  piDstY += iPosY*iDstStride+iPosX;
2420
2421  //  Integer position
2422  if( ixFrac == 0 && iyFrac == 0 )
2423  {
2424    piDstY[ 0 ] = piRefY[ 0 ] << uiRShift;
2425    return;
2426  }
2427
2428  // bi-linear interpolation
2429  if( uiFilterMode == 1 )
2430  {
2431    Int   iW00    = ( 4 - ixFrac ) * ( 4 - iyFrac );
2432    Int   iW01    = (     ixFrac ) * ( 4 - iyFrac );
2433    Int   iW10    = ( 4 - ixFrac ) * (     iyFrac );
2434    Int   iW11    = (     ixFrac ) * (     iyFrac );
2435    Pel*  piRefY1 = piRefY + iRefStride;
2436    Int iSV     = iW00 * piRefY [ 0 ] + iW01 * piRefY [ 1 ]
2437                + iW10 * piRefY1[ 0 ] + iW11 * piRefY1[ 1 ];
2438    iSV       <<= uiRShift;
2439    piDstY[ 0 ] = ( iSV + 8 ) >> 4;
2440    return;
2441  }
2442
2443  xPredInterLumaBlk_EIVD( pcCU, pcPicYuvRef, uiPartAddr, pcMv, iPosX, iPosY, rpcYuv );
2444  return;
2445}
2446
2447
2448#if HIGH_ACCURACY_BI
2449
2450Void  TComPrediction::xPredInterLumaBlk_EIVD_ha( TComDataCU* pcCU, TComPicYuv* pcPicYuvRef, UInt uiPartAddr, TComMv* pcMv, Int iPosX, Int iPosY, TComYuv*& rpcYuv )
2451{
2452  Int     iRefStride = pcPicYuvRef->getStride();
2453  Int     iDstStride = rpcYuv->getStride();
2454
2455  Int     iRefOffset = ( pcMv->getHor() >> 2 ) + ( pcMv->getVer() >> 2 ) * iRefStride;
2456  Pel*    piRefY     = pcPicYuvRef->getLumaAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2457
2458  Int     ixFrac  = pcMv->getHor() & 0x3;
2459  Int     iyFrac  = pcMv->getVer() & 0x3;
2460
2461  Pel* piDstY = rpcYuv->getLumaAddr( uiPartAddr );
2462  UInt shiftNum = 14-g_uiBitDepth-g_uiBitIncrement;
2463
2464  piDstY += iPosY*iDstStride+iPosX;
2465  piRefY += iPosY*iRefStride+iPosX;
2466
2467  //  Integer point
2468  if ( ixFrac == 0 && iyFrac == 0 )
2469  {
2470    *piDstY = (*piRefY)<<shiftNum;
2471    return;
2472  }
2473
2474  Int iWidth = 1;
2475  Int iHeight = 1;
2476
2477  //  Half-pel horizontal
2478  if ( ixFrac == 2 && iyFrac == 0 )
2479  {
2480    xCTI_FilterHalfHor_ha ( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2481    return;
2482  }
2483
2484  //  Half-pel vertical
2485  if ( ixFrac == 0 && iyFrac == 2 )
2486  {
2487    xCTI_FilterHalfVer_ha ( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2488    return;
2489  }
2490
2491  Int   iExtStride = m_iYuvExtStride;//m_cYuvExt.getStride();
2492  Int*  piExtY     = m_piYuvExt;//m_cYuvExt.getLumaAddr();
2493
2494  //  Half-pel center
2495  if ( ixFrac == 2 && iyFrac == 2 )
2496  {
2497    xCTI_FilterHalfVer (piRefY - 3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
2498    xCTI_FilterHalfHor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2499    return;
2500  }
2501
2502  //  Quater-pel horizontal
2503  if ( iyFrac == 0)
2504  {
2505    if ( ixFrac == 1)
2506    {
2507      xCTI_FilterQuarter0Hor_ha( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2508      return;
2509    }
2510    if ( ixFrac == 3)
2511    {
2512      xCTI_FilterQuarter1Hor_ha( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2513      return;
2514    }
2515  }
2516  if ( iyFrac == 2 )
2517  {
2518    if ( ixFrac == 1)
2519    {
2520      xCTI_FilterHalfVer (piRefY -3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
2521      xCTI_FilterQuarter0Hor_ha (piExtY + 3,  iExtStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2522      return;
2523    }
2524    if ( ixFrac == 3)
2525    {
2526      xCTI_FilterHalfVer (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2527      xCTI_FilterQuarter1Hor_ha (piExtY + 3,  iExtStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2528      return;
2529    }
2530  }
2531
2532  //  Quater-pel vertical
2533  if( ixFrac == 0 )
2534  {
2535    if( iyFrac == 1 )
2536    {
2537      xCTI_FilterQuarter0Ver_ha( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2538      return;
2539    }
2540    if( iyFrac == 3 )
2541    {
2542      xCTI_FilterQuarter1Ver_ha( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2543      return;
2544    }
2545  }
2546
2547  if( ixFrac == 2 )
2548  {
2549    if( iyFrac == 1 )
2550    {
2551      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2552      xCTI_FilterHalfHor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2553
2554      return;
2555    }
2556    if( iyFrac == 3 )
2557    {
2558      xCTI_FilterQuarter1Ver (piRefY -3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2559      xCTI_FilterHalfHor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2560      return;
2561    }
2562  }
2563
2564  /// Quarter-pel center
2565  if ( iyFrac == 1)
2566  {
2567    if ( ixFrac == 1)
2568    {
2569      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2570      xCTI_FilterQuarter0Hor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2571      return;
2572    }
2573    if ( ixFrac == 3)
2574    {
2575      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
2576      xCTI_FilterQuarter1Hor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2577
2578      return;
2579    }
2580  }
2581  if ( iyFrac == 3 )
2582  {
2583    if ( ixFrac == 1)
2584    {
2585      xCTI_FilterQuarter1Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2586      xCTI_FilterQuarter0Hor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2587      return;
2588    }
2589    if ( ixFrac == 3)
2590    {
2591      xCTI_FilterQuarter1Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2592      xCTI_FilterQuarter1Hor_ha (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2593      return;
2594    }
2595  }
2596}
2597
2598#endif
2599
2600Void  TComPrediction::xPredInterLumaBlk_EIVD( TComDataCU* pcCU, TComPicYuv* pcPicYuvRef, UInt uiPartAddr, TComMv* pcMv, Int iPosX, Int iPosY, TComYuv*& rpcYuv )
2601{
2602  Int     iRefStride = pcPicYuvRef->getStride();
2603  Int     iDstStride = rpcYuv->getStride();
2604
2605  Int     iRefOffset = ( pcMv->getHor() >> 2 ) + ( pcMv->getVer() >> 2 ) * iRefStride;
2606  Pel*    piRefY     = pcPicYuvRef->getLumaAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2607
2608  Int     ixFrac  = pcMv->getHor() & 0x3;
2609  Int     iyFrac  = pcMv->getVer() & 0x3;
2610
2611  Pel* piDstY = rpcYuv->getLumaAddr( uiPartAddr );
2612 
2613  piDstY += iPosY*iDstStride+iPosX;
2614  piRefY += iPosY*iRefStride+iPosX;
2615
2616  //  Integer point
2617  if ( ixFrac == 0 && iyFrac == 0 )
2618  {
2619    ::memcpy(piDstY, piRefY, sizeof(Pel));
2620    return;
2621  }
2622
2623  Int iWidth = 1;
2624  Int iHeight = 1;
2625
2626  //  Half-pel horizontal
2627  if ( ixFrac == 2 && iyFrac == 0 )
2628  {
2629    xCTI_FilterHalfHor ( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2630    return;
2631  }
2632
2633  //  Half-pel vertical
2634  if ( ixFrac == 0 && iyFrac == 2 )
2635  {
2636    xCTI_FilterHalfVer ( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2637    return;
2638  }
2639
2640  Int   iExtStride = m_iYuvExtStride;//m_cYuvExt.getStride();
2641  Int*  piExtY     = m_piYuvExt;//m_cYuvExt.getLumaAddr();
2642
2643  //  Half-pel center
2644  if ( ixFrac == 2 && iyFrac == 2 )
2645  {
2646
2647    xCTI_FilterHalfVer (piRefY - 3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
2648    xCTI_FilterHalfHor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2649    return;
2650  }
2651
2652  //  Quater-pel horizontal
2653  if ( iyFrac == 0)
2654  {
2655    if ( ixFrac == 1)
2656    {
2657      xCTI_FilterQuarter0Hor( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2658      return;
2659    }
2660    if ( ixFrac == 3)
2661    {
2662      xCTI_FilterQuarter1Hor( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2663      return;
2664    }
2665  }
2666  if ( iyFrac == 2 )
2667  {
2668    if ( ixFrac == 1)
2669    {
2670      xCTI_FilterHalfVer (piRefY -3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
2671      xCTI_FilterQuarter0Hor (piExtY + 3,  iExtStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2672      return;
2673    }
2674    if ( ixFrac == 3)
2675    {
2676      xCTI_FilterHalfVer (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2677      xCTI_FilterQuarter1Hor (piExtY + 3,  iExtStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2678      return;
2679    }
2680  }
2681
2682  //  Quater-pel vertical
2683  if( ixFrac == 0 )
2684  {
2685    if( iyFrac == 1 )
2686    {
2687      xCTI_FilterQuarter0Ver( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2688      return;
2689    }
2690    if( iyFrac == 3 )
2691    {
2692      xCTI_FilterQuarter1Ver( piRefY, iRefStride, 1, iWidth, iHeight, iDstStride, 1, piDstY );
2693      return;
2694    }
2695  }
2696
2697  if( ixFrac == 2 )
2698  {
2699    if( iyFrac == 1 )
2700    {
2701      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2702      xCTI_FilterHalfHor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2703      return;
2704    }
2705    if( iyFrac == 3 )
2706    {
2707      xCTI_FilterQuarter1Ver (piRefY -3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2708      xCTI_FilterHalfHor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2709      return;
2710    }
2711  }
2712
2713  /// Quarter-pel center
2714  if ( iyFrac == 1)
2715  {
2716    if ( ixFrac == 1)
2717    {
2718      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2719      xCTI_FilterQuarter0Hor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2720      return;
2721    }
2722    if ( ixFrac == 3)
2723    {
2724      xCTI_FilterQuarter0Ver (piRefY - 3,  iRefStride, 1, iWidth +7, iHeight, iExtStride, 1, piExtY );
2725      xCTI_FilterQuarter1Hor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2726      return;
2727    }
2728  }
2729  if ( iyFrac == 3 )
2730  {
2731    if ( ixFrac == 1)
2732    {
2733      xCTI_FilterQuarter1Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2734      xCTI_FilterQuarter0Hor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2735      return;
2736    }
2737    if ( ixFrac == 3)
2738    {
2739      xCTI_FilterQuarter1Ver (piRefY - 3,  iRefStride, 1, iWidth + 7, iHeight, iExtStride, 1, piExtY );
2740      xCTI_FilterQuarter1Hor (piExtY + 3,  iExtStride, 1, iWidth    , iHeight, iDstStride, 1, piDstY );
2741      return;
2742    }
2743  }
2744}
2745
2746#if HIGH_ACCURACY_BI
2747Void TComPrediction::xPredInterChromaBlk_EIVD_ha( TComDataCU* pcCU, TComPicYuv* pcPicYuvRef, UInt uiPartAddr, TComMv* pcMv, Int iPosX, Int iPosY, TComYuv*& rpcYuv )
2748{
2749  Int     iRefStride  = pcPicYuvRef->getCStride();
2750  Int     iDstStride  = rpcYuv->getCStride();
2751
2752  Int     iRefOffset  = (pcMv->getHor() >> 3) + (pcMv->getVer() >> 3) * iRefStride;
2753
2754  Pel*    piRefCb     = pcPicYuvRef->getCbAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2755  Pel*    piRefCr     = pcPicYuvRef->getCrAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2756
2757  Pel* piDstCb = rpcYuv->getCbAddr( uiPartAddr );
2758  Pel* piDstCr = rpcYuv->getCrAddr( uiPartAddr );
2759
2760  Int     ixFrac  = pcMv->getHor() & 0x7;
2761  Int     iyFrac  = pcMv->getVer() & 0x7;
2762  UInt    uiCWidth  = 1;
2763  UInt    uiCHeight = 1;
2764
2765  piDstCb += (iPosY>>1)*iDstStride+(iPosX>>1);
2766  piDstCr += (iPosY>>1)*iDstStride+(iPosX>>1);
2767  piRefCb += (iPosY>>1)*iRefStride+(iPosX>>1);
2768  piRefCr += (iPosY>>1)*iRefStride+(iPosX>>1);
2769
2770  xDCTIF_FilterC_ha(piRefCb, iRefStride,piDstCb,iDstStride,uiCWidth,uiCHeight, iyFrac, ixFrac);
2771  xDCTIF_FilterC_ha(piRefCr, iRefStride,piDstCr,iDstStride,uiCWidth,uiCHeight, iyFrac, ixFrac);
2772  return;
2773}
2774#endif
2775
2776//--
2777Void TComPrediction::xPredInterChromaBlk_EIVD( TComDataCU* pcCU, TComPicYuv* pcPicYuvRef, UInt uiPartAddr, TComMv* pcMv, Int iPosX, Int iPosY, TComYuv*& rpcYuv )
2778{
2779  Int     iRefStride  = pcPicYuvRef->getCStride();
2780  Int     iDstStride  = rpcYuv->getCStride();
2781
2782  Int     iRefOffset  = (pcMv->getHor() >> 3) + (pcMv->getVer() >> 3) * iRefStride;
2783
2784  Pel*    piRefCb     = pcPicYuvRef->getCbAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2785  Pel*    piRefCr     = pcPicYuvRef->getCrAddr( pcCU->getAddr(), pcCU->getZorderIdxInCU() + uiPartAddr ) + iRefOffset;
2786
2787  Pel* piDstCb = rpcYuv->getCbAddr( uiPartAddr );
2788  Pel* piDstCr = rpcYuv->getCrAddr( uiPartAddr );
2789
2790  Int     ixFrac  = pcMv->getHor() & 0x7;
2791  Int     iyFrac  = pcMv->getVer() & 0x7;
2792  UInt    uiCWidth  = 1;
2793  UInt    uiCHeight = 1;
2794
2795  piDstCb += (iPosY>>1)*iDstStride+(iPosX>>1);
2796  piDstCr += (iPosY>>1)*iDstStride+(iPosX>>1);
2797  piRefCb += (iPosY>>1)*iRefStride+(iPosX>>1);
2798  piRefCr += (iPosY>>1)*iRefStride+(iPosX>>1);
2799
2800  xDCTIF_FilterC(piRefCb, iRefStride,piDstCb,iDstStride,uiCWidth,uiCHeight, iyFrac, ixFrac);
2801  xDCTIF_FilterC(piRefCr, iRefStride,piDstCr,iDstStride,uiCWidth,uiCHeight, iyFrac, ixFrac);
2802  return;
2803}
2804
2805#endif
2806
2807
2808Void  TComPrediction::xDCTIF_FilterC ( Pel*  piRefC, Int iRefStride,Pel*  piDstC,Int iDstStride,
2809                                       Int iWidth, Int iHeight,Int iMVyFrac,Int iMVxFrac)
2810{
2811  // Integer point
2812  if ( iMVxFrac == 0 && iMVyFrac == 0 )
2813  {
2814    for ( Int y = 0; y < iHeight; y++ )
2815    {
2816      ::memcpy(piDstC, piRefC, sizeof(Pel)*iWidth);
2817      piDstC += iDstStride;
2818      piRefC += iRefStride;
2819    }
2820    return;
2821  }
2822
2823  if ( iMVyFrac == 0 )
2824  {
2825    xCTI_Filter1DHorC (piRefC, iRefStride,  iWidth, iHeight, iDstStride,  piDstC, iMVxFrac );
2826    return;
2827  }
2828
2829  if ( iMVxFrac == 0 )
2830  {
2831    xCTI_Filter1DVerC (piRefC, iRefStride,  iWidth, iHeight, iDstStride,  piDstC, iMVyFrac );
2832    return;
2833}
2834
2835  Int   iExtStride = m_iYuvExtStride;
2836  Int*  piExtC     = m_piYuvExt;
2837
2838  xCTI_Filter2DVerC (piRefC - 1,  iRefStride,  iWidth + 3, iHeight, iExtStride,  piExtC, iMVyFrac );
2839  xCTI_Filter2DHorC (piExtC + 1,  iExtStride,  iWidth             , iHeight, iDstStride,  piDstC, iMVxFrac );
2840}
2841
2842#if HIGH_ACCURACY_BI
2843
2844Void  TComPrediction::xDCTIF_FilterC_ha ( Pel*  piRefC, Int iRefStride,Pel*  piDstC,Int iDstStride,
2845                                       Int iWidth, Int iHeight,Int iMVyFrac,Int iMVxFrac)
2846{
2847  UInt    shiftNumOrg = 6 - g_uiBitIncrement + 8 - g_uiBitDepth;
2848  // Integer point
2849  if ( iMVxFrac == 0 && iMVyFrac == 0 )
2850  {
2851    for (Int y = 0; y < iHeight; y++ )
2852    {
2853      for(Int x=0; x<iWidth; x++)
2854      {
2855        piDstC[x] = (piRefC[x]<<shiftNumOrg);
2856      }
2857      piDstC += iDstStride;
2858      piRefC += iRefStride;
2859    }
2860    return;
2861  }
2862
2863  if ( iMVyFrac == 0 )
2864  {
2865    xCTI_Filter1DHorC_ha (piRefC, iRefStride,  iWidth, iHeight, iDstStride,  piDstC, iMVxFrac );
2866    return;
2867
2868  }
2869
2870  if ( iMVxFrac == 0 )
2871  {
2872    xCTI_Filter1DVerC_ha (piRefC, iRefStride,  iWidth, iHeight, iDstStride,  piDstC, iMVyFrac );
2873    return;
2874  }
2875
2876  Int   iExtStride = m_iYuvExtStride;
2877  Int*  piExtC     = m_piYuvExt;
2878
2879  xCTI_Filter2DVerC (piRefC - 1,  iRefStride,  iWidth + 3, iHeight, iExtStride,  piExtC, iMVyFrac );
2880  xCTI_Filter2DHorC_ha (piExtC + 1,  iExtStride,  iWidth , iHeight, iDstStride,  piDstC, iMVxFrac );
2881  return;
2882
2883}
2884
2885#endif
2886
2887
2888Void TComPrediction::xWeightedAverage( TComDataCU* pcCU, TComYuv* pcYuvSrc0, TComYuv* pcYuvSrc1, Int iRefIdx0, Int iRefIdx1, UInt uiPartIdx, Int iWidth, Int iHeight, TComYuv*& rpcYuvDst )
2889{
2890  if( iRefIdx0 >= 0 && iRefIdx1 >= 0 )
2891  {
2892#ifdef ROUNDING_CONTROL_BIPRED
2893    rpcYuvDst->addAvg( pcYuvSrc0, pcYuvSrc1, uiPartIdx, iWidth, iHeight, pcCU->getSlice()->isRounding());
2894#else
2895    rpcYuvDst->addAvg( pcYuvSrc0, pcYuvSrc1, uiPartIdx, iWidth, iHeight );
2896#endif
2897  }
2898  else if ( iRefIdx0 >= 0 && iRefIdx1 <  0 )
2899  {
2900    pcYuvSrc0->copyPartToPartYuv( rpcYuvDst, uiPartIdx, iWidth, iHeight );
2901  }
2902  else if ( iRefIdx0 <  0 && iRefIdx1 >= 0 )
2903  {
2904    pcYuvSrc1->copyPartToPartYuv( rpcYuvDst, uiPartIdx, iWidth, iHeight );
2905  }
2906  else
2907  {
2908    assert (0);
2909  }
2910}
2911
2912#if POZNAN_EIVD
2913Void TComPrediction::xWeightedAverage_EIVD( TComDataCU* pcCU, TComYuv* pcYuvSrc0, TComYuv* pcYuvSrc1, Int iRefIdx0, Int iRefIdx1, UInt uiPartIdx, Int iPosX, Int iPosY, TComYuv*& rpcYuvDst )
2914{
2915  if( iRefIdx0 >= 0 && iRefIdx1 >= 0 )
2916  {
2917#ifdef ROUNDING_CONTROL_BIPRED
2918    rpcYuvDst->addAvg_EIVD( pcYuvSrc0, pcYuvSrc1, uiPartIdx, iPosX, iPosY, pcCU->getSlice()->isRounding());
2919#else
2920    rpcYuvDst->addAvg_EIVD( pcYuvSrc0, pcYuvSrc1, uiPartIdx, iPosX, iPosY );
2921#endif
2922  }
2923  else if ( iRefIdx0 >= 0 && iRefIdx1 <  0 )
2924  {
2925    pcYuvSrc0->copyPartToPartYuv_EIVD( rpcYuvDst, uiPartIdx, iPosX, iPosY );
2926  }
2927  else if ( iRefIdx0 <  0 && iRefIdx1 >= 0 )
2928  {
2929    pcYuvSrc1->copyPartToPartYuv_EIVD( rpcYuvDst, uiPartIdx, iPosX, iPosY );
2930  }
2931  else
2932  {
2933    assert (0);
2934  }
2935}
2936#endif
2937
2938// AMVP
2939Void TComPrediction::getMvPredAMVP( TComDataCU* pcCU, UInt uiPartIdx, UInt uiPartAddr, RefPicList eRefPicList, Int iRefIdx, TComMv& rcMvPred )
2940{
2941  AMVPInfo* pcAMVPInfo = pcCU->getCUMvField(eRefPicList)->getAMVPInfo();
2942
2943  if( pcCU->getAMVPMode(uiPartAddr) == AM_NONE || (pcAMVPInfo->iN <= 1 && pcCU->getAMVPMode(uiPartAddr) == AM_EXPL) )
2944  {
2945    rcMvPred = pcAMVPInfo->m_acMvCand[0];
2946
2947    pcCU->setMVPIdxSubParts( 0, eRefPicList, uiPartAddr, uiPartIdx, pcCU->getDepth(uiPartAddr));
2948    pcCU->setMVPNumSubParts( pcAMVPInfo->iN, eRefPicList, uiPartAddr, uiPartIdx, pcCU->getDepth(uiPartAddr));
2949    return;
2950  }
2951
2952  assert(pcCU->getMVPIdx(eRefPicList,uiPartAddr) >= 0);
2953  rcMvPred = pcAMVPInfo->m_acMvCand[pcCU->getMVPIdx(eRefPicList,uiPartAddr)];
2954  return;
2955}
2956
2957#if ADD_PLANAR_MODE
2958/** Function for deriving planar intra prediction.
2959 * \param pSrc pointer to reconstructed sample array
2960 * \param srcStride the stride of the reconstructed sample array
2961 * \param rpDst reference to pointer for the prediction sample array
2962 * \param dstStride the stride of the prediction sample array
2963 * \param width the width of the block
2964 * \param height the height of the block
2965 * \param blkAboveAvailable boolean indication if the block above is available
2966 * \param blkLeftAvailable boolean indication if the block to the left is available
2967 *
2968 * This function derives the prediction samples for planar mode (intra coding).
2969 */
2970#if REFERENCE_SAMPLE_PADDING
2971Void TComPrediction::xPredIntraPlanar( Int* pSrc, Int srcStride, Pel*& rpDst, Int dstStride, UInt width, UInt height )
2972#else
2973Void TComPrediction::xPredIntraPlanar( Int* pSrc, Int srcStride, Pel*& rpDst, Int dstStride, UInt width, UInt height, Bool blkAboveAvailable, Bool blkLeftAvailable )
2974#endif
2975{
2976  assert(width == height);
2977
2978  Int k, l, bottomLeft, topRight;
2979  Int horPred;
2980  Int leftColumn[MAX_CU_SIZE], topRow[MAX_CU_SIZE], bottomRow[MAX_CU_SIZE], rightColumn[MAX_CU_SIZE];
2981  UInt blkSize = width;
2982  UInt offset2D = width;
2983  UInt shift1D = g_aucConvertToBit[ width ] + 2;
2984  UInt shift2D = shift1D + 1;
2985
2986  // Get left and above reference column and row
2987#if REFERENCE_SAMPLE_PADDING
2988  for(k=0;k<blkSize;k++)
2989  {
2990    topRow[k] = pSrc[k-srcStride];
2991    leftColumn[k] = pSrc[k*srcStride-1];
2992  }
2993#else
2994  if (!blkAboveAvailable && !blkLeftAvailable)
2995  {
2996    for(k=0;k<blkSize;k++)
2997    {
2998      leftColumn[k] = topRow[k] = ( 1 << ( g_uiBitDepth + g_uiBitIncrement - 1 ) );
2999    }
3000  }
3001  else
3002  {
3003    if(blkAboveAvailable)
3004    {
3005      for(k=0;k<blkSize;k++)
3006      {
3007        topRow[k] = pSrc[k-srcStride];
3008      }
3009    }
3010    else
3011    {
3012      Int leftSample = pSrc[-1];
3013      for(k=0;k<blkSize;k++)
3014      {
3015        topRow[k] = leftSample;
3016      }
3017    }
3018    if(blkLeftAvailable)
3019    {
3020      for(k=0;k<blkSize;k++)
3021      {
3022        leftColumn[k] = pSrc[k*srcStride-1];
3023      }
3024    }
3025    else
3026    {
3027      Int aboveSample = pSrc[-srcStride];
3028      for(k=0;k<blkSize;k++)
3029      {
3030        leftColumn[k] = aboveSample;
3031      }
3032    }
3033  }
3034#endif
3035
3036  // Prepare intermediate variables used in interpolation
3037  bottomLeft = leftColumn[blkSize-1];
3038  topRight   = topRow[blkSize-1];
3039  for (k=0;k<blkSize;k++)
3040  {
3041    bottomRow[k]   = bottomLeft - topRow[k];
3042    rightColumn[k] = topRight   - leftColumn[k];
3043    topRow[k]      <<= shift1D;
3044    leftColumn[k]  <<= shift1D;
3045  }
3046
3047  // Generate prediction signal
3048  for (k=0;k<blkSize;k++)
3049  {
3050    horPred = leftColumn[k] + offset2D;
3051    for (l=0;l<blkSize;l++)
3052    {
3053      horPred += rightColumn[k];
3054      topRow[l] += bottomRow[l];
3055      rpDst[k*dstStride+l] = ( (horPred + topRow[l]) >> shift2D );
3056    }
3057  }
3058}
3059#endif
3060
3061#if LM_CHROMA
3062/** Function for deriving chroma LM intra prediction.
3063 * \param pcPattern pointer to neighbouring pixel access pattern
3064 * \param pSrc pointer to reconstructed chroma sample array
3065 * \param pPred pointer for the prediction sample array
3066 * \param uiPredStride the stride of the prediction sample array
3067 * \param uiCWidth the width of the chroma block
3068 * \param uiCHeight the height of the chroma block
3069 * \param uiChromaId boolean indication of chroma component
3070
3071 \ This function derives the prediction samples for chroma LM mode (chroma intra coding)
3072 */
3073Void TComPrediction::predLMIntraChroma( TComPattern* pcPattern, Int* piSrc, Pel* pPred, UInt uiPredStride, UInt uiCWidth, UInt uiCHeight, UInt uiChromaId )
3074{
3075  UInt uiWidth  = uiCWidth << 1;
3076  UInt uiHeight = uiCHeight << 1;
3077
3078  if (uiChromaId == 0)
3079    xGetRecPixels( pcPattern, pcPattern->getROIY(), pcPattern->getPatternLStride(), m_pLumaRecBuffer + m_iLumaRecStride + 1, m_iLumaRecStride, uiWidth, uiHeight );
3080
3081  xGetLLSPrediction( pcPattern, piSrc+uiWidth+2, uiWidth+1, pPred, uiPredStride, uiCWidth, uiCHeight, 1 ); 
3082}
3083
3084/** Function for deriving downsampled luma sample of current chroma block and its above, left causal pixel
3085 * \param pcPattern pointer to neighbouring pixel access pattern
3086 * \param pRecSrc pointer to reconstructed luma sample array
3087 * \param iRecSrcStride the stride of reconstructed luma sample array
3088 * \param pDst0 pointer to downsampled luma sample array
3089 * \param iDstStride the stride of downsampled luma sample array
3090 * \param uiWidth0 the width of the luma block
3091 * \param uiHeight0 the height of the luma block
3092
3093 \ This function derives downsampled luma sample of current chroma block and its above, left causal pixel
3094 */
3095
3096Void TComPrediction::xGetRecPixels( TComPattern* pcPattern, Pel* pRecSrc, Int iRecSrcStride, Pel* pDst0, Int iDstStride, UInt uiWidth0, UInt uiHeight0 )
3097{
3098  Pel* pSrc = pRecSrc;
3099  Pel* pDst = pDst0;
3100
3101  Int uiCWidth = uiWidth0/2;
3102  Int uiCHeight = uiHeight0/2;
3103
3104  if( pcPattern->isLeftAvailable() )
3105  {
3106    pSrc = pSrc - 2;
3107    pDst = pDst - 1;
3108
3109    uiCWidth += 1;
3110  }
3111
3112  if( pcPattern->isAboveAvailable() )
3113  {
3114    pSrc = pSrc - 2*iRecSrcStride;
3115    pDst = pDst - iDstStride;
3116
3117    uiCHeight += 1;
3118  }
3119
3120  for( Int j = 0; j < uiCHeight; j++ )
3121    {
3122      for( Int i = 0, ii = i << 1; i < uiCWidth; i++, ii = i << 1 )
3123        pDst[i] = (pSrc[ii] + pSrc[ii + iRecSrcStride]) >> 1;
3124
3125      pDst += iDstStride;
3126      pSrc += iRecSrcStride*2;
3127    } 
3128}
3129
3130/** Function for deriving the positon of first non-zero binary bit of a value
3131 * \param x input value
3132 \ This function derives the positon of first non-zero binary bit of a value
3133 */
3134Int GetMSB( UInt x )
3135{
3136#if 1
3137  Int iMSB = 0, bits = ( sizeof( Int ) << 3 ), y = 1;
3138
3139  while( x > 1 )
3140  {
3141    bits >>= 1;
3142    y = x >> bits;
3143
3144    if( y )
3145    {
3146      x = y;
3147      iMSB += bits;
3148    }
3149  }
3150
3151  iMSB+=y;
3152
3153#else
3154
3155  Int iMSB = 0;
3156  while( x > 0 )
3157  {
3158    x >>= 1;
3159    iMSB++;
3160  }
3161#endif
3162
3163  return iMSB;
3164}
3165
3166/** Function for deriving LM intra prediction.
3167 * \param pcPattern pointer to neighbouring pixel access pattern
3168 * \param pSrc0 pointer to reconstructed chroma sample array
3169 * \param iSrcStride the stride of reconstructed chroma sample array
3170 * \param pDst0 reference to pointer for the prediction sample array
3171 * \param iDstStride the stride of the prediction sample array
3172 * \param uiWidth the width of the chroma block
3173 * \param uiHeight the height of the chroma block
3174 * \param uiExt0 line number of neiggboirng pixels for calculating LM model parameter, default value is 1
3175
3176 \ This function derives the prediction samples for chroma LM mode (chroma intra coding)
3177 */
3178Void TComPrediction::xGetLLSPrediction( TComPattern* pcPattern, Int* pSrc0, Int iSrcStride, Pel* pDst0, Int iDstStride, UInt uiWidth, UInt uiHeight, UInt uiExt0 )
3179{
3180
3181  Pel  *pDst, *pLuma;
3182  Int  *pSrc;
3183
3184  Int  iLumaStride = m_iLumaRecStride;
3185  Pel* pLuma0 = m_pLumaRecBuffer + uiExt0 * iLumaStride + uiExt0;
3186
3187  Int i, j, iCountShift = 0;
3188
3189  UInt uiExt = uiExt0;
3190
3191  // LLS parameters estimation -->
3192
3193  Int x = 0, y = 0, xx = 0, xy = 0;
3194
3195  if( pcPattern->isAboveAvailable() )
3196  {
3197    pSrc  = pSrc0  - iSrcStride;
3198    pLuma = pLuma0 - iLumaStride;
3199
3200    for( j = 0; j < uiWidth; j++ )
3201    {
3202      x += pLuma[j];
3203      y += pSrc[j];
3204      xx += pLuma[j] * pLuma[j];
3205      xy += pLuma[j] * pSrc[j];
3206    }
3207    iCountShift += g_aucConvertToBit[ uiWidth ] + 2;
3208  }
3209
3210  if( pcPattern->isLeftAvailable() )
3211  {
3212    pSrc  = pSrc0 - uiExt;
3213    pLuma = pLuma0 - uiExt;
3214
3215    for( i = 0; i < uiHeight; i++ )
3216    {
3217      x += pLuma[0];
3218      y += pSrc[0];
3219      xx += pLuma[0] * pLuma[0];
3220      xy += pLuma[0] * pSrc[0];
3221
3222      pSrc  += iSrcStride;
3223      pLuma += iLumaStride;
3224    }
3225    iCountShift += iCountShift > 0 ? 1 : ( g_aucConvertToBit[ uiWidth ] + 2 );
3226  }
3227
3228  Int iBitdepth = ( ( g_uiBitDepth + g_uiBitIncrement ) + g_aucConvertToBit[ uiWidth ] + 3 ) * 2;
3229  Int iTempShift = Max( ( iBitdepth - 31 + 1) / 2, 0);
3230
3231  if(iTempShift > 0)
3232  {
3233    x  = ( x +  ( 1 << ( iTempShift - 1 ) ) ) >> iTempShift;
3234    y  = ( y +  ( 1 << ( iTempShift - 1 ) ) ) >> iTempShift;
3235    xx = ( xx + ( 1 << ( iTempShift - 1 ) ) ) >> iTempShift;
3236    xy = ( xy + ( 1 << ( iTempShift - 1 ) ) ) >> iTempShift;
3237    iCountShift -= iTempShift;
3238  }
3239
3240  Int a, b, iShift = 13;
3241
3242  if( iCountShift == 0 )
3243  {
3244    a = 0;
3245    b = 128 << g_uiBitIncrement;
3246    iShift = 0;
3247  }
3248  else
3249  {
3250    Int a1 = ( xy << iCountShift ) - y * x;
3251    Int a2 = ( xx << iCountShift ) - x * x;             
3252
3253    if( a2 == 0 || a1 == 0 )
3254    {
3255      a = 0;
3256      b = ( y + ( 1 << ( iCountShift - 1 ) ) )>> iCountShift;
3257      iShift = 0;
3258    }
3259    else
3260    {
3261      const Int iShiftA2 = 6;
3262      const Int iShiftA1 = 15;
3263      const Int iAccuracyShift = 15;
3264
3265      Int iScaleShiftA2 = 0;
3266      Int iScaleShiftA1 = 0;
3267      Int a1s = a1;
3268      Int a2s = a2;
3269
3270      iScaleShiftA1 = GetMSB( abs( a1 ) ) - iShiftA1;
3271      iScaleShiftA2 = GetMSB( abs( a2 ) ) - iShiftA2; 
3272
3273      if( iScaleShiftA1 < 0 )
3274        iScaleShiftA1 = 0;
3275
3276      if( iScaleShiftA2 < 0 )
3277        iScaleShiftA2 = 0;
3278
3279      Int iScaleShiftA = iScaleShiftA2 + iAccuracyShift - iShift - iScaleShiftA1;
3280
3281      a2s = a2 >> iScaleShiftA2;
3282
3283      a1s = a1 >> iScaleShiftA1;
3284
3285      a = a1s * m_uiaShift[ abs( a2s ) ];
3286     
3287      if( iScaleShiftA < 0 )
3288        a = a << -iScaleShiftA;
3289      else
3290        a = a >> iScaleShiftA;
3291
3292      if( a > ( 1 << 15 ) - 1 )
3293        a = ( 1 << 15 ) - 1;
3294      else if( a < -( 1 << 15 ) )
3295        a = -( 1 << 15 );
3296
3297      b = (  y - ( ( a * x ) >> iShift ) + ( 1 << ( iCountShift - 1 ) ) ) >> iCountShift;
3298    }
3299  }   
3300
3301  // <-- end of LLS parameters estimation
3302
3303  // get prediction -->
3304  uiExt = uiExt0;
3305  pLuma = pLuma0;
3306  pDst = pDst0;
3307
3308  for( i = 0; i < uiHeight; i++ )
3309  {
3310    for( j = 0; j < uiWidth; j++ )
3311      pDst[j] = Clip( ( ( a * pLuma[j] ) >> iShift ) + b );
3312
3313    pDst  += iDstStride;
3314    pLuma += iLumaStride;
3315  }
3316  // <-- end of get prediction
3317
3318}
3319#endif
3320
3321#if MN_DC_PRED_FILTER
3322/** Function for filtering intra DC predictor.
3323 * \param pSrc pointer to reconstructed sample array
3324 * \param iSrcStride the stride of the reconstructed sample array
3325 * \param rpDst reference to pointer for the prediction sample array
3326 * \param iDstStride the stride of the prediction sample array
3327 * \param iWidth the width of the block
3328 * \param iHeight the height of the block
3329 *
3330 * This function performs filtering left and top edges of the prediction samples for DC mode (intra coding).
3331 */
3332Void TComPrediction::xDCPredFiltering( Int* pSrc, Int iSrcStride, Pel*& rpDst, Int iDstStride, Int iWidth, Int iHeight )
3333{
3334  Pel* pDst = rpDst;
3335  Int x, y, iDstStride2, iSrcStride2;
3336  Int iIntraSizeIdx = g_aucConvertToBit[ iWidth ] + 1;
3337  static const UChar g_aucDCPredFilter[7] = { 0, 3, 2, 1, 0, 0, 0};
3338
3339  switch (g_aucDCPredFilter[iIntraSizeIdx])
3340  {
3341  case 0:
3342    {}
3343    break;
3344  case 1:
3345    {
3346      // boundary pixels processing
3347      pDst[0] = (Pel)((pSrc[-iSrcStride] + pSrc[-1] + 6 * pDst[0] + 4) >> 3);
3348
3349      for ( x = 1; x < iWidth; x++ )
3350        pDst[x] = (Pel)((pSrc[x - iSrcStride] + 7 * pDst[x] + 4) >> 3);
3351
3352      for ( y = 1, iDstStride2 = iDstStride, iSrcStride2 = iSrcStride-1; y < iHeight; y++, iDstStride2+=iDstStride, iSrcStride2+=iSrcStride )
3353        pDst[iDstStride2] = (Pel)((pSrc[iSrcStride2] + 7 * pDst[iDstStride2] + 4) >> 3);
3354    }
3355    break;
3356  case 2:
3357    {
3358      // boundary pixels processing
3359      pDst[0] = (Pel)((pSrc[-iSrcStride] + pSrc[-1] + 2 * pDst[0] + 2) >> 2);
3360
3361      for ( x = 1; x < iWidth; x++ )
3362        pDst[x] = (Pel)((pSrc[x - iSrcStride] + 3 * pDst[x] + 2) >> 2);
3363
3364      for ( y = 1, iDstStride2 = iDstStride, iSrcStride2 = iSrcStride-1; y < iHeight; y++, iDstStride2+=iDstStride, iSrcStride2+=iSrcStride )
3365        pDst[iDstStride2] = (Pel)((pSrc[iSrcStride2] + 3 * pDst[iDstStride2] + 2) >> 2);
3366    }
3367    break;
3368  case 3:
3369    {
3370      // boundary pixels processing
3371      pDst[0] = (Pel)((3 * (pSrc[-iSrcStride] + pSrc[-1]) + 2 * pDst[0] + 4) >> 3);
3372
3373      for ( x = 1; x < iWidth; x++ )
3374        pDst[x] = (Pel)((3 * pSrc[x - iSrcStride] + 5 * pDst[x] + 4) >> 3);
3375
3376      for ( y = 1, iDstStride2 = iDstStride, iSrcStride2 = iSrcStride-1; y < iHeight; y++, iDstStride2+=iDstStride, iSrcStride2+=iSrcStride )
3377        pDst[iDstStride2] = (Pel)((3 * pSrc[iSrcStride2] + 5 * pDst[iDstStride2] + 4) >> 3);
3378    }
3379    break;
3380  }
3381
3382  return;
3383}
3384#endif
3385
3386#if HHI_DMM_WEDGE_INTRA || HHI_DMM_PRED_TEX
3387TComWedgeDist::TComWedgeDist()
3388{
3389  init();
3390}
3391
3392TComWedgeDist::~TComWedgeDist()
3393{
3394}
3395
3396Void TComWedgeDist::init()
3397{
3398  //   m_afpDistortFunc[0]  = NULL;                  // for DF_DEFAULT
3399
3400  //   m_afpDistortFunc[8]  = TComRdCost::xGetSAD;
3401  m_afpDistortFunc[0]  = TComWedgeDist::xGetSAD4;
3402  m_afpDistortFunc[1] = TComWedgeDist::xGetSAD8;
3403  m_afpDistortFunc[2] = TComWedgeDist::xGetSAD16;
3404  m_afpDistortFunc[3] = TComWedgeDist::xGetSAD32;
3405
3406  m_afpDistortFunc[4]  = TComWedgeDist::xGetSSE4;
3407  m_afpDistortFunc[5]  = TComWedgeDist::xGetSSE8;
3408  m_afpDistortFunc[6]  = TComWedgeDist::xGetSSE16;
3409  m_afpDistortFunc[7]  = TComWedgeDist::xGetSSE32;
3410
3411  //   m_afpDistortFunc[13] = TComRdCost::xGetSAD64;
3412#ifdef ROUNDING_CONTROL_BIPRED
3413  //   m_afpDistortFuncRnd[0]  = NULL;
3414  //   m_afpDistortFuncRnd[8]  = TComRdCost::xGetSAD;
3415  m_afpDistortFuncRnd[9]  = TComRdCost::xGetSAD4;
3416  m_afpDistortFuncRnd[10] = TComRdCost::xGetSAD8;
3417  m_afpDistortFuncRnd[11] = TComRdCost::xGetSAD16;
3418  m_afpDistortFuncRnd[12] = TComRdCost::xGetSAD32;
3419  //   m_afpDistortFuncRnd[13] = TComRdCost::xGetSAD64;
3420#endif
3421}
3422
3423UInt TComWedgeDist::xGetSAD4( DistParam* pcDtParam )
3424{
3425  Pel* piOrg   = pcDtParam->pOrg;
3426  Pel* piCur   = pcDtParam->pCur;
3427  Int  iRows   = pcDtParam->iRows;
3428  Int  iSubShift  = pcDtParam->iSubShift;
3429  Int  iSubStep   = ( 1 << iSubShift );
3430  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
3431  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
3432
3433  UInt uiSum = 0;
3434
3435  for( ; iRows != 0; iRows-=iSubStep )
3436  {
3437    uiSum += abs( piOrg[0] - piCur[0] );
3438    uiSum += abs( piOrg[1] - piCur[1] );
3439    uiSum += abs( piOrg[2] - piCur[2] );
3440    uiSum += abs( piOrg[3] - piCur[3] );
3441
3442    piOrg += iStrideOrg;
3443    piCur += iStrideCur;
3444  }
3445
3446  uiSum <<= iSubShift;
3447  return ( uiSum >> g_uiBitIncrement );
3448}
3449
3450UInt TComWedgeDist::xGetSAD8( DistParam* pcDtParam )
3451{
3452  Pel* piOrg      = pcDtParam->pOrg;
3453  Pel* piCur      = pcDtParam->pCur;
3454  Int  iRows      = pcDtParam->iRows;
3455  Int  iSubShift  = pcDtParam->iSubShift;
3456  Int  iSubStep   = ( 1 << iSubShift );
3457  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
3458  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
3459
3460  UInt uiSum = 0;
3461
3462  for( ; iRows != 0; iRows-=iSubStep )
3463  {
3464    uiSum += abs( piOrg[0] - piCur[0] );
3465    uiSum += abs( piOrg[1] - piCur[1] );
3466    uiSum += abs( piOrg[2] - piCur[2] );
3467    uiSum += abs( piOrg[3] - piCur[3] );
3468    uiSum += abs( piOrg[4] - piCur[4] );
3469    uiSum += abs( piOrg[5] - piCur[5] );
3470    uiSum += abs( piOrg[6] - piCur[6] );
3471    uiSum += abs( piOrg[7] - piCur[7] );
3472
3473    piOrg += iStrideOrg;
3474    piCur += iStrideCur;
3475  }
3476
3477  uiSum <<= iSubShift;
3478  return ( uiSum >> g_uiBitIncrement );
3479}
3480
3481UInt TComWedgeDist::xGetSAD16( DistParam* pcDtParam )
3482{
3483  Pel* piOrg   = pcDtParam->pOrg;
3484  Pel* piCur   = pcDtParam->pCur;
3485  Int  iRows   = pcDtParam->iRows;
3486  Int  iSubShift  = pcDtParam->iSubShift;
3487  Int  iSubStep   = ( 1 << iSubShift );
3488  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
3489  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
3490
3491  UInt uiSum = 0;
3492
3493  for( ; iRows != 0; iRows-=iSubStep )
3494  {
3495    uiSum += abs( piOrg[0] - piCur[0] );
3496    uiSum += abs( piOrg[1] - piCur[1] );
3497    uiSum += abs( piOrg[2] - piCur[2] );
3498    uiSum += abs( piOrg[3] - piCur[3] );
3499    uiSum += abs( piOrg[4] - piCur[4] );
3500    uiSum += abs( piOrg[5] - piCur[5] );
3501    uiSum += abs( piOrg[6] - piCur[6] );
3502    uiSum += abs( piOrg[7] - piCur[7] );
3503    uiSum += abs( piOrg[8] - piCur[8] );
3504    uiSum += abs( piOrg[9] - piCur[9] );
3505    uiSum += abs( piOrg[10] - piCur[10] );
3506    uiSum += abs( piOrg[11] - piCur[11] );
3507    uiSum += abs( piOrg[12] - piCur[12] );
3508    uiSum += abs( piOrg[13] - piCur[13] );
3509    uiSum += abs( piOrg[14] - piCur[14] );
3510    uiSum += abs( piOrg[15] - piCur[15] );
3511
3512    piOrg += iStrideOrg;
3513    piCur += iStrideCur;
3514  }
3515
3516  uiSum <<= iSubShift;
3517  return ( uiSum >> g_uiBitIncrement );
3518}
3519
3520UInt TComWedgeDist::xGetSAD32( DistParam* pcDtParam )
3521{
3522  Pel* piOrg   = pcDtParam->pOrg;
3523  Pel* piCur   = pcDtParam->pCur;
3524  Int  iRows   = pcDtParam->iRows;
3525  Int  iSubShift  = pcDtParam->iSubShift;
3526  Int  iSubStep   = ( 1 << iSubShift );
3527  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
3528  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
3529
3530  UInt uiSum = 0;
3531
3532  for( ; iRows != 0; iRows-=iSubStep )
3533  {
3534    uiSum += abs( piOrg[0] - piCur[0] );
3535    uiSum += abs( piOrg[1] - piCur[1] );
3536    uiSum += abs( piOrg[2] - piCur[2] );
3537    uiSum += abs( piOrg[3] - piCur[3] );
3538    uiSum += abs( piOrg[4] - piCur[4] );
3539    uiSum += abs( piOrg[5] - piCur[5] );
3540    uiSum += abs( piOrg[6] - piCur[6] );
3541    uiSum += abs( piOrg[7] - piCur[7] );
3542    uiSum += abs( piOrg[8] - piCur[8] );
3543    uiSum += abs( piOrg[9] - piCur[9] );
3544    uiSum += abs( piOrg[10] - piCur[10] );
3545    uiSum += abs( piOrg[11] - piCur[11] );
3546    uiSum += abs( piOrg[12] - piCur[12] );
3547    uiSum += abs( piOrg[13] - piCur[13] );
3548    uiSum += abs( piOrg[14] - piCur[14] );
3549    uiSum += abs( piOrg[15] - piCur[15] );
3550    uiSum += abs( piOrg[16] - piCur[16] );
3551    uiSum += abs( piOrg[17] - piCur[17] );
3552    uiSum += abs( piOrg[18] - piCur[18] );
3553    uiSum += abs( piOrg[19] - piCur[19] );
3554    uiSum += abs( piOrg[20] - piCur[20] );
3555    uiSum += abs( piOrg[21] - piCur[21] );
3556    uiSum += abs( piOrg[22] - piCur[22] );
3557    uiSum += abs( piOrg[23] - piCur[23] );
3558    uiSum += abs( piOrg[24] - piCur[24] );
3559    uiSum += abs( piOrg[25] - piCur[25] );
3560    uiSum += abs( piOrg[26] - piCur[26] );
3561    uiSum += abs( piOrg[27] - piCur[27] );
3562    uiSum += abs( piOrg[28] - piCur[28] );
3563    uiSum += abs( piOrg[29] - piCur[29] );
3564    uiSum += abs( piOrg[30] - piCur[30] );
3565    uiSum += abs( piOrg[31] - piCur[31] );
3566
3567    piOrg += iStrideOrg;
3568    piCur += iStrideCur;
3569  }
3570
3571  uiSum <<= iSubShift;
3572  return ( uiSum >> g_uiBitIncrement );
3573}
3574
3575UInt TComWedgeDist::xGetSSE4( DistParam* pcDtParam )
3576{
3577  Pel* piOrg   = pcDtParam->pOrg;
3578  Pel* piCur   = pcDtParam->pCur;
3579  Int  iRows   = pcDtParam->iRows;
3580  Int  iStrideOrg = pcDtParam->iStrideOrg;
3581  Int  iStrideCur = pcDtParam->iStrideCur;
3582
3583  UInt uiSum = 0;
3584  UInt uiShift = g_uiBitIncrement<<1;
3585
3586  Int  iTemp;
3587
3588  for( ; iRows != 0; iRows-- )
3589  {
3590
3591    iTemp = piOrg[0] - piCur[0]; uiSum += ( iTemp * iTemp ) >> uiShift;
3592    iTemp = piOrg[1] - piCur[1]; uiSum += ( iTemp * iTemp ) >> uiShift;
3593    iTemp = piOrg[2] - piCur[2]; uiSum += ( iTemp * iTemp ) >> uiShift;
3594    iTemp = piOrg[3] - piCur[3]; uiSum += ( iTemp * iTemp ) >> uiShift;
3595
3596    piOrg += iStrideOrg;
3597    piCur += iStrideCur;
3598  }
3599
3600  return ( uiSum );
3601}
3602
3603UInt TComWedgeDist::xGetSSE8( DistParam* pcDtParam )
3604{
3605  Pel* piOrg   = pcDtParam->pOrg;
3606  Pel* piCur   = pcDtParam->pCur;
3607  Int  iRows   = pcDtParam->iRows;
3608  Int  iStrideOrg = pcDtParam->iStrideOrg;
3609  Int  iStrideCur = pcDtParam->iStrideCur;
3610
3611  UInt uiSum = 0;
3612  UInt uiShift = g_uiBitIncrement<<1;
3613
3614  Int  iTemp;
3615
3616  for( ; iRows != 0; iRows-- )
3617  {
3618    iTemp = piOrg[0] - piCur[0]; uiSum += ( iTemp * iTemp ) >> uiShift;
3619    iTemp = piOrg[1] - piCur[1]; uiSum += ( iTemp * iTemp ) >> uiShift;
3620    iTemp = piOrg[2] - piCur[2]; uiSum += ( iTemp * iTemp ) >> uiShift;
3621    iTemp = piOrg[3] - piCur[3]; uiSum += ( iTemp * iTemp ) >> uiShift;
3622    iTemp = piOrg[4] - piCur[4]; uiSum += ( iTemp * iTemp ) >> uiShift;
3623    iTemp = piOrg[5] - piCur[5]; uiSum += ( iTemp * iTemp ) >> uiShift;
3624    iTemp = piOrg[6] - piCur[6]; uiSum += ( iTemp * iTemp ) >> uiShift;
3625    iTemp = piOrg[7] - piCur[7]; uiSum += ( iTemp * iTemp ) >> uiShift;
3626
3627    piOrg += iStrideOrg;
3628    piCur += iStrideCur;
3629  }
3630
3631  return ( uiSum );
3632}
3633
3634UInt TComWedgeDist::xGetSSE16( DistParam* pcDtParam )
3635{
3636  Pel* piOrg   = pcDtParam->pOrg;
3637  Pel* piCur   = pcDtParam->pCur;
3638  Int  iRows   = pcDtParam->iRows;
3639  Int  iStrideOrg = pcDtParam->iStrideOrg;
3640  Int  iStrideCur = pcDtParam->iStrideCur;
3641
3642  UInt uiSum = 0;
3643  UInt uiShift = g_uiBitIncrement<<1;
3644
3645  Int  iTemp;
3646
3647  for( ; iRows != 0; iRows-- )
3648  {
3649
3650    iTemp = piOrg[ 0] - piCur[ 0]; uiSum += ( iTemp * iTemp ) >> uiShift;
3651    iTemp = piOrg[ 1] - piCur[ 1]; uiSum += ( iTemp * iTemp ) >> uiShift;
3652    iTemp = piOrg[ 2] - piCur[ 2]; uiSum += ( iTemp * iTemp ) >> uiShift;
3653    iTemp = piOrg[ 3] - piCur[ 3]; uiSum += ( iTemp * iTemp ) >> uiShift;
3654    iTemp = piOrg[ 4] - piCur[ 4]; uiSum += ( iTemp * iTemp ) >> uiShift;
3655    iTemp = piOrg[ 5] - piCur[ 5]; uiSum += ( iTemp * iTemp ) >> uiShift;
3656    iTemp = piOrg[ 6] - piCur[ 6]; uiSum += ( iTemp * iTemp ) >> uiShift;
3657    iTemp = piOrg[ 7] - piCur[ 7]; uiSum += ( iTemp * iTemp ) >> uiShift;
3658    iTemp = piOrg[ 8] - piCur[ 8]; uiSum += ( iTemp * iTemp ) >> uiShift;
3659    iTemp = piOrg[ 9] - piCur[ 9]; uiSum += ( iTemp * iTemp ) >> uiShift;
3660    iTemp = piOrg[10] - piCur[10]; uiSum += ( iTemp * iTemp ) >> uiShift;
3661    iTemp = piOrg[11] - piCur[11]; uiSum += ( iTemp * iTemp ) >> uiShift;
3662    iTemp = piOrg[12] - piCur[12]; uiSum += ( iTemp * iTemp ) >> uiShift;
3663    iTemp = piOrg[13] - piCur[13]; uiSum += ( iTemp * iTemp ) >> uiShift;
3664    iTemp = piOrg[14] - piCur[14]; uiSum += ( iTemp * iTemp ) >> uiShift;
3665    iTemp = piOrg[15] - piCur[15]; uiSum += ( iTemp * iTemp ) >> uiShift;
3666
3667    piOrg += iStrideOrg;
3668    piCur += iStrideCur;
3669  }
3670
3671  return ( uiSum );
3672}
3673
3674UInt TComWedgeDist::xGetSSE32( DistParam* pcDtParam )
3675{
3676  Pel* piOrg   = pcDtParam->pOrg;
3677  Pel* piCur   = pcDtParam->pCur;
3678  Int  iRows   = pcDtParam->iRows;
3679  Int  iStrideOrg = pcDtParam->iStrideOrg;
3680  Int  iStrideCur = pcDtParam->iStrideCur;
3681
3682  UInt uiSum = 0;
3683  UInt uiShift = g_uiBitIncrement<<1;
3684  Int  iTemp;
3685
3686  for( ; iRows != 0; iRows-- )
3687  {
3688
3689    iTemp = piOrg[ 0] - piCur[ 0]; uiSum += ( iTemp * iTemp ) >> uiShift;
3690    iTemp = piOrg[ 1] - piCur[ 1]; uiSum += ( iTemp * iTemp ) >> uiShift;
3691    iTemp = piOrg[ 2] - piCur[ 2]; uiSum += ( iTemp * iTemp ) >> uiShift;
3692    iTemp = piOrg[ 3] - piCur[ 3]; uiSum += ( iTemp * iTemp ) >> uiShift;
3693    iTemp = piOrg[ 4] - piCur[ 4]; uiSum += ( iTemp * iTemp ) >> uiShift;
3694    iTemp = piOrg[ 5] - piCur[ 5]; uiSum += ( iTemp * iTemp ) >> uiShift;
3695    iTemp = piOrg[ 6] - piCur[ 6]; uiSum += ( iTemp * iTemp ) >> uiShift;
3696    iTemp = piOrg[ 7] - piCur[ 7]; uiSum += ( iTemp * iTemp ) >> uiShift;
3697    iTemp = piOrg[ 8] - piCur[ 8]; uiSum += ( iTemp * iTemp ) >> uiShift;
3698    iTemp = piOrg[ 9] - piCur[ 9]; uiSum += ( iTemp * iTemp ) >> uiShift;
3699    iTemp = piOrg[10] - piCur[10]; uiSum += ( iTemp * iTemp ) >> uiShift;
3700    iTemp = piOrg[11] - piCur[11]; uiSum += ( iTemp * iTemp ) >> uiShift;
3701    iTemp = piOrg[12] - piCur[12]; uiSum += ( iTemp * iTemp ) >> uiShift;
3702    iTemp = piOrg[13] - piCur[13]; uiSum += ( iTemp * iTemp ) >> uiShift;
3703    iTemp = piOrg[14] - piCur[14]; uiSum += ( iTemp * iTemp ) >> uiShift;
3704    iTemp = piOrg[15] - piCur[15]; uiSum += ( iTemp * iTemp ) >> uiShift;
3705    iTemp = piOrg[16] - piCur[16]; uiSum += ( iTemp * iTemp ) >> uiShift;
3706    iTemp = piOrg[17] - piCur[17]; uiSum += ( iTemp * iTemp ) >> uiShift;
3707    iTemp = piOrg[18] - piCur[18]; uiSum += ( iTemp * iTemp ) >> uiShift;
3708    iTemp = piOrg[19] - piCur[19]; uiSum += ( iTemp * iTemp ) >> uiShift;
3709    iTemp = piOrg[20] - piCur[20]; uiSum += ( iTemp * iTemp ) >> uiShift;
3710    iTemp = piOrg[21] - piCur[21]; uiSum += ( iTemp * iTemp ) >> uiShift;
3711    iTemp = piOrg[22] - piCur[22]; uiSum += ( iTemp * iTemp ) >> uiShift;
3712    iTemp = piOrg[23] - piCur[23]; uiSum += ( iTemp * iTemp ) >> uiShift;
3713    iTemp = piOrg[24] - piCur[24]; uiSum += ( iTemp * iTemp ) >> uiShift;
3714    iTemp = piOrg[25] - piCur[25]; uiSum += ( iTemp * iTemp ) >> uiShift;
3715    iTemp = piOrg[26] - piCur[26]; uiSum += ( iTemp * iTemp ) >> uiShift;
3716    iTemp = piOrg[27] - piCur[27]; uiSum += ( iTemp * iTemp ) >> uiShift;
3717    iTemp = piOrg[28] - piCur[28]; uiSum += ( iTemp * iTemp ) >> uiShift;
3718    iTemp = piOrg[29] - piCur[29]; uiSum += ( iTemp * iTemp ) >> uiShift;
3719    iTemp = piOrg[30] - piCur[30]; uiSum += ( iTemp * iTemp ) >> uiShift;
3720    iTemp = piOrg[31] - piCur[31]; uiSum += ( iTemp * iTemp ) >> uiShift;
3721
3722    piOrg += iStrideOrg;
3723    piCur += iStrideCur;
3724  }
3725
3726  return ( uiSum );
3727}
3728
3729Void TComWedgeDist::setDistParam( UInt uiBlkWidth, UInt uiBlkHeight, WedgeDist eWDist, DistParam& rcDistParam )
3730{
3731  // set Block Width / Height
3732  rcDistParam.iCols    = uiBlkWidth;
3733  rcDistParam.iRows    = uiBlkHeight;
3734  rcDistParam.DistFunc = m_afpDistortFunc[eWDist + g_aucConvertToBit[ rcDistParam.iCols ] ];
3735
3736  // initialize
3737  rcDistParam.iSubShift  = 0;
3738}
3739
3740UInt TComWedgeDist::getDistPart( Pel* piCur, Int iCurStride,  Pel* piOrg, Int iOrgStride, UInt uiBlkWidth, UInt uiBlkHeight, WedgeDist eWDist )
3741{
3742  DistParam cDtParam;
3743  setDistParam( uiBlkWidth, uiBlkHeight, eWDist, cDtParam );
3744  cDtParam.pOrg       = piOrg;
3745  cDtParam.pCur       = piCur;
3746  cDtParam.iStrideOrg = iOrgStride;
3747  cDtParam.iStrideCur = iCurStride;
3748#ifdef DCM_RDCOST_TEMP_FIX //Temporary fix since DistParam is lacking a constructor and the variable iStep is not initialized
3749  cDtParam.iStep      = 1;
3750#endif
3751  return cDtParam.DistFunc( &cDtParam );
3752}
3753#endif
Note: See TracBrowser for help on using the repository browser.