source: 3DVCSoftware/branches/HTM-14.1-update-dev1/source/Lib/TLibCommon/TComRdCost.cpp @ 1314

Last change on this file since 1314 was 1309, checked in by tech, 9 years ago

1) Further fixes in RD optimization process. Related to:

  • Depth Intra coding.
  • Intra skip.

2) Macros for debugging.

  • Property svn:eol-style set to native
File size: 112.7 KB
Line 
1/* The copyright in this software is being made available under the BSD
2 * License, included below. This software may be subject to other third party
3 * and contributor rights, including patent rights, and no such rights are
4 * granted under this license.
5 *
6 * Copyright (c) 2010-2015, ITU/ISO/IEC
7 * All rights reserved.
8 *
9 * Redistribution and use in source and binary forms, with or without
10 * modification, are permitted provided that the following conditions are met:
11 *
12 *  * Redistributions of source code must retain the above copyright notice,
13 *    this list of conditions and the following disclaimer.
14 *  * Redistributions in binary form must reproduce the above copyright notice,
15 *    this list of conditions and the following disclaimer in the documentation
16 *    and/or other materials provided with the distribution.
17 *  * Neither the name of the ITU/ISO/IEC nor the names of its contributors may
18 *    be used to endorse or promote products derived from this software without
19 *    specific prior written permission.
20 *
21 * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
22 * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
23 * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
24 * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS
25 * BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
26 * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
27 * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
28 * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
29 * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
30 * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF
31 * THE POSSIBILITY OF SUCH DAMAGE.
32 */
33
34/** \file     TComRdCost.cpp
35    \brief    RD cost computation class
36*/
37
38#include <math.h>
39#include <assert.h>
40#include <limits>
41#include "TComRom.h"
42#include "TComRdCost.h"
43#if NH_3D
44#include "TComDataCU.h"
45#include "TComRectangle.h"
46#endif
47
48//! \ingroup TLibCommon
49//! \{
50
51#if NH_3D_VSO
52// SAIT_VSO_EST_A0033
53Double TComRdCost::m_dDisparityCoeff = 1.0;
54#endif
55TComRdCost::TComRdCost()
56{
57  init();
58}
59
60TComRdCost::~TComRdCost()
61{
62}
63
64// Calculate RD functions
65#if NH_3D_VSO
66Double TComRdCost::calcRdCost( UInt uiBits, Dist uiDistortion, Bool bFlag, DFunc eDFunc )
67#else
68Double TComRdCost::calcRdCost( UInt uiBits, Distortion uiDistortion, Bool bFlag, DFunc eDFunc )
69#endif
70{
71  Double dRdCost = 0.0;
72  Double dLambda = 0.0;
73
74  switch ( eDFunc )
75  {
76    case DF_SSE:
77      assert(0);
78      break;
79    case DF_SAD:
80#if RExt__HIGH_BIT_DEPTH_SUPPORT
81      dLambda = m_dLambdaMotionSAD[0]; // 0 is valid, because for lossless blocks, the cost equation is modified to compensate.
82#else
83      dLambda = (Double)m_uiLambdaMotionSAD[0]; // 0 is valid, because for lossless blocks, the cost equation is modified to compensate.
84#endif
85      break;
86    case DF_DEFAULT:
87      dLambda =         m_dLambda;
88      break;
89    case DF_SSE_FRAME:
90      dLambda =         m_dFrameLambda;
91      break;
92    default:
93      assert (0);
94      break;
95  }
96
97  if (bFlag) //NOTE: this "bFlag" is never true
98  {
99    // Intra8x8, Intra4x4 Block only...
100    if (m_costMode != COST_STANDARD_LOSSY)
101    {
102      dRdCost = (Double(uiDistortion) / dLambda) + Double(uiBits); // all lossless costs would have uiDistortion=0, and therefore this cost function can be used.
103    }
104    else
105    {
106      dRdCost = (((Double)uiDistortion) + ((Double)uiBits * dLambda));
107    }
108  }
109  else
110  {
111    if (eDFunc == DF_SAD)
112    {
113      if (m_costMode != COST_STANDARD_LOSSY)
114      {
115        dRdCost = ((Double(uiDistortion) * 65536) / dLambda) + Double(uiBits); // all lossless costs would have uiDistortion=0, and therefore this cost function can be used.
116      }
117      else
118      {
119        dRdCost = floor(Double(uiDistortion) + (floor((Double(uiBits) * dLambda) + 0.5) / 65536.0));
120      }
121    }
122    else
123    {
124      if (m_costMode != COST_STANDARD_LOSSY)
125      {
126        dRdCost = (Double(uiDistortion) / dLambda) + Double(uiBits); // all lossless costs would have uiDistortion=0, and therefore this cost function can be used.
127      }
128      else
129      {
130        dRdCost = floor(Double(uiDistortion) + (Double(uiBits) * dLambda) + 0.5);
131      }
132    }
133  }
134
135  D_PRINT_INDENT( g_traceRDCost,  "Dist: " + n2s(uiDistortion) + " Bits: " + n2s(uiBits) + " RD Cost: " + n2s(dRdCost)); 
136  return dRdCost;
137}
138
139#if NH_3D_VSO
140Double TComRdCost::calcRdCost64( UInt64 uiBits, Dist64 uiDistortion, Bool bFlag, DFunc eDFunc )
141#else
142Double TComRdCost::calcRdCost64( UInt64 uiBits, UInt64 uiDistortion, Bool bFlag, DFunc eDFunc )
143#endif
144{
145  Double dRdCost = 0.0;
146  Double dLambda = 0.0;
147
148  switch ( eDFunc )
149  {
150    case DF_SSE:
151      assert(0);
152      break;
153    case DF_SAD:
154#if RExt__HIGH_BIT_DEPTH_SUPPORT
155      dLambda = m_dLambdaMotionSAD[0]; // 0 is valid, because for lossless blocks, the cost equation is modified to compensate.
156#else
157      dLambda = (Double)m_uiLambdaMotionSAD[0]; // 0 is valid, because for lossless blocks, the cost equation is modified to compensate.
158#endif
159      break;
160    case DF_DEFAULT:
161      dLambda =         m_dLambda;
162      break;
163    case DF_SSE_FRAME:
164      dLambda =         m_dFrameLambda;
165      break;
166    default:
167      assert (0);
168      break;
169  }
170
171  if (bFlag) //NOTE: this "bFlag" is never true
172  {
173    // Intra8x8, Intra4x4 Block only...
174    if (m_costMode != COST_STANDARD_LOSSY)
175    {
176      dRdCost = (Double(uiDistortion) / dLambda) + Double(uiBits); // all lossless costs would have uiDistortion=0, and therefore this cost function can be used.
177    }
178    else
179    {
180      dRdCost = (((Double)(Int64)uiDistortion) + ((Double)(Int64)uiBits * dLambda));
181    }
182  }
183  else
184  {
185    if (eDFunc == DF_SAD)
186    {
187      if (m_costMode != COST_STANDARD_LOSSY)
188      {
189        dRdCost = ((Double(uiDistortion) * 65536) / dLambda) + Double(uiBits); // all lossless costs would have uiDistortion=0, and therefore this cost function can be used.
190      }
191      else
192      {
193        dRdCost = floor(Double(uiDistortion) + (floor((Double(uiBits) * dLambda) + 0.5) / 65536.0));
194      }
195    }
196    else
197    {
198      if (m_costMode != COST_STANDARD_LOSSY)
199      {
200        dRdCost = (Double(uiDistortion) / dLambda) + Double(uiBits); // all lossless costs would have uiDistortion=0, and therefore this cost function can be used.
201      }
202      else
203      {
204        dRdCost = floor(Double(uiDistortion) + (Double(uiBits) * dLambda) + 0.5);
205      }
206    }
207  }
208
209  return dRdCost;
210}
211
212Void TComRdCost::setLambda( Double dLambda, const BitDepths &bitDepths )
213{
214  m_dLambda           = dLambda;
215  m_sqrtLambda        = sqrt(m_dLambda);
216#if RExt__HIGH_BIT_DEPTH_SUPPORT
217  m_dLambdaMotionSAD[0] = 65536.0 * m_sqrtLambda;
218  m_dLambdaMotionSSE[0] = 65536.0 * m_dLambda;
219#if FULL_NBIT
220  dLambda = 0.57 * pow(2.0, ((LOSSLESS_AND_MIXED_LOSSLESS_RD_COST_TEST_QP_PRIME - 12) / 3.0));
221#else
222  dLambda = 0.57 * pow(2.0, ((LOSSLESS_AND_MIXED_LOSSLESS_RD_COST_TEST_QP_PRIME - 12 - 6 * (bitDepths.recon[CHANNEL_TYPE_LUMA] - 8)) / 3.0));
223#endif
224  m_dLambdaMotionSAD[1] = 65536.0 * sqrt(dLambda);
225  m_dLambdaMotionSSE[1] = 65536.0 * dLambda;
226#else
227  m_uiLambdaMotionSAD[0] = (UInt)floor(65536.0 * m_sqrtLambda);
228  m_uiLambdaMotionSSE[0] = (UInt)floor(65536.0 * m_dLambda   );
229#if FULL_NBIT
230  dLambda = 0.57 * pow(2.0, ((LOSSLESS_AND_MIXED_LOSSLESS_RD_COST_TEST_QP_PRIME - 12) / 3.0));
231#else
232  dLambda = 0.57 * pow(2.0, ((LOSSLESS_AND_MIXED_LOSSLESS_RD_COST_TEST_QP_PRIME - 12 - 6 * (bitDepths.recon[CHANNEL_TYPE_LUMA] - 8)) / 3.0));
233#endif
234  m_uiLambdaMotionSAD[1] = (UInt)floor(65536.0 * sqrt(dLambda));
235  m_uiLambdaMotionSSE[1] = (UInt)floor(65536.0 * dLambda   );
236#endif
237}
238
239
240// Initalize Function Pointer by [eDFunc]
241Void TComRdCost::init()
242{
243  m_afpDistortFunc[DF_DEFAULT] = NULL;                  // for DF_DEFAULT
244
245  m_afpDistortFunc[DF_SSE    ] = TComRdCost::xGetSSE;
246  m_afpDistortFunc[DF_SSE4   ] = TComRdCost::xGetSSE4;
247  m_afpDistortFunc[DF_SSE8   ] = TComRdCost::xGetSSE8;
248  m_afpDistortFunc[DF_SSE16  ] = TComRdCost::xGetSSE16;
249  m_afpDistortFunc[DF_SSE32  ] = TComRdCost::xGetSSE32;
250  m_afpDistortFunc[DF_SSE64  ] = TComRdCost::xGetSSE64;
251  m_afpDistortFunc[DF_SSE16N ] = TComRdCost::xGetSSE16N;
252
253  m_afpDistortFunc[DF_SAD    ] = TComRdCost::xGetSAD;
254  m_afpDistortFunc[DF_SAD4   ] = TComRdCost::xGetSAD4;
255  m_afpDistortFunc[DF_SAD8   ] = TComRdCost::xGetSAD8;
256  m_afpDistortFunc[DF_SAD16  ] = TComRdCost::xGetSAD16;
257  m_afpDistortFunc[DF_SAD32  ] = TComRdCost::xGetSAD32;
258  m_afpDistortFunc[DF_SAD64  ] = TComRdCost::xGetSAD64;
259  m_afpDistortFunc[DF_SAD16N ] = TComRdCost::xGetSAD16N;
260
261  m_afpDistortFunc[DF_SADS   ] = TComRdCost::xGetSAD;
262  m_afpDistortFunc[DF_SADS4  ] = TComRdCost::xGetSAD4;
263  m_afpDistortFunc[DF_SADS8  ] = TComRdCost::xGetSAD8;
264  m_afpDistortFunc[DF_SADS16 ] = TComRdCost::xGetSAD16;
265  m_afpDistortFunc[DF_SADS32 ] = TComRdCost::xGetSAD32;
266  m_afpDistortFunc[DF_SADS64 ] = TComRdCost::xGetSAD64;
267  m_afpDistortFunc[DF_SADS16N] = TComRdCost::xGetSAD16N;
268
269  m_afpDistortFunc[DF_SAD12  ] = TComRdCost::xGetSAD12;
270  m_afpDistortFunc[DF_SAD24  ] = TComRdCost::xGetSAD24;
271  m_afpDistortFunc[DF_SAD48  ] = TComRdCost::xGetSAD48;
272
273  m_afpDistortFunc[DF_SADS12 ] = TComRdCost::xGetSAD12;
274  m_afpDistortFunc[DF_SADS24 ] = TComRdCost::xGetSAD24;
275  m_afpDistortFunc[DF_SADS48 ] = TComRdCost::xGetSAD48;
276
277  m_afpDistortFunc[DF_HADS   ] = TComRdCost::xGetHADs;
278  m_afpDistortFunc[DF_HADS4  ] = TComRdCost::xGetHADs;
279  m_afpDistortFunc[DF_HADS8  ] = TComRdCost::xGetHADs;
280  m_afpDistortFunc[DF_HADS16 ] = TComRdCost::xGetHADs;
281  m_afpDistortFunc[DF_HADS32 ] = TComRdCost::xGetHADs;
282  m_afpDistortFunc[DF_HADS64 ] = TComRdCost::xGetHADs;
283  m_afpDistortFunc[DF_HADS16N] = TComRdCost::xGetHADs;
284
285#if NH_3D_VSO
286  // SAIT_VSO_EST_A0033
287  m_afpDistortFunc[29]  = TComRdCost::xGetVSD;
288  m_afpDistortFunc[30]  = TComRdCost::xGetVSD4;
289  m_afpDistortFunc[31]  = TComRdCost::xGetVSD8;
290  m_afpDistortFunc[32]  = TComRdCost::xGetVSD16;
291  m_afpDistortFunc[33]  = TComRdCost::xGetVSD32;
292  m_afpDistortFunc[34]  = TComRdCost::xGetVSD64;
293  m_afpDistortFunc[35]  = TComRdCost::xGetVSD16N;
294#endif
295
296  m_costMode                   = COST_STANDARD_LOSSY;
297
298#if RExt__HIGH_BIT_DEPTH_SUPPORT
299  m_dCost                      = 0;
300#else
301  m_uiCost                     = 0;
302#endif
303  m_iCostScale                 = 0;
304
305#if NH_3D_VSO
306  m_bUseVSO                 = false;
307  m_uiVSOMode               = 0; 
308  m_fpDistortFuncVSO        = NULL; 
309  m_pcRenModel              = NULL; 
310
311  // SAIT_VSO_EST_A0033
312  m_bUseEstimatedVSD        = false; 
313#endif
314#if NH_3D_DBBP
315  m_bUseMask                = false;
316#endif
317
318}
319
320// Static member function
321UInt TComRdCost::xGetExpGolombNumberOfBits( Int iVal )
322{
323  assert(iVal != std::numeric_limits<Int>::min());
324  UInt uiLength = 1;
325  UInt uiTemp   = ( iVal <= 0) ? (UInt(-iVal)<<1)+1: UInt(iVal<<1);
326
327  while ( 1 != uiTemp )
328  {
329    uiTemp >>= 1;
330    uiLength += 2;
331  }
332
333  return uiLength;
334}
335
336Void TComRdCost::setDistParam( UInt uiBlkWidth, UInt uiBlkHeight, DFunc eDFunc, DistParam& rcDistParam )
337{
338  // set Block Width / Height
339  rcDistParam.iCols    = uiBlkWidth;
340  rcDistParam.iRows    = uiBlkHeight;
341  rcDistParam.DistFunc = m_afpDistortFunc[eDFunc + g_aucConvertToBit[ rcDistParam.iCols ] + 1 ];
342
343#if NH_3D_DBBP
344  if( m_bUseMask )
345  {
346    if( eDFunc >= DF_SSE && eDFunc <= DF_SSE16N )
347    {
348      rcDistParam.DistFunc = TComRdCost::xGetMaskedSSE;
349    }
350    else if( eDFunc >= DF_SAD && eDFunc <= DF_SADS16N )
351    {
352      rcDistParam.DistFunc = TComRdCost::xGetMaskedSAD;
353    }
354    else if( eDFunc >= DF_HADS && eDFunc <= DF_HADS16N )
355    {
356      rcDistParam.DistFunc = TComRdCost::xGetMaskedSAD;
357    }
358    else if( eDFunc >= DF_VSD && eDFunc <= DF_VSD16N )
359    {
360      rcDistParam.DistFunc = TComRdCost::xGetMaskedVSD;
361    }
362    else if( eDFunc >= DF_SAD12 && eDFunc <= DF_SADS48 )
363    {
364      rcDistParam.DistFunc = TComRdCost::xGetMaskedSAD;
365    }
366  }
367#endif
368  // initialize
369  rcDistParam.iSubShift  = 0;
370}
371
372// Setting the Distortion Parameter for Inter (ME)
373Void TComRdCost::setDistParam( TComPattern* pcPatternKey, Pel* piRefY, Int iRefStride, DistParam& rcDistParam )
374{
375  // set Original & Curr Pointer / Stride
376  rcDistParam.pOrg = pcPatternKey->getROIY();
377  rcDistParam.pCur = piRefY;
378
379  rcDistParam.iStrideOrg = pcPatternKey->getPatternLStride();
380  rcDistParam.iStrideCur = iRefStride;
381
382  // set Block Width / Height
383  rcDistParam.iCols    = pcPatternKey->getROIYWidth();
384  rcDistParam.iRows    = pcPatternKey->getROIYHeight();
385  rcDistParam.DistFunc = m_afpDistortFunc[DF_SAD + g_aucConvertToBit[ rcDistParam.iCols ] + 1 ];
386
387  if (rcDistParam.iCols == 12)
388  {
389    rcDistParam.DistFunc = m_afpDistortFunc[DF_SAD12];
390  }
391  else if (rcDistParam.iCols == 24)
392  {
393    rcDistParam.DistFunc = m_afpDistortFunc[DF_SAD24];
394  }
395  else if (rcDistParam.iCols == 48)
396  {
397    rcDistParam.DistFunc = m_afpDistortFunc[DF_SAD48];
398  }
399
400#if NH_3D_DBBP
401  if( m_bUseMask )
402  {
403    rcDistParam.DistFunc = TComRdCost::xGetMaskedSAD;
404  }
405#endif
406  // initialize
407  rcDistParam.iSubShift  = 0;
408}
409
410// Setting the Distortion Parameter for Inter (subpel ME with step)
411Void TComRdCost::setDistParam( TComPattern* pcPatternKey, Pel* piRefY, Int iRefStride, Int iStep, DistParam& rcDistParam, Bool bHADME )
412{
413  // set Original & Curr Pointer / Stride
414  rcDistParam.pOrg = pcPatternKey->getROIY();
415  rcDistParam.pCur = piRefY;
416
417  rcDistParam.iStrideOrg = pcPatternKey->getPatternLStride();
418  rcDistParam.iStrideCur = iRefStride * iStep;
419
420  // set Step for interpolated buffer
421  rcDistParam.iStep = iStep;
422
423  // set Block Width / Height
424  rcDistParam.iCols    = pcPatternKey->getROIYWidth();
425  rcDistParam.iRows    = pcPatternKey->getROIYHeight();
426
427  // set distortion function
428  if ( !bHADME )
429  {
430    rcDistParam.DistFunc = m_afpDistortFunc[DF_SADS + g_aucConvertToBit[ rcDistParam.iCols ] + 1 ];
431    if (rcDistParam.iCols == 12)
432    {
433      rcDistParam.DistFunc = m_afpDistortFunc[DF_SADS12];
434    }
435    else if (rcDistParam.iCols == 24)
436    {
437      rcDistParam.DistFunc = m_afpDistortFunc[DF_SADS24];
438    }
439    else if (rcDistParam.iCols == 48)
440    {
441      rcDistParam.DistFunc = m_afpDistortFunc[DF_SADS48];
442    }
443  }
444  else
445  {
446    rcDistParam.DistFunc = m_afpDistortFunc[DF_HADS + g_aucConvertToBit[ rcDistParam.iCols ] + 1 ];
447  }
448
449#if NH_3D_DBBP
450  if( m_bUseMask )
451  {
452    rcDistParam.DistFunc = TComRdCost::xGetMaskedSAD;
453  }
454#endif
455  // initialize
456  rcDistParam.iSubShift  = 0;
457}
458
459Void TComRdCost::setDistParam( DistParam& rcDP, Int bitDepth, Pel* p1, Int iStride1, Pel* p2, Int iStride2, Int iWidth, Int iHeight, Bool bHadamard )
460{
461  rcDP.pOrg       = p1;
462  rcDP.pCur       = p2;
463  rcDP.iStrideOrg = iStride1;
464  rcDP.iStrideCur = iStride2;
465  rcDP.iCols      = iWidth;
466  rcDP.iRows      = iHeight;
467  rcDP.iStep      = 1;
468  rcDP.iSubShift  = 0;
469  rcDP.bitDepth   = bitDepth;
470  rcDP.DistFunc   = m_afpDistortFunc[ ( bHadamard ? DF_HADS : DF_SADS ) + g_aucConvertToBit[ iWidth ] + 1 ];
471#if NH_3D_DBBP
472  if( m_bUseMask )
473  {
474    rcDP.DistFunc = TComRdCost::xGetMaskedSAD;
475  }
476#endif
477}
478
479Distortion TComRdCost::calcHAD( Int bitDepth, Pel* pi0, Int iStride0, Pel* pi1, Int iStride1, Int iWidth, Int iHeight )
480{
481  Distortion uiSum = 0;
482  Int x, y;
483
484  if ( ( (iWidth % 8) == 0 ) && ( (iHeight % 8) == 0 ) )
485  {
486    for ( y=0; y<iHeight; y+= 8 )
487    {
488      for ( x=0; x<iWidth; x+= 8 )
489      {
490        uiSum += xCalcHADs8x8( &pi0[x], &pi1[x], iStride0, iStride1, 1 );
491      }
492      pi0 += iStride0*8;
493      pi1 += iStride1*8;
494    }
495  }
496  else
497  {
498    assert ( ( (iWidth % 4) == 0 ) && ( (iHeight % 4) == 0 ) );
499
500    for ( y=0; y<iHeight; y+= 4 )
501    {
502      for ( x=0; x<iWidth; x+= 4 )
503      {
504        uiSum += xCalcHADs4x4( &pi0[x], &pi1[x], iStride0, iStride1, 1 );
505      }
506      pi0 += iStride0*4;
507      pi1 += iStride1*4;
508    }
509  }
510
511  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(bitDepth-8) );
512}
513
514#if NH_3D_ENC_DEPTH
515UInt TComRdCost::calcVAR (Pel* pi0, Int stride, Int width, Int height, Int cuDepth, UInt maxCuWidth)
516{ 
517  Int temp = 0;
518
519  for (Int y = 0; y < height; y++)
520  {
521    for (Int x = 0; x < width; x++)
522    {
523      temp += pi0[ y * stride + x ]; 
524    }
525  }
526
527  Int cuMaxLog2Size = g_aucConvertToBit[maxCuWidth]+2;
528 
529  if ( width == 4 ) 
530  {
531    cuDepth = cuMaxLog2Size - 2;
532  }
533
534  temp = temp >> (cuMaxLog2Size-cuDepth) * 2;
535
536  UInt sum = 0;
537  for (Int y = 0; y < height; y++)
538  {
539    for (Int x = 0; x <  width; x++)
540    {
541      sum += (pi0[ y * stride + x ] - temp ) * (pi0[ y * stride + x ] - temp );
542    }
543  }
544  return (sum >> (cuMaxLog2Size-cuDepth)*2);
545
546}
547#endif
548
549
550Distortion TComRdCost::getDistPart( Int bitDepth, Pel* piCur, Int iCurStride,  Pel* piOrg, Int iOrgStride, UInt uiBlkWidth, UInt uiBlkHeight, const ComponentID compID, DFunc eDFunc )
551{
552  DistParam cDtParam;
553  setDistParam( uiBlkWidth, uiBlkHeight, eDFunc, cDtParam );
554  cDtParam.pOrg       = piOrg;
555  cDtParam.pCur       = piCur;
556  cDtParam.iStrideOrg = iOrgStride;
557  cDtParam.iStrideCur = iCurStride;
558  cDtParam.iStep      = 1;
559
560  cDtParam.bApplyWeight = false;
561  cDtParam.compIdx      = MAX_NUM_COMPONENT; // just for assert: to be sure it was set before use
562  cDtParam.bitDepth     = bitDepth;
563
564#if NH_3D_IC
565  cDtParam.bUseIC       = false;
566#endif
567#if NH_3D_SDC_INTER
568  cDtParam.bUseSDCMRSAD = false;
569#endif
570
571  if (isChroma(compID))
572  {
573    return ((Distortion) (m_distortionWeight[compID] * cDtParam.DistFunc( &cDtParam )));
574  }
575  else
576  {
577    return cDtParam.DistFunc( &cDtParam );
578  }
579}
580#if NH_3D_VSO
581// SAIT_VSO_EST_A0033
582UInt TComRdCost::getDistPartVSD( TComDataCU* pcCU, UInt uiPartOffset, Int bitDepth, Pel* piCur, Int iCurStride,  Pel* piOrg, Int iOrgStride, UInt uiBlkWidth, UInt uiBlkHeight,  Bool bHAD, DFunc eDFunc )
583{
584  AOT( ( m_dDisparityCoeff <= 0 ) || ( m_dDisparityCoeff > 10 ) );
585
586  Pel* piVirRec  = m_pcVideoRecPicYuv->getAddr( COMPONENT_Y, pcCU->getCtuRsAddr( ), pcCU->getZorderIdxInCtu()+uiPartOffset ); 
587  Pel* piVirOrg  = m_pcDepthPicYuv   ->getAddr( COMPONENT_Y, pcCU->getCtuRsAddr( ), pcCU->getZorderIdxInCtu()+uiPartOffset ); 
588  Int iVirStride = m_pcVideoRecPicYuv->getStride( COMPONENT_Y );   
589
590  DistParam cDtParam;
591  setDistParam( uiBlkWidth, uiBlkHeight, eDFunc, cDtParam );
592  cDtParam.pOrg       = piOrg;
593  cDtParam.pCur       = piCur;
594  cDtParam.pVirRec    = piVirRec;
595  cDtParam.pVirOrg    = piVirOrg;
596  cDtParam.iStrideVir = iVirStride;
597  cDtParam.iStrideOrg = iOrgStride;
598  cDtParam.iStrideCur = iCurStride;
599  cDtParam.iStep      = 1;
600
601  cDtParam.bApplyWeight = false; 
602
603  cDtParam.bitDepth   = bitDepth;
604
605#if NH_3D_IC_FIX
606  cDtParam.bUseIC       = false;
607#endif
608#if NH_3D_SDC_INTER
609  cDtParam.bUseSDCMRSAD = false;
610#endif
611
612  Dist dist = cDtParam.DistFunc( &cDtParam );
613
614  if ( m_bUseWVSO )   
615  {
616    Int iDWeight   = m_iDWeight   * m_iDWeight;
617    Int iVSOWeight = m_iVSDWeight * m_iVSDWeight;
618    Dist distDepth;
619
620    if ( !bHAD )
621    {
622      distDepth = (Dist) getDistPart( bitDepth, piCur, iCurStride, piOrg, iOrgStride, uiBlkWidth, uiBlkHeight, COMPONENT_Y);
623    }
624    else
625    {
626      distDepth = (Dist) calcHAD( bitDepth, piCur, iCurStride, piOrg, iOrgStride, uiBlkWidth, uiBlkHeight);
627    }
628
629    dist = (Dist) (iDWeight * distDepth + iVSOWeight * dist ) / ( iDWeight + iVSOWeight);
630  }
631
632  return (UInt) dist; 
633}
634#endif
635
636#if KWU_RC_MADPRED_E0227
637UInt TComRdCost::getSADPart ( Int bitDepth, Pel* pelCur, Int curStride,  Pel* pelOrg, Int orgStride, UInt width, UInt height )
638{
639  UInt SAD = 0;
640  Int shift = DISTORTION_PRECISION_ADJUSTMENT(bitDepth-8);
641  for ( Int i=0; i<height; i++ )
642  {
643    for( Int j=0; j<width; j++ )
644    {
645      SAD += abs((pelCur[j] - pelOrg[j])) >> shift;
646    }
647    pelCur = pelCur + curStride;
648    pelOrg = pelOrg + orgStride;
649  }
650  return SAD;
651}
652#endif
653
654// ====================================================================================================================
655// Distortion functions
656// ====================================================================================================================
657
658#if NH_3D_DBBP
659// --------------------------------------------------------------------------------------------------------------------
660// Masked distortion functions
661// --------------------------------------------------------------------------------------------------------------------
662
663UInt TComRdCost::xGetMaskedSSE( DistParam* pcDtParam )
664{
665  Pel* piOrg   = pcDtParam->pOrg;
666  Pel* piCur   = pcDtParam->pCur;
667  Int  iRows   = pcDtParam->iRows;
668  Int  iCols   = pcDtParam->iCols;
669  Int  iStrideOrg = pcDtParam->iStrideOrg;
670  Int  iStrideCur = pcDtParam->iStrideCur;
671 
672  UInt uiSum = 0;
673 
674  UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
675 
676  Int iTemp;
677 
678  for( ; iRows != 0; iRows-- )
679  {
680    for (Int n = 0; n < iCols; n++ )
681    {
682      if( piOrg[n] != DBBP_INVALID_SHORT )
683      {
684        iTemp = piOrg[] - piCur[];
685        uiSum += ( iTemp * iTemp ) >> uiShift;
686      }
687    }
688    piOrg += iStrideOrg;
689    piCur += iStrideCur;
690  }
691 
692  return ( uiSum );
693}
694
695UInt TComRdCost::xGetMaskedSAD( DistParam* pcDtParam )
696{
697 
698  AOF(!pcDtParam->bApplyWeight);
699#if NH_3D_IC
700  AOF(!pcDtParam->bUseIC);
701#endif
702 
703  Pel* piOrg   = pcDtParam->pOrg;
704  Pel* piCur   = pcDtParam->pCur;
705  Int  iRows   = pcDtParam->iRows;
706  Int  iCols   = pcDtParam->iCols;
707  Int  iStrideCur = pcDtParam->iStrideCur;
708  Int  iStrideOrg = pcDtParam->iStrideOrg;
709 
710  UInt uiSum = 0;
711 
712  for( ; iRows != 0; iRows-- )
713  {
714    for (Int n = 0; n < iCols; n++ )
715    {
716      if( piOrg[n] != DBBP_INVALID_SHORT )
717      {
718        uiSum += abs( piOrg[n] - piCur[n] );
719      }
720    }
721    piOrg += iStrideOrg;
722    piCur += iStrideCur;
723  }
724 
725  return uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8);
726}
727
728
729UInt TComRdCost::xGetMaskedVSD( DistParam* pcDtParam )
730{
731  Pel* piOrg    = pcDtParam->pOrg;
732  Pel* piCur    = pcDtParam->pCur;
733  Pel* piVirRec = pcDtParam->pVirRec;
734  Pel* piVirOrg = pcDtParam->pVirOrg;
735  Int  iRows    = pcDtParam->iRows;
736  Int  iCols    = pcDtParam->iCols;
737  Int  iStrideOrg = pcDtParam->iStrideOrg;
738  Int  iStrideCur = pcDtParam->iStrideCur;
739  Int  iStrideVir = pcDtParam->iStrideVir;
740 
741  UInt uiSum = 0;
742  UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8)<<1;
743 
744  Int dDM;
745 
746  for ( Int y = 0 ; y < iRows ; y++ )
747  {
748    for (Int x = 0; x < iCols; x++ )
749    {
750      if( piOrg[x] != DBBP_INVALID_SHORT )
751      {
752        dDM = (Int) ( piOrg[] - piCur[] );
753        uiSum += getVSDEstimate( dDM, piOrg, iStrideOrg, piVirRec, piVirOrg, iStrideVir, x, y ) >> uiShift;
754      }
755    }
756    piOrg += iStrideOrg;
757    piCur += iStrideCur;
758  }
759 
760  return ( uiSum );
761}
762#endif
763// --------------------------------------------------------------------------------------------------------------------
764// SAD
765// --------------------------------------------------------------------------------------------------------------------
766
767Distortion TComRdCost::xGetSAD( DistParam* pcDtParam )
768{
769  if ( pcDtParam->bApplyWeight )
770  {
771    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
772  }
773#if NH_3D_IC
774  if( pcDtParam->bUseIC )
775  {
776    return xGetSADic( pcDtParam );
777  }
778#endif
779#if NH_3D_SDC_INTER
780  if( pcDtParam->bUseSDCMRSAD )
781  {
782    return xGetSADic( pcDtParam );
783  }
784#endif
785
786  const Pel* piOrg   = pcDtParam->pOrg;
787  const Pel* piCur   = pcDtParam->pCur;
788  Int  iRows   = pcDtParam->iRows;
789  Int  iCols   = pcDtParam->iCols;
790  Int  iStrideCur = pcDtParam->iStrideCur;
791  Int  iStrideOrg = pcDtParam->iStrideOrg;
792
793  Distortion uiSum = 0;
794
795  for( ; iRows != 0; iRows-- )
796  {
797    for (Int n = 0; n < iCols; n++ )
798    {
799      uiSum += abs( piOrg[n] - piCur[n] );
800    }
801    piOrg += iStrideOrg;
802    piCur += iStrideCur;
803  }
804
805  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
806}
807
808Distortion TComRdCost::xGetSAD4( DistParam* pcDtParam )
809{
810  if ( pcDtParam->bApplyWeight )
811  {
812    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
813  }
814
815#if NH_3D_IC
816  if( pcDtParam->bUseIC )
817  {
818    return xGetSAD4ic( pcDtParam );
819  }
820#endif
821#if NH_3D_SDC_INTER
822  if( pcDtParam->bUseSDCMRSAD )
823  {
824    return xGetSAD4ic( pcDtParam );
825  }
826#endif
827
828  const Pel* piOrg   = pcDtParam->pOrg;
829  const Pel* piCur   = pcDtParam->pCur;
830  Int  iRows   = pcDtParam->iRows;
831  Int  iSubShift  = pcDtParam->iSubShift;
832  Int  iSubStep   = ( 1 << iSubShift );
833  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
834  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
835
836  Distortion uiSum = 0;
837
838  for( ; iRows != 0; iRows-=iSubStep )
839  {
840    uiSum += abs( piOrg[0] - piCur[0] );
841    uiSum += abs( piOrg[1] - piCur[1] );
842    uiSum += abs( piOrg[2] - piCur[2] );
843    uiSum += abs( piOrg[3] - piCur[3] );
844
845    piOrg += iStrideOrg;
846    piCur += iStrideCur;
847  }
848
849  uiSum <<= iSubShift;
850  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
851}
852
853Distortion TComRdCost::xGetSAD8( DistParam* pcDtParam )
854{
855  if ( pcDtParam->bApplyWeight )
856  {
857    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
858  }
859
860#if NH_3D_IC
861  if( pcDtParam->bUseIC )
862  {
863    return xGetSAD8ic( pcDtParam );
864  }
865#endif
866#if NH_3D_SDC_INTER
867  if( pcDtParam->bUseSDCMRSAD )
868  {
869    return xGetSAD8ic( pcDtParam );
870  }
871#endif
872
873  const Pel* piOrg      = pcDtParam->pOrg;
874  const Pel* piCur      = pcDtParam->pCur;
875  Int  iRows      = pcDtParam->iRows;
876  Int  iSubShift  = pcDtParam->iSubShift;
877  Int  iSubStep   = ( 1 << iSubShift );
878  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
879  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
880
881  Distortion uiSum = 0;
882
883  for( ; iRows != 0; iRows-=iSubStep )
884  {
885    uiSum += abs( piOrg[0] - piCur[0] );
886    uiSum += abs( piOrg[1] - piCur[1] );
887    uiSum += abs( piOrg[2] - piCur[2] );
888    uiSum += abs( piOrg[3] - piCur[3] );
889    uiSum += abs( piOrg[4] - piCur[4] );
890    uiSum += abs( piOrg[5] - piCur[5] );
891    uiSum += abs( piOrg[6] - piCur[6] );
892    uiSum += abs( piOrg[7] - piCur[7] );
893
894    piOrg += iStrideOrg;
895    piCur += iStrideCur;
896  }
897
898  uiSum <<= iSubShift;
899  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
900}
901
902Distortion TComRdCost::xGetSAD16( DistParam* pcDtParam )
903{
904  if ( pcDtParam->bApplyWeight )
905  {
906    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
907  }
908
909#if NH_3D_IC
910  if( pcDtParam->bUseIC )
911  {
912    return xGetSAD16ic( pcDtParam );
913  }
914#endif
915#if NH_3D_SDC_INTER
916  if( pcDtParam->bUseSDCMRSAD )
917  {
918    return xGetSAD16ic( pcDtParam );
919  }
920#endif
921
922  const Pel* piOrg   = pcDtParam->pOrg;
923  const Pel* piCur   = pcDtParam->pCur;
924  Int  iRows   = pcDtParam->iRows;
925  Int  iSubShift  = pcDtParam->iSubShift;
926  Int  iSubStep   = ( 1 << iSubShift );
927  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
928  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
929
930  Distortion uiSum = 0;
931
932  for( ; iRows != 0; iRows-=iSubStep )
933  {
934    uiSum += abs( piOrg[0] - piCur[0] );
935    uiSum += abs( piOrg[1] - piCur[1] );
936    uiSum += abs( piOrg[2] - piCur[2] );
937    uiSum += abs( piOrg[3] - piCur[3] );
938    uiSum += abs( piOrg[4] - piCur[4] );
939    uiSum += abs( piOrg[5] - piCur[5] );
940    uiSum += abs( piOrg[6] - piCur[6] );
941    uiSum += abs( piOrg[7] - piCur[7] );
942    uiSum += abs( piOrg[8] - piCur[8] );
943    uiSum += abs( piOrg[9] - piCur[9] );
944    uiSum += abs( piOrg[10] - piCur[10] );
945    uiSum += abs( piOrg[11] - piCur[11] );
946    uiSum += abs( piOrg[12] - piCur[12] );
947    uiSum += abs( piOrg[13] - piCur[13] );
948    uiSum += abs( piOrg[14] - piCur[14] );
949    uiSum += abs( piOrg[15] - piCur[15] );
950
951    piOrg += iStrideOrg;
952    piCur += iStrideCur;
953  }
954
955  uiSum <<= iSubShift;
956  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
957}
958
959Distortion TComRdCost::xGetSAD12( DistParam* pcDtParam )
960{
961  if ( pcDtParam->bApplyWeight )
962  {
963    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
964  }
965#if NH_3D_IC
966  if( pcDtParam->bUseIC )
967  {
968    return xGetSAD12ic( pcDtParam );
969  }
970#endif
971#if NH_3D_SDC_INTER
972  if( pcDtParam->bUseSDCMRSAD )
973  {
974    return xGetSAD12ic( pcDtParam );
975  }
976#endif
977
978  const Pel* piOrg   = pcDtParam->pOrg;
979  const Pel* piCur   = pcDtParam->pCur;
980  Int  iRows   = pcDtParam->iRows;
981  Int  iSubShift  = pcDtParam->iSubShift;
982  Int  iSubStep   = ( 1 << iSubShift );
983  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
984  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
985
986  Distortion uiSum = 0;
987
988  for( ; iRows != 0; iRows-=iSubStep )
989  {
990    uiSum += abs( piOrg[0] - piCur[0] );
991    uiSum += abs( piOrg[1] - piCur[1] );
992    uiSum += abs( piOrg[2] - piCur[2] );
993    uiSum += abs( piOrg[3] - piCur[3] );
994    uiSum += abs( piOrg[4] - piCur[4] );
995    uiSum += abs( piOrg[5] - piCur[5] );
996    uiSum += abs( piOrg[6] - piCur[6] );
997    uiSum += abs( piOrg[7] - piCur[7] );
998    uiSum += abs( piOrg[8] - piCur[8] );
999    uiSum += abs( piOrg[9] - piCur[9] );
1000    uiSum += abs( piOrg[10] - piCur[10] );
1001    uiSum += abs( piOrg[11] - piCur[11] );
1002
1003    piOrg += iStrideOrg;
1004    piCur += iStrideCur;
1005  }
1006
1007  uiSum <<= iSubShift;
1008  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
1009}
1010
1011Distortion TComRdCost::xGetSAD16N( DistParam* pcDtParam )
1012{
1013#if NH_3D_IC
1014  if( pcDtParam->bUseIC )
1015  {
1016    return xGetSAD16Nic( pcDtParam );
1017  }
1018#endif
1019#if NH_3D_SDC_INTER
1020  if( pcDtParam->bUseSDCMRSAD )
1021  {
1022    return xGetSAD16Nic( pcDtParam );
1023  }
1024#endif
1025
1026  const Pel* piOrg   = pcDtParam->pOrg;
1027  const Pel* piCur   = pcDtParam->pCur;
1028  Int  iRows   = pcDtParam->iRows;
1029  Int  iCols   = pcDtParam->iCols;
1030  Int  iSubShift  = pcDtParam->iSubShift;
1031  Int  iSubStep   = ( 1 << iSubShift );
1032  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1033  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1034
1035  Distortion uiSum = 0;
1036
1037  for( ; iRows != 0; iRows-=iSubStep )
1038  {
1039    for (Int n = 0; n < iCols; n+=16 )
1040    {
1041      uiSum += abs( piOrg[n+ 0] - piCur[n+ 0] );
1042      uiSum += abs( piOrg[n+ 1] - piCur[n+ 1] );
1043      uiSum += abs( piOrg[n+ 2] - piCur[n+ 2] );
1044      uiSum += abs( piOrg[n+ 3] - piCur[n+ 3] );
1045      uiSum += abs( piOrg[n+ 4] - piCur[n+ 4] );
1046      uiSum += abs( piOrg[n+ 5] - piCur[n+ 5] );
1047      uiSum += abs( piOrg[n+ 6] - piCur[n+ 6] );
1048      uiSum += abs( piOrg[n+ 7] - piCur[n+ 7] );
1049      uiSum += abs( piOrg[n+ 8] - piCur[n+ 8] );
1050      uiSum += abs( piOrg[n+ 9] - piCur[n+ 9] );
1051      uiSum += abs( piOrg[n+10] - piCur[n+10] );
1052      uiSum += abs( piOrg[n+11] - piCur[n+11] );
1053      uiSum += abs( piOrg[n+12] - piCur[n+12] );
1054      uiSum += abs( piOrg[n+13] - piCur[n+13] );
1055      uiSum += abs( piOrg[n+14] - piCur[n+14] );
1056      uiSum += abs( piOrg[n+15] - piCur[n+15] );
1057    }
1058    piOrg += iStrideOrg;
1059    piCur += iStrideCur;
1060  }
1061
1062  uiSum <<= iSubShift;
1063  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
1064}
1065
1066Distortion TComRdCost::xGetSAD32( DistParam* pcDtParam )
1067{
1068  if ( pcDtParam->bApplyWeight )
1069  {
1070    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
1071  }
1072
1073#if NH_3D_IC
1074  if( pcDtParam->bUseIC )
1075  {
1076    return xGetSAD32ic( pcDtParam );
1077  }
1078#endif
1079#if NH_3D_SDC_INTER
1080  if( pcDtParam->bUseSDCMRSAD )
1081  {
1082    return xGetSAD32ic( pcDtParam );
1083  }
1084#endif
1085
1086  const Pel* piOrg   = pcDtParam->pOrg;
1087  const Pel* piCur   = pcDtParam->pCur;
1088  Int  iRows   = pcDtParam->iRows;
1089  Int  iSubShift  = pcDtParam->iSubShift;
1090  Int  iSubStep   = ( 1 << iSubShift );
1091  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1092  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1093
1094  Distortion uiSum = 0;
1095
1096  for( ; iRows != 0; iRows-=iSubStep )
1097  {
1098    uiSum += abs( piOrg[0] - piCur[0] );
1099    uiSum += abs( piOrg[1] - piCur[1] );
1100    uiSum += abs( piOrg[2] - piCur[2] );
1101    uiSum += abs( piOrg[3] - piCur[3] );
1102    uiSum += abs( piOrg[4] - piCur[4] );
1103    uiSum += abs( piOrg[5] - piCur[5] );
1104    uiSum += abs( piOrg[6] - piCur[6] );
1105    uiSum += abs( piOrg[7] - piCur[7] );
1106    uiSum += abs( piOrg[8] - piCur[8] );
1107    uiSum += abs( piOrg[9] - piCur[9] );
1108    uiSum += abs( piOrg[10] - piCur[10] );
1109    uiSum += abs( piOrg[11] - piCur[11] );
1110    uiSum += abs( piOrg[12] - piCur[12] );
1111    uiSum += abs( piOrg[13] - piCur[13] );
1112    uiSum += abs( piOrg[14] - piCur[14] );
1113    uiSum += abs( piOrg[15] - piCur[15] );
1114    uiSum += abs( piOrg[16] - piCur[16] );
1115    uiSum += abs( piOrg[17] - piCur[17] );
1116    uiSum += abs( piOrg[18] - piCur[18] );
1117    uiSum += abs( piOrg[19] - piCur[19] );
1118    uiSum += abs( piOrg[20] - piCur[20] );
1119    uiSum += abs( piOrg[21] - piCur[21] );
1120    uiSum += abs( piOrg[22] - piCur[22] );
1121    uiSum += abs( piOrg[23] - piCur[23] );
1122    uiSum += abs( piOrg[24] - piCur[24] );
1123    uiSum += abs( piOrg[25] - piCur[25] );
1124    uiSum += abs( piOrg[26] - piCur[26] );
1125    uiSum += abs( piOrg[27] - piCur[27] );
1126    uiSum += abs( piOrg[28] - piCur[28] );
1127    uiSum += abs( piOrg[29] - piCur[29] );
1128    uiSum += abs( piOrg[30] - piCur[30] );
1129    uiSum += abs( piOrg[31] - piCur[31] );
1130
1131    piOrg += iStrideOrg;
1132    piCur += iStrideCur;
1133  }
1134
1135  uiSum <<= iSubShift;
1136  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
1137}
1138
1139Distortion TComRdCost::xGetSAD24( DistParam* pcDtParam )
1140{
1141  if ( pcDtParam->bApplyWeight )
1142  {
1143    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
1144  }
1145
1146#if NH_3D_IC
1147  if( pcDtParam->bUseIC )
1148  {
1149    return xGetSAD24ic( pcDtParam );
1150  }
1151#endif
1152#if NH_3D_SDC_INTER
1153  if( pcDtParam->bUseSDCMRSAD )
1154  {
1155    return xGetSAD24ic( pcDtParam );
1156  }
1157#endif
1158
1159  const Pel* piOrg   = pcDtParam->pOrg;
1160  const Pel* piCur   = pcDtParam->pCur;
1161  Int  iRows   = pcDtParam->iRows;
1162  Int  iSubShift  = pcDtParam->iSubShift;
1163  Int  iSubStep   = ( 1 << iSubShift );
1164  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1165  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1166
1167  Distortion uiSum = 0;
1168
1169  for( ; iRows != 0; iRows-=iSubStep )
1170  {
1171    uiSum += abs( piOrg[0] - piCur[0] );
1172    uiSum += abs( piOrg[1] - piCur[1] );
1173    uiSum += abs( piOrg[2] - piCur[2] );
1174    uiSum += abs( piOrg[3] - piCur[3] );
1175    uiSum += abs( piOrg[4] - piCur[4] );
1176    uiSum += abs( piOrg[5] - piCur[5] );
1177    uiSum += abs( piOrg[6] - piCur[6] );
1178    uiSum += abs( piOrg[7] - piCur[7] );
1179    uiSum += abs( piOrg[8] - piCur[8] );
1180    uiSum += abs( piOrg[9] - piCur[9] );
1181    uiSum += abs( piOrg[10] - piCur[10] );
1182    uiSum += abs( piOrg[11] - piCur[11] );
1183    uiSum += abs( piOrg[12] - piCur[12] );
1184    uiSum += abs( piOrg[13] - piCur[13] );
1185    uiSum += abs( piOrg[14] - piCur[14] );
1186    uiSum += abs( piOrg[15] - piCur[15] );
1187    uiSum += abs( piOrg[16] - piCur[16] );
1188    uiSum += abs( piOrg[17] - piCur[17] );
1189    uiSum += abs( piOrg[18] - piCur[18] );
1190    uiSum += abs( piOrg[19] - piCur[19] );
1191    uiSum += abs( piOrg[20] - piCur[20] );
1192    uiSum += abs( piOrg[21] - piCur[21] );
1193    uiSum += abs( piOrg[22] - piCur[22] );
1194    uiSum += abs( piOrg[23] - piCur[23] );
1195
1196    piOrg += iStrideOrg;
1197    piCur += iStrideCur;
1198  }
1199
1200  uiSum <<= iSubShift;
1201  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
1202}
1203
1204Distortion TComRdCost::xGetSAD64( DistParam* pcDtParam )
1205{
1206  if ( pcDtParam->bApplyWeight )
1207  {
1208    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
1209  }
1210
1211#if NH_3D_IC
1212  if( pcDtParam->bUseIC )
1213  {
1214    return xGetSAD64ic( pcDtParam );
1215  }
1216#endif
1217#if NH_3D_SDC_INTER
1218  if( pcDtParam->bUseSDCMRSAD )
1219  {
1220    return xGetSAD64ic( pcDtParam );
1221  }
1222#endif
1223
1224  const Pel* piOrg   = pcDtParam->pOrg;
1225  const Pel* piCur   = pcDtParam->pCur;
1226  Int  iRows   = pcDtParam->iRows;
1227  Int  iSubShift  = pcDtParam->iSubShift;
1228  Int  iSubStep   = ( 1 << iSubShift );
1229  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1230  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1231
1232  Distortion uiSum = 0;
1233
1234  for( ; iRows != 0; iRows-=iSubStep )
1235  {
1236    uiSum += abs( piOrg[0] - piCur[0] );
1237    uiSum += abs( piOrg[1] - piCur[1] );
1238    uiSum += abs( piOrg[2] - piCur[2] );
1239    uiSum += abs( piOrg[3] - piCur[3] );
1240    uiSum += abs( piOrg[4] - piCur[4] );
1241    uiSum += abs( piOrg[5] - piCur[5] );
1242    uiSum += abs( piOrg[6] - piCur[6] );
1243    uiSum += abs( piOrg[7] - piCur[7] );
1244    uiSum += abs( piOrg[8] - piCur[8] );
1245    uiSum += abs( piOrg[9] - piCur[9] );
1246    uiSum += abs( piOrg[10] - piCur[10] );
1247    uiSum += abs( piOrg[11] - piCur[11] );
1248    uiSum += abs( piOrg[12] - piCur[12] );
1249    uiSum += abs( piOrg[13] - piCur[13] );
1250    uiSum += abs( piOrg[14] - piCur[14] );
1251    uiSum += abs( piOrg[15] - piCur[15] );
1252    uiSum += abs( piOrg[16] - piCur[16] );
1253    uiSum += abs( piOrg[17] - piCur[17] );
1254    uiSum += abs( piOrg[18] - piCur[18] );
1255    uiSum += abs( piOrg[19] - piCur[19] );
1256    uiSum += abs( piOrg[20] - piCur[20] );
1257    uiSum += abs( piOrg[21] - piCur[21] );
1258    uiSum += abs( piOrg[22] - piCur[22] );
1259    uiSum += abs( piOrg[23] - piCur[23] );
1260    uiSum += abs( piOrg[24] - piCur[24] );
1261    uiSum += abs( piOrg[25] - piCur[25] );
1262    uiSum += abs( piOrg[26] - piCur[26] );
1263    uiSum += abs( piOrg[27] - piCur[27] );
1264    uiSum += abs( piOrg[28] - piCur[28] );
1265    uiSum += abs( piOrg[29] - piCur[29] );
1266    uiSum += abs( piOrg[30] - piCur[30] );
1267    uiSum += abs( piOrg[31] - piCur[31] );
1268    uiSum += abs( piOrg[32] - piCur[32] );
1269    uiSum += abs( piOrg[33] - piCur[33] );
1270    uiSum += abs( piOrg[34] - piCur[34] );
1271    uiSum += abs( piOrg[35] - piCur[35] );
1272    uiSum += abs( piOrg[36] - piCur[36] );
1273    uiSum += abs( piOrg[37] - piCur[37] );
1274    uiSum += abs( piOrg[38] - piCur[38] );
1275    uiSum += abs( piOrg[39] - piCur[39] );
1276    uiSum += abs( piOrg[40] - piCur[40] );
1277    uiSum += abs( piOrg[41] - piCur[41] );
1278    uiSum += abs( piOrg[42] - piCur[42] );
1279    uiSum += abs( piOrg[43] - piCur[43] );
1280    uiSum += abs( piOrg[44] - piCur[44] );
1281    uiSum += abs( piOrg[45] - piCur[45] );
1282    uiSum += abs( piOrg[46] - piCur[46] );
1283    uiSum += abs( piOrg[47] - piCur[47] );
1284    uiSum += abs( piOrg[48] - piCur[48] );
1285    uiSum += abs( piOrg[49] - piCur[49] );
1286    uiSum += abs( piOrg[50] - piCur[50] );
1287    uiSum += abs( piOrg[51] - piCur[51] );
1288    uiSum += abs( piOrg[52] - piCur[52] );
1289    uiSum += abs( piOrg[53] - piCur[53] );
1290    uiSum += abs( piOrg[54] - piCur[54] );
1291    uiSum += abs( piOrg[55] - piCur[55] );
1292    uiSum += abs( piOrg[56] - piCur[56] );
1293    uiSum += abs( piOrg[57] - piCur[57] );
1294    uiSum += abs( piOrg[58] - piCur[58] );
1295    uiSum += abs( piOrg[59] - piCur[59] );
1296    uiSum += abs( piOrg[60] - piCur[60] );
1297    uiSum += abs( piOrg[61] - piCur[61] );
1298    uiSum += abs( piOrg[62] - piCur[62] );
1299    uiSum += abs( piOrg[63] - piCur[63] );
1300
1301    piOrg += iStrideOrg;
1302    piCur += iStrideCur;
1303  }
1304
1305  uiSum <<= iSubShift;
1306  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
1307}
1308
1309Distortion TComRdCost::xGetSAD48( DistParam* pcDtParam )
1310{
1311  if ( pcDtParam->bApplyWeight )
1312  {
1313    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
1314  }
1315#if NH_3D_IC
1316  if( pcDtParam->bUseIC )
1317  {
1318    return xGetSAD48ic( pcDtParam );
1319  }
1320#endif
1321#if NH_3D_SDC_INTER
1322  if( pcDtParam->bUseSDCMRSAD )
1323  {
1324    return xGetSAD48ic( pcDtParam );
1325  }
1326#endif
1327
1328  const Pel* piOrg   = pcDtParam->pOrg;
1329  const Pel* piCur   = pcDtParam->pCur;
1330  Int  iRows   = pcDtParam->iRows;
1331  Int  iSubShift  = pcDtParam->iSubShift;
1332  Int  iSubStep   = ( 1 << iSubShift );
1333  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1334  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1335
1336  Distortion uiSum = 0;
1337
1338  for( ; iRows != 0; iRows-=iSubStep )
1339  {
1340    uiSum += abs( piOrg[0] - piCur[0] );
1341    uiSum += abs( piOrg[1] - piCur[1] );
1342    uiSum += abs( piOrg[2] - piCur[2] );
1343    uiSum += abs( piOrg[3] - piCur[3] );
1344    uiSum += abs( piOrg[4] - piCur[4] );
1345    uiSum += abs( piOrg[5] - piCur[5] );
1346    uiSum += abs( piOrg[6] - piCur[6] );
1347    uiSum += abs( piOrg[7] - piCur[7] );
1348    uiSum += abs( piOrg[8] - piCur[8] );
1349    uiSum += abs( piOrg[9] - piCur[9] );
1350    uiSum += abs( piOrg[10] - piCur[10] );
1351    uiSum += abs( piOrg[11] - piCur[11] );
1352    uiSum += abs( piOrg[12] - piCur[12] );
1353    uiSum += abs( piOrg[13] - piCur[13] );
1354    uiSum += abs( piOrg[14] - piCur[14] );
1355    uiSum += abs( piOrg[15] - piCur[15] );
1356    uiSum += abs( piOrg[16] - piCur[16] );
1357    uiSum += abs( piOrg[17] - piCur[17] );
1358    uiSum += abs( piOrg[18] - piCur[18] );
1359    uiSum += abs( piOrg[19] - piCur[19] );
1360    uiSum += abs( piOrg[20] - piCur[20] );
1361    uiSum += abs( piOrg[21] - piCur[21] );
1362    uiSum += abs( piOrg[22] - piCur[22] );
1363    uiSum += abs( piOrg[23] - piCur[23] );
1364    uiSum += abs( piOrg[24] - piCur[24] );
1365    uiSum += abs( piOrg[25] - piCur[25] );
1366    uiSum += abs( piOrg[26] - piCur[26] );
1367    uiSum += abs( piOrg[27] - piCur[27] );
1368    uiSum += abs( piOrg[28] - piCur[28] );
1369    uiSum += abs( piOrg[29] - piCur[29] );
1370    uiSum += abs( piOrg[30] - piCur[30] );
1371    uiSum += abs( piOrg[31] - piCur[31] );
1372    uiSum += abs( piOrg[32] - piCur[32] );
1373    uiSum += abs( piOrg[33] - piCur[33] );
1374    uiSum += abs( piOrg[34] - piCur[34] );
1375    uiSum += abs( piOrg[35] - piCur[35] );
1376    uiSum += abs( piOrg[36] - piCur[36] );
1377    uiSum += abs( piOrg[37] - piCur[37] );
1378    uiSum += abs( piOrg[38] - piCur[38] );
1379    uiSum += abs( piOrg[39] - piCur[39] );
1380    uiSum += abs( piOrg[40] - piCur[40] );
1381    uiSum += abs( piOrg[41] - piCur[41] );
1382    uiSum += abs( piOrg[42] - piCur[42] );
1383    uiSum += abs( piOrg[43] - piCur[43] );
1384    uiSum += abs( piOrg[44] - piCur[44] );
1385    uiSum += abs( piOrg[45] - piCur[45] );
1386    uiSum += abs( piOrg[46] - piCur[46] );
1387    uiSum += abs( piOrg[47] - piCur[47] );
1388
1389    piOrg += iStrideOrg;
1390    piCur += iStrideCur;
1391  }
1392
1393  uiSum <<= iSubShift;
1394  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
1395}
1396
1397
1398#if NH_3D_IC || NH_3D_SDC_INTER
1399UInt TComRdCost::xGetSADic( DistParam* pcDtParam )
1400{
1401  if ( pcDtParam->bApplyWeight )
1402  {
1403    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
1404  }
1405  Pel* piOrg   = pcDtParam->pOrg;
1406  Pel* piCur   = pcDtParam->pCur;
1407  Int  iRows   = pcDtParam->iRows;
1408  Int  iCols   = pcDtParam->iCols;
1409  Int  iStrideCur = pcDtParam->iStrideCur;
1410  Int  iStrideOrg = pcDtParam->iStrideOrg;
1411
1412  UInt uiSum = 0;
1413
1414  Int  iOrigAvg = 0, iCurAvg = 0;
1415  Int  iDeltaC;
1416
1417  for( ; iRows != 0; iRows-- )
1418  {
1419    for (Int n = 0; n < iCols; n++ )
1420    {
1421      iOrigAvg += piOrg[n];
1422      iCurAvg  += piCur[n];
1423    }
1424    piOrg += iStrideOrg;
1425    piCur += iStrideCur;
1426  }
1427
1428  piOrg   = pcDtParam->pOrg;
1429  piCur   = pcDtParam->pCur;
1430  iRows   = pcDtParam->iRows;
1431
1432  iDeltaC = (iOrigAvg - iCurAvg)/iCols/iRows;
1433
1434  for( ; iRows != 0; iRows-- )
1435  {
1436    for (Int n = 0; n < iCols; n++ )
1437    {
1438      uiSum += abs( piOrg[n] - piCur[n] - iDeltaC );
1439    }
1440    piOrg += iStrideOrg;
1441    piCur += iStrideCur;
1442  }
1443
1444  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT( pcDtParam->bitDepth - 8 ) );
1445}
1446
1447UInt TComRdCost::xGetSAD4ic( DistParam* pcDtParam )
1448{
1449  if ( pcDtParam->bApplyWeight ) 
1450  {
1451    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
1452  }
1453  Pel* piOrg   = pcDtParam->pOrg;
1454  Pel* piCur   = pcDtParam->pCur;
1455  Int  iRows   = pcDtParam->iRows;
1456  Int  iSubShift  = pcDtParam->iSubShift;
1457  Int  iSubStep   = ( 1 << iSubShift );
1458  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1459  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1460
1461  UInt uiSum = 0;
1462
1463  Int  iOrigAvg = 0, iCurAvg = 0, uiRowCnt = 0;
1464  Int  iDeltaC;
1465
1466  for( ; iRows != 0; iRows-=iSubStep )
1467  {
1468    iOrigAvg += piOrg[0];
1469    iOrigAvg += piOrg[1];
1470    iOrigAvg += piOrg[2];
1471    iOrigAvg += piOrg[3];
1472
1473    iCurAvg  += piCur[0];
1474    iCurAvg  += piCur[1];
1475    iCurAvg  += piCur[2];
1476    iCurAvg  += piCur[3];
1477
1478    piOrg += iStrideOrg;
1479    piCur += iStrideCur;
1480    uiRowCnt++;
1481  }
1482
1483  piOrg   = pcDtParam->pOrg;
1484  piCur   = pcDtParam->pCur;
1485  iRows   = pcDtParam->iRows;
1486
1487  iDeltaC = uiRowCnt ? ((iOrigAvg - iCurAvg)/uiRowCnt/4) : 0;
1488
1489  for( ; iRows != 0; iRows-=iSubStep )
1490  {
1491    uiSum += abs( piOrg[0] - piCur[0] - iDeltaC );
1492    uiSum += abs( piOrg[1] - piCur[1] - iDeltaC );
1493    uiSum += abs( piOrg[2] - piCur[2] - iDeltaC );
1494    uiSum += abs( piOrg[3] - piCur[3] - iDeltaC );
1495
1496    piOrg += iStrideOrg;
1497    piCur += iStrideCur;
1498  }
1499
1500  uiSum <<= iSubShift;
1501  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT( pcDtParam->bitDepth - 8 ) );
1502}
1503
1504UInt TComRdCost::xGetSAD8ic( DistParam* pcDtParam )
1505{
1506  if ( pcDtParam->bApplyWeight )
1507  {
1508    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
1509  }
1510  Pel* piOrg      = pcDtParam->pOrg;
1511  Pel* piCur      = pcDtParam->pCur;
1512  Int  iRows      = pcDtParam->iRows;
1513  Int  iSubShift  = pcDtParam->iSubShift;
1514  Int  iSubStep   = ( 1 << iSubShift );
1515  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1516  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1517
1518  UInt uiSum = 0;
1519
1520  Int  iOrigAvg = 0, iCurAvg = 0, uiRowCnt = 0;
1521  Int  iDeltaC;
1522
1523  for( ; iRows != 0; iRows-=iSubStep )
1524  {
1525    iOrigAvg += piOrg[0];
1526    iOrigAvg += piOrg[1];
1527    iOrigAvg += piOrg[2];
1528    iOrigAvg += piOrg[3];
1529    iOrigAvg += piOrg[4];
1530    iOrigAvg += piOrg[5];
1531    iOrigAvg += piOrg[6];
1532    iOrigAvg += piOrg[7];
1533
1534    iCurAvg  += piCur[0];
1535    iCurAvg  += piCur[1];
1536    iCurAvg  += piCur[2];
1537    iCurAvg  += piCur[3];
1538    iCurAvg  += piCur[4];
1539    iCurAvg  += piCur[5];
1540    iCurAvg  += piCur[6];
1541    iCurAvg  += piCur[7];
1542
1543    piOrg += iStrideOrg;
1544    piCur += iStrideCur;
1545    uiRowCnt++;
1546  }
1547
1548  piOrg   = pcDtParam->pOrg;
1549  piCur   = pcDtParam->pCur;
1550  iRows   = pcDtParam->iRows;
1551
1552  iDeltaC = uiRowCnt ? ((iOrigAvg - iCurAvg)/uiRowCnt/8) : 0;
1553
1554  for( ; iRows != 0; iRows-=iSubStep )
1555  {
1556    uiSum += abs( piOrg[0] - piCur[0] - iDeltaC );
1557    uiSum += abs( piOrg[1] - piCur[1] - iDeltaC );
1558    uiSum += abs( piOrg[2] - piCur[2] - iDeltaC );
1559    uiSum += abs( piOrg[3] - piCur[3] - iDeltaC );
1560    uiSum += abs( piOrg[4] - piCur[4] - iDeltaC );
1561    uiSum += abs( piOrg[5] - piCur[5] - iDeltaC );
1562    uiSum += abs( piOrg[6] - piCur[6] - iDeltaC );
1563    uiSum += abs( piOrg[7] - piCur[7] - iDeltaC );
1564
1565    piOrg += iStrideOrg;
1566    piCur += iStrideCur;
1567  }
1568
1569  uiSum <<= iSubShift;
1570  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT( pcDtParam->bitDepth - 8 ) );
1571}
1572
1573UInt TComRdCost::xGetSAD16ic( DistParam* pcDtParam )
1574{
1575  if ( pcDtParam->bApplyWeight )
1576  {
1577    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
1578  }
1579  Pel* piOrg   = pcDtParam->pOrg;
1580  Pel* piCur   = pcDtParam->pCur;
1581  Int  iRows   = pcDtParam->iRows;
1582  Int  iSubShift  = pcDtParam->iSubShift;
1583  Int  iSubStep   = ( 1 << iSubShift );
1584  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1585  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1586
1587  UInt uiSum = 0;
1588
1589  Int iOrigAvg = 0, iCurAvg = 0, uiRowCnt = 0;
1590  Int iDeltaC;
1591
1592  for( ; iRows != 0; iRows-=iSubStep )
1593  {
1594    iOrigAvg += piOrg[0];
1595    iOrigAvg += piOrg[1];
1596    iOrigAvg += piOrg[2];
1597    iOrigAvg += piOrg[3];
1598    iOrigAvg += piOrg[4];
1599    iOrigAvg += piOrg[5];
1600    iOrigAvg += piOrg[6];
1601    iOrigAvg += piOrg[7];
1602    iOrigAvg += piOrg[8];
1603    iOrigAvg += piOrg[9];
1604    iOrigAvg += piOrg[10];
1605    iOrigAvg += piOrg[11];
1606    iOrigAvg += piOrg[12];
1607    iOrigAvg += piOrg[13];
1608    iOrigAvg += piOrg[14];
1609    iOrigAvg += piOrg[15];
1610
1611    iCurAvg  += piCur[0];
1612    iCurAvg  += piCur[1];
1613    iCurAvg  += piCur[2];
1614    iCurAvg  += piCur[3];
1615    iCurAvg  += piCur[4];
1616    iCurAvg  += piCur[5];
1617    iCurAvg  += piCur[6];
1618    iCurAvg  += piCur[7];
1619    iCurAvg  += piCur[8];
1620    iCurAvg  += piCur[9];
1621    iCurAvg  += piCur[10];
1622    iCurAvg  += piCur[11];
1623    iCurAvg  += piCur[12];
1624    iCurAvg  += piCur[13];
1625    iCurAvg  += piCur[14];
1626    iCurAvg  += piCur[15];
1627
1628    piOrg += iStrideOrg;
1629    piCur += iStrideCur;
1630    uiRowCnt++;
1631  }
1632
1633  piOrg   = pcDtParam->pOrg;
1634  piCur   = pcDtParam->pCur;
1635  iRows   = pcDtParam->iRows;
1636
1637  iDeltaC = uiRowCnt ? ((iOrigAvg - iCurAvg)/uiRowCnt/16) : 0;
1638
1639  for( ; iRows != 0; iRows-=iSubStep )
1640  {
1641    uiSum += abs( piOrg[0] - piCur[0] - iDeltaC );
1642    uiSum += abs( piOrg[1] - piCur[1] - iDeltaC );
1643    uiSum += abs( piOrg[2] - piCur[2] - iDeltaC );
1644    uiSum += abs( piOrg[3] - piCur[3] - iDeltaC );
1645    uiSum += abs( piOrg[4] - piCur[4] - iDeltaC );
1646    uiSum += abs( piOrg[5] - piCur[5] - iDeltaC );
1647    uiSum += abs( piOrg[6] - piCur[6] - iDeltaC );
1648    uiSum += abs( piOrg[7] - piCur[7] - iDeltaC );
1649    uiSum += abs( piOrg[8] - piCur[8] - iDeltaC );
1650    uiSum += abs( piOrg[9] - piCur[9] - iDeltaC );
1651    uiSum += abs( piOrg[10] - piCur[10] - iDeltaC );
1652    uiSum += abs( piOrg[11] - piCur[11] - iDeltaC );
1653    uiSum += abs( piOrg[12] - piCur[12] - iDeltaC );
1654    uiSum += abs( piOrg[13] - piCur[13] - iDeltaC );
1655    uiSum += abs( piOrg[14] - piCur[14] - iDeltaC );
1656    uiSum += abs( piOrg[15] - piCur[15] - iDeltaC );
1657
1658    piOrg += iStrideOrg;
1659    piCur += iStrideCur;
1660  }
1661
1662  uiSum <<= iSubShift;
1663  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT( pcDtParam->bitDepth - 8 ) );
1664}
1665
1666UInt TComRdCost::xGetSAD12ic( DistParam* pcDtParam )
1667{
1668  if ( pcDtParam->bApplyWeight )
1669  {
1670    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
1671  }
1672  Pel* piOrg   = pcDtParam->pOrg;
1673  Pel* piCur   = pcDtParam->pCur;
1674  Int  iRows   = pcDtParam->iRows;
1675  Int  iSubShift  = pcDtParam->iSubShift;
1676  Int  iSubStep   = ( 1 << iSubShift );
1677  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1678  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1679
1680  UInt uiSum = 0;
1681
1682  Int  iOrigAvg = 0, iCurAvg = 0, uiRowCnt = 0;
1683  Int  iDeltaC;
1684
1685  for( ; iRows != 0; iRows-=iSubStep )
1686  {
1687    iOrigAvg += piOrg[0];
1688    iOrigAvg += piOrg[1];
1689    iOrigAvg += piOrg[2];
1690    iOrigAvg += piOrg[3];
1691    iOrigAvg += piOrg[4];
1692    iOrigAvg += piOrg[5];
1693    iOrigAvg += piOrg[6];
1694    iOrigAvg += piOrg[7];
1695    iOrigAvg += piOrg[8];
1696    iOrigAvg += piOrg[9];
1697    iOrigAvg += piOrg[10];
1698    iOrigAvg += piOrg[11];
1699
1700    iCurAvg  += piCur[0];
1701    iCurAvg  += piCur[1];
1702    iCurAvg  += piCur[2];
1703    iCurAvg  += piCur[3];
1704    iCurAvg  += piCur[4];
1705    iCurAvg  += piCur[5];
1706    iCurAvg  += piCur[6];
1707    iCurAvg  += piCur[7];
1708    iCurAvg  += piCur[8];
1709    iCurAvg  += piCur[9];
1710    iCurAvg  += piCur[10];
1711    iCurAvg  += piCur[11];
1712
1713    piOrg += iStrideOrg;
1714    piCur += iStrideCur;
1715    uiRowCnt++;
1716  }
1717
1718  piOrg   = pcDtParam->pOrg;
1719  piCur   = pcDtParam->pCur;
1720  iRows   = pcDtParam->iRows;
1721
1722  iDeltaC = uiRowCnt ? ((iOrigAvg - iCurAvg)/uiRowCnt/12) : 0;
1723
1724  for( ; iRows != 0; iRows-=iSubStep )
1725  {
1726    uiSum += abs( piOrg[0] - piCur[0] - iDeltaC );
1727    uiSum += abs( piOrg[1] - piCur[1] - iDeltaC );
1728    uiSum += abs( piOrg[2] - piCur[2] - iDeltaC );
1729    uiSum += abs( piOrg[3] - piCur[3] - iDeltaC );
1730    uiSum += abs( piOrg[4] - piCur[4] - iDeltaC );
1731    uiSum += abs( piOrg[5] - piCur[5] - iDeltaC );
1732    uiSum += abs( piOrg[6] - piCur[6] - iDeltaC );
1733    uiSum += abs( piOrg[7] - piCur[7] - iDeltaC );
1734    uiSum += abs( piOrg[8] - piCur[8] - iDeltaC );
1735    uiSum += abs( piOrg[9] - piCur[9] - iDeltaC );
1736    uiSum += abs( piOrg[10] - piCur[10] - iDeltaC );
1737    uiSum += abs( piOrg[11] - piCur[11] - iDeltaC );
1738
1739    piOrg += iStrideOrg;
1740    piCur += iStrideCur;
1741  }
1742
1743  uiSum <<= iSubShift;
1744  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT( pcDtParam->bitDepth - 8 ) );
1745}
1746
1747
1748UInt TComRdCost::xGetSAD16Nic( DistParam* pcDtParam )
1749{
1750  Pel* piOrg   = pcDtParam->pOrg;
1751  Pel* piCur   = pcDtParam->pCur;
1752  Int  iRows   = pcDtParam->iRows;
1753  Int  iCols   = pcDtParam->iCols;
1754  Int  iSubShift  = pcDtParam->iSubShift;
1755  Int  iSubStep   = ( 1 << iSubShift );
1756  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1757  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1758
1759  UInt uiSum = 0;
1760
1761  Int iOrigAvg = 0, iCurAvg = 0, uiRowCnt = 0, uiColCnt = (iCols-1)/16 + 1;
1762  Int  iDeltaC;
1763
1764  for( ; iRows != 0; iRows-=iSubStep )
1765  {
1766    for (Int n = 0; n < iCols; n+=16 )
1767    {
1768      iOrigAvg += piOrg[n + 0];
1769      iOrigAvg += piOrg[n + 1];
1770      iOrigAvg += piOrg[n + 2];
1771      iOrigAvg += piOrg[n + 3];
1772      iOrigAvg += piOrg[n + 4];
1773      iOrigAvg += piOrg[n + 5];
1774      iOrigAvg += piOrg[n + 6];
1775      iOrigAvg += piOrg[n + 7];
1776      iOrigAvg += piOrg[n + 8];
1777      iOrigAvg += piOrg[n + 9];
1778      iOrigAvg += piOrg[n + 10];
1779      iOrigAvg += piOrg[n + 11];
1780      iOrigAvg += piOrg[n + 12];
1781      iOrigAvg += piOrg[n + 13];
1782      iOrigAvg += piOrg[n + 14];
1783      iOrigAvg += piOrg[n + 15];
1784
1785      iCurAvg  += piCur[n + 0];
1786      iCurAvg  += piCur[n + 1];
1787      iCurAvg  += piCur[n + 2];
1788      iCurAvg  += piCur[n + 3];
1789      iCurAvg  += piCur[n + 4];
1790      iCurAvg  += piCur[n + 5];
1791      iCurAvg  += piCur[n + 6];
1792      iCurAvg  += piCur[n + 7];
1793      iCurAvg  += piCur[n + 8];
1794      iCurAvg  += piCur[n + 9];
1795      iCurAvg  += piCur[n + 10];
1796      iCurAvg  += piCur[n + 11];
1797      iCurAvg  += piCur[n + 12];
1798      iCurAvg  += piCur[n + 13];
1799      iCurAvg  += piCur[n + 14];
1800      iCurAvg  += piCur[n + 15];
1801    }
1802    piOrg += iStrideOrg;
1803    piCur += iStrideCur;
1804    uiRowCnt++;
1805  }
1806  piOrg   = pcDtParam->pOrg;
1807  piCur   = pcDtParam->pCur;
1808  iRows   = pcDtParam->iRows;
1809
1810  iDeltaC = (uiRowCnt && uiColCnt) ? ((iOrigAvg - iCurAvg)/uiRowCnt/uiColCnt/16) : 0;
1811
1812  for( ; iRows != 0; iRows-=iSubStep )
1813  {
1814    for (Int n = 0; n < iCols; n+=16 )
1815    {
1816      uiSum += abs( piOrg[n+ 0] - piCur[n+ 0] - iDeltaC );
1817      uiSum += abs( piOrg[n+ 1] - piCur[n+ 1] - iDeltaC );
1818      uiSum += abs( piOrg[n+ 2] - piCur[n+ 2] - iDeltaC );
1819      uiSum += abs( piOrg[n+ 3] - piCur[n+ 3] - iDeltaC );
1820      uiSum += abs( piOrg[n+ 4] - piCur[n+ 4] - iDeltaC );
1821      uiSum += abs( piOrg[n+ 5] - piCur[n+ 5] - iDeltaC );
1822      uiSum += abs( piOrg[n+ 6] - piCur[n+ 6] - iDeltaC );
1823      uiSum += abs( piOrg[n+ 7] - piCur[n+ 7] - iDeltaC );
1824      uiSum += abs( piOrg[n+ 8] - piCur[n+ 8] - iDeltaC );
1825      uiSum += abs( piOrg[n+ 9] - piCur[n+ 9] - iDeltaC );
1826      uiSum += abs( piOrg[n+10] - piCur[n+10] - iDeltaC );
1827      uiSum += abs( piOrg[n+11] - piCur[n+11] - iDeltaC );
1828      uiSum += abs( piOrg[n+12] - piCur[n+12] - iDeltaC );
1829      uiSum += abs( piOrg[n+13] - piCur[n+13] - iDeltaC );
1830      uiSum += abs( piOrg[n+14] - piCur[n+14] - iDeltaC );
1831      uiSum += abs( piOrg[n+15] - piCur[n+15] - iDeltaC );
1832    }
1833    piOrg += iStrideOrg;
1834    piCur += iStrideCur;
1835  }
1836
1837  uiSum <<= iSubShift;
1838  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT( pcDtParam->bitDepth - 8 ) );
1839}
1840
1841UInt TComRdCost::xGetSAD32ic( DistParam* pcDtParam )
1842{
1843  if ( pcDtParam->bApplyWeight )
1844  {
1845    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
1846  }
1847  Pel* piOrg   = pcDtParam->pOrg;
1848  Pel* piCur   = pcDtParam->pCur;
1849  Int  iRows   = pcDtParam->iRows;
1850  Int  iSubShift  = pcDtParam->iSubShift;
1851  Int  iSubStep   = ( 1 << iSubShift );
1852  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1853  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1854
1855  UInt uiSum = 0;
1856
1857  Int  iOrigAvg = 0, iCurAvg = 0, uiRowCnt = 0;
1858  Int  iDeltaC;
1859
1860  for( ; iRows != 0; iRows-=iSubStep )
1861  {
1862    iOrigAvg += piOrg[0];
1863    iOrigAvg += piOrg[1];
1864    iOrigAvg += piOrg[2];
1865    iOrigAvg += piOrg[3];
1866    iOrigAvg += piOrg[4];
1867    iOrigAvg += piOrg[5];
1868    iOrigAvg += piOrg[6];
1869    iOrigAvg += piOrg[7];
1870    iOrigAvg += piOrg[8];
1871    iOrigAvg += piOrg[9];
1872    iOrigAvg += piOrg[10];
1873    iOrigAvg += piOrg[11];
1874    iOrigAvg += piOrg[12];
1875    iOrigAvg += piOrg[13];
1876    iOrigAvg += piOrg[14];
1877    iOrigAvg += piOrg[15];
1878    iOrigAvg += piOrg[16];
1879    iOrigAvg += piOrg[17];
1880    iOrigAvg += piOrg[18];
1881    iOrigAvg += piOrg[19];
1882    iOrigAvg += piOrg[20];
1883    iOrigAvg += piOrg[21];
1884    iOrigAvg += piOrg[22];
1885    iOrigAvg += piOrg[23];
1886    iOrigAvg += piOrg[24];
1887    iOrigAvg += piOrg[25];
1888    iOrigAvg += piOrg[26];
1889    iOrigAvg += piOrg[27];
1890    iOrigAvg += piOrg[28];
1891    iOrigAvg += piOrg[29];
1892    iOrigAvg += piOrg[30];
1893    iOrigAvg += piOrg[31];
1894
1895    iCurAvg  += piCur[0];
1896    iCurAvg  += piCur[1];
1897    iCurAvg  += piCur[2];
1898    iCurAvg  += piCur[3];
1899    iCurAvg  += piCur[4];
1900    iCurAvg  += piCur[5];
1901    iCurAvg  += piCur[6];
1902    iCurAvg  += piCur[7];
1903    iCurAvg  += piCur[8];
1904    iCurAvg  += piCur[9];
1905    iCurAvg  += piCur[10];
1906    iCurAvg  += piCur[11];
1907    iCurAvg  += piCur[12];
1908    iCurAvg  += piCur[13];
1909    iCurAvg  += piCur[14];
1910    iCurAvg  += piCur[15];
1911    iCurAvg  += piCur[16];
1912    iCurAvg  += piCur[17];
1913    iCurAvg  += piCur[18];
1914    iCurAvg  += piCur[19];
1915    iCurAvg  += piCur[20];
1916    iCurAvg  += piCur[21];
1917    iCurAvg  += piCur[22];
1918    iCurAvg  += piCur[23];
1919    iCurAvg  += piCur[24];
1920    iCurAvg  += piCur[25];
1921    iCurAvg  += piCur[26];
1922    iCurAvg  += piCur[27];
1923    iCurAvg  += piCur[28];
1924    iCurAvg  += piCur[29];
1925    iCurAvg  += piCur[30];
1926    iCurAvg  += piCur[31];
1927
1928    piOrg += iStrideOrg;
1929    piCur += iStrideCur;
1930    uiRowCnt++;
1931  }
1932
1933  piOrg   = pcDtParam->pOrg;
1934  piCur   = pcDtParam->pCur;
1935  iRows   = pcDtParam->iRows;
1936
1937  iDeltaC = uiRowCnt ? ((iOrigAvg - iCurAvg)/uiRowCnt/32) : 0;
1938
1939  for( ; iRows != 0; iRows-=iSubStep )
1940  {
1941    uiSum += abs( piOrg[0] - piCur[0] - iDeltaC );
1942    uiSum += abs( piOrg[1] - piCur[1] - iDeltaC );
1943    uiSum += abs( piOrg[2] - piCur[2] - iDeltaC );
1944    uiSum += abs( piOrg[3] - piCur[3] - iDeltaC );
1945    uiSum += abs( piOrg[4] - piCur[4] - iDeltaC );
1946    uiSum += abs( piOrg[5] - piCur[5] - iDeltaC );
1947    uiSum += abs( piOrg[6] - piCur[6] - iDeltaC );
1948    uiSum += abs( piOrg[7] - piCur[7] - iDeltaC );
1949    uiSum += abs( piOrg[8] - piCur[8] - iDeltaC );
1950    uiSum += abs( piOrg[9] - piCur[9] - iDeltaC );
1951    uiSum += abs( piOrg[10] - piCur[10] - iDeltaC );
1952    uiSum += abs( piOrg[11] - piCur[11] - iDeltaC );
1953    uiSum += abs( piOrg[12] - piCur[12] - iDeltaC );
1954    uiSum += abs( piOrg[13] - piCur[13] - iDeltaC );
1955    uiSum += abs( piOrg[14] - piCur[14] - iDeltaC );
1956    uiSum += abs( piOrg[15] - piCur[15] - iDeltaC );
1957    uiSum += abs( piOrg[16] - piCur[16] - iDeltaC );
1958    uiSum += abs( piOrg[17] - piCur[17] - iDeltaC );
1959    uiSum += abs( piOrg[18] - piCur[18] - iDeltaC );
1960    uiSum += abs( piOrg[19] - piCur[19] - iDeltaC );
1961    uiSum += abs( piOrg[20] - piCur[20] - iDeltaC );
1962    uiSum += abs( piOrg[21] - piCur[21] - iDeltaC );
1963    uiSum += abs( piOrg[22] - piCur[22] - iDeltaC );
1964    uiSum += abs( piOrg[23] - piCur[23] - iDeltaC );
1965    uiSum += abs( piOrg[24] - piCur[24] - iDeltaC );
1966    uiSum += abs( piOrg[25] - piCur[25] - iDeltaC );
1967    uiSum += abs( piOrg[26] - piCur[26] - iDeltaC );
1968    uiSum += abs( piOrg[27] - piCur[27] - iDeltaC );
1969    uiSum += abs( piOrg[28] - piCur[28] - iDeltaC );
1970    uiSum += abs( piOrg[29] - piCur[29] - iDeltaC );
1971    uiSum += abs( piOrg[30] - piCur[30] - iDeltaC );
1972    uiSum += abs( piOrg[31] - piCur[31] - iDeltaC );
1973
1974    piOrg += iStrideOrg;
1975    piCur += iStrideCur;
1976  }
1977
1978  uiSum <<= iSubShift;
1979  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT( pcDtParam->bitDepth - 8 ) );
1980}
1981
1982
1983UInt TComRdCost::xGetSAD24ic( DistParam* pcDtParam )
1984{
1985  if ( pcDtParam->bApplyWeight )
1986  {
1987    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
1988  }
1989  Pel* piOrg   = pcDtParam->pOrg;
1990  Pel* piCur   = pcDtParam->pCur;
1991  Int  iRows   = pcDtParam->iRows;
1992  Int  iSubShift  = pcDtParam->iSubShift;
1993  Int  iSubStep   = ( 1 << iSubShift );
1994  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
1995  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
1996
1997  UInt uiSum = 0;
1998
1999  Int  iOrigAvg = 0, iCurAvg = 0, uiRowCnt = 0;
2000  Int  iDeltaC;
2001
2002  for( ; iRows != 0; iRows-=iSubStep )
2003  {
2004    iOrigAvg += piOrg[0];
2005    iOrigAvg += piOrg[1];
2006    iOrigAvg += piOrg[2];
2007    iOrigAvg += piOrg[3];
2008    iOrigAvg += piOrg[4];
2009    iOrigAvg += piOrg[5];
2010    iOrigAvg += piOrg[6];
2011    iOrigAvg += piOrg[7];
2012    iOrigAvg += piOrg[8];
2013    iOrigAvg += piOrg[9];
2014    iOrigAvg += piOrg[10];
2015    iOrigAvg += piOrg[11];
2016    iOrigAvg += piOrg[12];
2017    iOrigAvg += piOrg[13];
2018    iOrigAvg += piOrg[14];
2019    iOrigAvg += piOrg[15];
2020    iOrigAvg += piOrg[16];
2021    iOrigAvg += piOrg[17];
2022    iOrigAvg += piOrg[18];
2023    iOrigAvg += piOrg[19];
2024    iOrigAvg += piOrg[20];
2025    iOrigAvg += piOrg[21];
2026    iOrigAvg += piOrg[22];
2027    iOrigAvg += piOrg[23];
2028
2029    iCurAvg  += piCur[0];
2030    iCurAvg  += piCur[1];
2031    iCurAvg  += piCur[2];
2032    iCurAvg  += piCur[3];
2033    iCurAvg  += piCur[4];
2034    iCurAvg  += piCur[5];
2035    iCurAvg  += piCur[6];
2036    iCurAvg  += piCur[7];
2037    iCurAvg  += piCur[8];
2038    iCurAvg  += piCur[9];
2039    iCurAvg  += piCur[10];
2040    iCurAvg  += piCur[11];
2041    iCurAvg  += piCur[12];
2042    iCurAvg  += piCur[13];
2043    iCurAvg  += piCur[14];
2044    iCurAvg  += piCur[15];
2045    iCurAvg  += piCur[16];
2046    iCurAvg  += piCur[17];
2047    iCurAvg  += piCur[18];
2048    iCurAvg  += piCur[19];
2049    iCurAvg  += piCur[20];
2050    iCurAvg  += piCur[21];
2051    iCurAvg  += piCur[22];
2052    iCurAvg  += piCur[23];
2053
2054    piOrg += iStrideOrg;
2055    piCur += iStrideCur;
2056    uiRowCnt++;
2057  }
2058
2059  piOrg   = pcDtParam->pOrg;
2060  piCur   = pcDtParam->pCur;
2061  iRows   = pcDtParam->iRows;
2062
2063  iDeltaC = uiRowCnt ? ((iOrigAvg - iCurAvg)/uiRowCnt/24) : 0;
2064
2065  for( ; iRows != 0; iRows-=iSubStep )
2066  {
2067    uiSum += abs( piOrg[0] - piCur[0] - iDeltaC );
2068    uiSum += abs( piOrg[1] - piCur[1] - iDeltaC );
2069    uiSum += abs( piOrg[2] - piCur[2] - iDeltaC );
2070    uiSum += abs( piOrg[3] - piCur[3] - iDeltaC );
2071    uiSum += abs( piOrg[4] - piCur[4] - iDeltaC );
2072    uiSum += abs( piOrg[5] - piCur[5] - iDeltaC );
2073    uiSum += abs( piOrg[6] - piCur[6] - iDeltaC );
2074    uiSum += abs( piOrg[7] - piCur[7] - iDeltaC );
2075    uiSum += abs( piOrg[8] - piCur[8] - iDeltaC );
2076    uiSum += abs( piOrg[9] - piCur[9] - iDeltaC );
2077    uiSum += abs( piOrg[10] - piCur[10] - iDeltaC );
2078    uiSum += abs( piOrg[11] - piCur[11] - iDeltaC );
2079    uiSum += abs( piOrg[12] - piCur[12] - iDeltaC );
2080    uiSum += abs( piOrg[13] - piCur[13] - iDeltaC );
2081    uiSum += abs( piOrg[14] - piCur[14] - iDeltaC );
2082    uiSum += abs( piOrg[15] - piCur[15] - iDeltaC );
2083    uiSum += abs( piOrg[16] - piCur[16] - iDeltaC );
2084    uiSum += abs( piOrg[17] - piCur[17] - iDeltaC );
2085    uiSum += abs( piOrg[18] - piCur[18] - iDeltaC );
2086    uiSum += abs( piOrg[19] - piCur[19] - iDeltaC );
2087    uiSum += abs( piOrg[20] - piCur[20] - iDeltaC );
2088    uiSum += abs( piOrg[21] - piCur[21] - iDeltaC );
2089    uiSum += abs( piOrg[22] - piCur[22] - iDeltaC );
2090    uiSum += abs( piOrg[23] - piCur[23] - iDeltaC );
2091
2092    piOrg += iStrideOrg;
2093    piCur += iStrideCur;
2094  }
2095
2096  uiSum <<= iSubShift;
2097  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT( pcDtParam->bitDepth - 8 ) );
2098}
2099
2100UInt TComRdCost::xGetSAD64ic( DistParam* pcDtParam )
2101{
2102  if ( pcDtParam->bApplyWeight )
2103  {
2104    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
2105  }
2106  Pel* piOrg   = pcDtParam->pOrg;
2107  Pel* piCur   = pcDtParam->pCur;
2108  Int  iRows   = pcDtParam->iRows;
2109  Int  iSubShift  = pcDtParam->iSubShift;
2110  Int  iSubStep   = ( 1 << iSubShift );
2111  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
2112  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
2113
2114  UInt uiSum = 0;
2115
2116  Int  iOrigAvg = 0, iCurAvg = 0, uiRowCnt = 0;
2117  Int  iDeltaC;
2118
2119  for( ; iRows != 0; iRows-=iSubStep )
2120  {
2121    iOrigAvg += piOrg[0] ;
2122    iOrigAvg += piOrg[1] ;
2123    iOrigAvg += piOrg[2] ;
2124    iOrigAvg += piOrg[3] ;
2125    iOrigAvg += piOrg[4] ;
2126    iOrigAvg += piOrg[5] ;
2127    iOrigAvg += piOrg[6] ;
2128    iOrigAvg += piOrg[7] ;
2129    iOrigAvg += piOrg[8] ;
2130    iOrigAvg += piOrg[9] ;
2131    iOrigAvg += piOrg[10] ;
2132    iOrigAvg += piOrg[11] ;
2133    iOrigAvg += piOrg[12] ;
2134    iOrigAvg += piOrg[13] ;
2135    iOrigAvg += piOrg[14] ;
2136    iOrigAvg += piOrg[15] ;
2137    iOrigAvg += piOrg[16] ;
2138    iOrigAvg += piOrg[17] ;
2139    iOrigAvg += piOrg[18] ;
2140    iOrigAvg += piOrg[19] ;
2141    iOrigAvg += piOrg[20] ;
2142    iOrigAvg += piOrg[21] ;
2143    iOrigAvg += piOrg[22] ;
2144    iOrigAvg += piOrg[23] ;
2145    iOrigAvg += piOrg[24] ;
2146    iOrigAvg += piOrg[25] ;
2147    iOrigAvg += piOrg[26] ;
2148    iOrigAvg += piOrg[27] ;
2149    iOrigAvg += piOrg[28] ;
2150    iOrigAvg += piOrg[29] ;
2151    iOrigAvg += piOrg[30] ;
2152    iOrigAvg += piOrg[31] ;
2153    iOrigAvg += piOrg[32] ;
2154    iOrigAvg += piOrg[33] ;
2155    iOrigAvg += piOrg[34] ;
2156    iOrigAvg += piOrg[35] ;
2157    iOrigAvg += piOrg[36] ;
2158    iOrigAvg += piOrg[37] ;
2159    iOrigAvg += piOrg[38] ;
2160    iOrigAvg += piOrg[39] ;
2161    iOrigAvg += piOrg[40] ;
2162    iOrigAvg += piOrg[41] ;
2163    iOrigAvg += piOrg[42] ;
2164    iOrigAvg += piOrg[43] ;
2165    iOrigAvg += piOrg[44] ;
2166    iOrigAvg += piOrg[45] ;
2167    iOrigAvg += piOrg[46] ;
2168    iOrigAvg += piOrg[47] ;
2169    iOrigAvg += piOrg[48] ;
2170    iOrigAvg += piOrg[49] ;
2171    iOrigAvg += piOrg[50] ;
2172    iOrigAvg += piOrg[51] ;
2173    iOrigAvg += piOrg[52] ;
2174    iOrigAvg += piOrg[53] ;
2175    iOrigAvg += piOrg[54] ;
2176    iOrigAvg += piOrg[55] ;
2177    iOrigAvg += piOrg[56] ;
2178    iOrigAvg += piOrg[57] ;
2179    iOrigAvg += piOrg[58] ;
2180    iOrigAvg += piOrg[59] ;
2181    iOrigAvg += piOrg[60] ;
2182    iOrigAvg += piOrg[61] ;
2183    iOrigAvg += piOrg[62] ;
2184    iOrigAvg += piOrg[63] ;
2185
2186    iCurAvg += piCur[0] ;
2187    iCurAvg += piCur[1] ;
2188    iCurAvg += piCur[2] ;
2189    iCurAvg += piCur[3] ;
2190    iCurAvg += piCur[4] ;
2191    iCurAvg += piCur[5] ;
2192    iCurAvg += piCur[6] ;
2193    iCurAvg += piCur[7] ;
2194    iCurAvg += piCur[8] ;
2195    iCurAvg += piCur[9] ;
2196    iCurAvg += piCur[10] ;
2197    iCurAvg += piCur[11] ;
2198    iCurAvg += piCur[12] ;
2199    iCurAvg += piCur[13] ;
2200    iCurAvg += piCur[14] ;
2201    iCurAvg += piCur[15] ;
2202    iCurAvg += piCur[16] ;
2203    iCurAvg += piCur[17] ;
2204    iCurAvg += piCur[18] ;
2205    iCurAvg += piCur[19] ;
2206    iCurAvg += piCur[20] ;
2207    iCurAvg += piCur[21] ;
2208    iCurAvg += piCur[22] ;
2209    iCurAvg += piCur[23] ;
2210    iCurAvg += piCur[24] ;
2211    iCurAvg += piCur[25] ;
2212    iCurAvg += piCur[26] ;
2213    iCurAvg += piCur[27] ;
2214    iCurAvg += piCur[28] ;
2215    iCurAvg += piCur[29] ;
2216    iCurAvg += piCur[30] ;
2217    iCurAvg += piCur[31] ;
2218    iCurAvg += piCur[32] ;
2219    iCurAvg += piCur[33] ;
2220    iCurAvg += piCur[34] ;
2221    iCurAvg += piCur[35] ;
2222    iCurAvg += piCur[36] ;
2223    iCurAvg += piCur[37] ;
2224    iCurAvg += piCur[38] ;
2225    iCurAvg += piCur[39] ;
2226    iCurAvg += piCur[40] ;
2227    iCurAvg += piCur[41] ;
2228    iCurAvg += piCur[42] ;
2229    iCurAvg += piCur[43] ;
2230    iCurAvg += piCur[44] ;
2231    iCurAvg += piCur[45] ;
2232    iCurAvg += piCur[46] ;
2233    iCurAvg += piCur[47] ;
2234    iCurAvg += piCur[48] ;
2235    iCurAvg += piCur[49] ;
2236    iCurAvg += piCur[50] ;
2237    iCurAvg += piCur[51] ;
2238    iCurAvg += piCur[52] ;
2239    iCurAvg += piCur[53] ;
2240    iCurAvg += piCur[54] ;
2241    iCurAvg += piCur[55] ;
2242    iCurAvg += piCur[56] ;
2243    iCurAvg += piCur[57] ;
2244    iCurAvg += piCur[58] ;
2245    iCurAvg += piCur[59] ;
2246    iCurAvg += piCur[60] ;
2247    iCurAvg += piCur[61] ;
2248    iCurAvg += piCur[62] ;
2249    iCurAvg += piCur[63] ;
2250
2251    piOrg += iStrideOrg;
2252    piCur += iStrideCur;
2253    uiRowCnt++;
2254  }
2255
2256  piOrg   = pcDtParam->pOrg;
2257  piCur   = pcDtParam->pCur;
2258  iRows   = pcDtParam->iRows;
2259
2260  iDeltaC = uiRowCnt ? ((iOrigAvg - iCurAvg)/uiRowCnt/64) : 0;
2261
2262  for( ; iRows != 0; iRows-=iSubStep )
2263  {
2264    uiSum += abs( piOrg[0] - piCur[0] - iDeltaC );
2265    uiSum += abs( piOrg[1] - piCur[1] - iDeltaC );
2266    uiSum += abs( piOrg[2] - piCur[2] - iDeltaC );
2267    uiSum += abs( piOrg[3] - piCur[3] - iDeltaC );
2268    uiSum += abs( piOrg[4] - piCur[4] - iDeltaC );
2269    uiSum += abs( piOrg[5] - piCur[5] - iDeltaC );
2270    uiSum += abs( piOrg[6] - piCur[6] - iDeltaC );
2271    uiSum += abs( piOrg[7] - piCur[7] - iDeltaC );
2272    uiSum += abs( piOrg[8] - piCur[8] - iDeltaC );
2273    uiSum += abs( piOrg[9] - piCur[9] - iDeltaC );
2274    uiSum += abs( piOrg[10] - piCur[10] - iDeltaC );
2275    uiSum += abs( piOrg[11] - piCur[11] - iDeltaC );
2276    uiSum += abs( piOrg[12] - piCur[12] - iDeltaC );
2277    uiSum += abs( piOrg[13] - piCur[13] - iDeltaC );
2278    uiSum += abs( piOrg[14] - piCur[14] - iDeltaC );
2279    uiSum += abs( piOrg[15] - piCur[15] - iDeltaC );
2280    uiSum += abs( piOrg[16] - piCur[16] - iDeltaC );
2281    uiSum += abs( piOrg[17] - piCur[17] - iDeltaC );
2282    uiSum += abs( piOrg[18] - piCur[18] - iDeltaC );
2283    uiSum += abs( piOrg[19] - piCur[19] - iDeltaC );
2284    uiSum += abs( piOrg[20] - piCur[20] - iDeltaC );
2285    uiSum += abs( piOrg[21] - piCur[21] - iDeltaC );
2286    uiSum += abs( piOrg[22] - piCur[22] - iDeltaC );
2287    uiSum += abs( piOrg[23] - piCur[23] - iDeltaC );
2288    uiSum += abs( piOrg[24] - piCur[24] - iDeltaC );
2289    uiSum += abs( piOrg[25] - piCur[25] - iDeltaC );
2290    uiSum += abs( piOrg[26] - piCur[26] - iDeltaC );
2291    uiSum += abs( piOrg[27] - piCur[27] - iDeltaC );
2292    uiSum += abs( piOrg[28] - piCur[28] - iDeltaC );
2293    uiSum += abs( piOrg[29] - piCur[29] - iDeltaC );
2294    uiSum += abs( piOrg[30] - piCur[30] - iDeltaC );
2295    uiSum += abs( piOrg[31] - piCur[31] - iDeltaC );
2296    uiSum += abs( piOrg[32] - piCur[32] - iDeltaC );
2297    uiSum += abs( piOrg[33] - piCur[33] - iDeltaC );
2298    uiSum += abs( piOrg[34] - piCur[34] - iDeltaC );
2299    uiSum += abs( piOrg[35] - piCur[35] - iDeltaC );
2300    uiSum += abs( piOrg[36] - piCur[36] - iDeltaC );
2301    uiSum += abs( piOrg[37] - piCur[37] - iDeltaC );
2302    uiSum += abs( piOrg[38] - piCur[38] - iDeltaC );
2303    uiSum += abs( piOrg[39] - piCur[39] - iDeltaC );
2304    uiSum += abs( piOrg[40] - piCur[40] - iDeltaC );
2305    uiSum += abs( piOrg[41] - piCur[41] - iDeltaC );
2306    uiSum += abs( piOrg[42] - piCur[42] - iDeltaC );
2307    uiSum += abs( piOrg[43] - piCur[43] - iDeltaC );
2308    uiSum += abs( piOrg[44] - piCur[44] - iDeltaC );
2309    uiSum += abs( piOrg[45] - piCur[45] - iDeltaC );
2310    uiSum += abs( piOrg[46] - piCur[46] - iDeltaC );
2311    uiSum += abs( piOrg[47] - piCur[47] - iDeltaC );
2312    uiSum += abs( piOrg[48] - piCur[48] - iDeltaC );
2313    uiSum += abs( piOrg[49] - piCur[49] - iDeltaC );
2314    uiSum += abs( piOrg[50] - piCur[50] - iDeltaC );
2315    uiSum += abs( piOrg[51] - piCur[51] - iDeltaC );
2316    uiSum += abs( piOrg[52] - piCur[52] - iDeltaC );
2317    uiSum += abs( piOrg[53] - piCur[53] - iDeltaC );
2318    uiSum += abs( piOrg[54] - piCur[54] - iDeltaC );
2319    uiSum += abs( piOrg[55] - piCur[55] - iDeltaC );
2320    uiSum += abs( piOrg[56] - piCur[56] - iDeltaC );
2321    uiSum += abs( piOrg[57] - piCur[57] - iDeltaC );
2322    uiSum += abs( piOrg[58] - piCur[58] - iDeltaC );
2323    uiSum += abs( piOrg[59] - piCur[59] - iDeltaC );
2324    uiSum += abs( piOrg[60] - piCur[60] - iDeltaC );
2325    uiSum += abs( piOrg[61] - piCur[61] - iDeltaC );
2326    uiSum += abs( piOrg[62] - piCur[62] - iDeltaC );
2327    uiSum += abs( piOrg[63] - piCur[63] - iDeltaC );
2328
2329    piOrg += iStrideOrg;
2330    piCur += iStrideCur;
2331  }
2332
2333  uiSum <<= iSubShift;
2334  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT( pcDtParam->bitDepth - 8 ) );
2335}
2336
2337
2338UInt TComRdCost::xGetSAD48ic( DistParam* pcDtParam )
2339{
2340  if ( pcDtParam->bApplyWeight )
2341  {
2342    return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
2343  }
2344
2345  Pel* piOrg   = pcDtParam->pOrg;
2346  Pel* piCur   = pcDtParam->pCur;
2347  Int  iRows   = pcDtParam->iRows;
2348  Int  iSubShift  = pcDtParam->iSubShift;
2349  Int  iSubStep   = ( 1 << iSubShift );
2350  Int  iStrideCur = pcDtParam->iStrideCur*iSubStep;
2351  Int  iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
2352
2353  UInt uiSum = 0;
2354
2355  Int  iOrigAvg = 0, iCurAvg = 0, uiRowCnt = 0;
2356  Int  iDeltaC;
2357
2358  for( ; iRows != 0; iRows-=iSubStep )
2359  {
2360    iOrigAvg += piOrg[0] ;
2361    iOrigAvg += piOrg[1] ;
2362    iOrigAvg += piOrg[2] ;
2363    iOrigAvg += piOrg[3] ;
2364    iOrigAvg += piOrg[4] ;
2365    iOrigAvg += piOrg[5] ;
2366    iOrigAvg += piOrg[6] ;
2367    iOrigAvg += piOrg[7] ;
2368    iOrigAvg += piOrg[8] ;
2369    iOrigAvg += piOrg[9] ;
2370    iOrigAvg += piOrg[10] ;
2371    iOrigAvg += piOrg[11] ;
2372    iOrigAvg += piOrg[12] ;
2373    iOrigAvg += piOrg[13] ;
2374    iOrigAvg += piOrg[14] ;
2375    iOrigAvg += piOrg[15] ;
2376    iOrigAvg += piOrg[16] ;
2377    iOrigAvg += piOrg[17] ;
2378    iOrigAvg += piOrg[18] ;
2379    iOrigAvg += piOrg[19] ;
2380    iOrigAvg += piOrg[20] ;
2381    iOrigAvg += piOrg[21] ;
2382    iOrigAvg += piOrg[22] ;
2383    iOrigAvg += piOrg[23] ;
2384    iOrigAvg += piOrg[24] ;
2385    iOrigAvg += piOrg[25] ;
2386    iOrigAvg += piOrg[26] ;
2387    iOrigAvg += piOrg[27] ;
2388    iOrigAvg += piOrg[28] ;
2389    iOrigAvg += piOrg[29] ;
2390    iOrigAvg += piOrg[30] ;
2391    iOrigAvg += piOrg[31] ;
2392    iOrigAvg += piOrg[32] ;
2393    iOrigAvg += piOrg[33] ;
2394    iOrigAvg += piOrg[34] ;
2395    iOrigAvg += piOrg[35] ;
2396    iOrigAvg += piOrg[36] ;
2397    iOrigAvg += piOrg[37] ;
2398    iOrigAvg += piOrg[38] ;
2399    iOrigAvg += piOrg[39] ;
2400    iOrigAvg += piOrg[40] ;
2401    iOrigAvg += piOrg[41] ;
2402    iOrigAvg += piOrg[42] ;
2403    iOrigAvg += piOrg[43] ;
2404    iOrigAvg += piOrg[44] ;
2405    iOrigAvg += piOrg[45] ;
2406    iOrigAvg += piOrg[46] ;
2407    iOrigAvg += piOrg[47] ;
2408
2409    iCurAvg += piCur[0] ;
2410    iCurAvg += piCur[1] ;
2411    iCurAvg += piCur[2] ;
2412    iCurAvg += piCur[3] ;
2413    iCurAvg += piCur[4] ;
2414    iCurAvg += piCur[5] ;
2415    iCurAvg += piCur[6] ;
2416    iCurAvg += piCur[7] ;
2417    iCurAvg += piCur[8] ;
2418    iCurAvg += piCur[9] ;
2419    iCurAvg += piCur[10] ;
2420    iCurAvg += piCur[11] ;
2421    iCurAvg += piCur[12] ;
2422    iCurAvg += piCur[13] ;
2423    iCurAvg += piCur[14] ;
2424    iCurAvg += piCur[15] ;
2425    iCurAvg += piCur[16] ;
2426    iCurAvg += piCur[17] ;
2427    iCurAvg += piCur[18] ;
2428    iCurAvg += piCur[19] ;
2429    iCurAvg += piCur[20] ;
2430    iCurAvg += piCur[21] ;
2431    iCurAvg += piCur[22] ;
2432    iCurAvg += piCur[23] ;
2433    iCurAvg += piCur[24] ;
2434    iCurAvg += piCur[25] ;
2435    iCurAvg += piCur[26] ;
2436    iCurAvg += piCur[27] ;
2437    iCurAvg += piCur[28] ;
2438    iCurAvg += piCur[29] ;
2439    iCurAvg += piCur[30] ;
2440    iCurAvg += piCur[31] ;
2441    iCurAvg += piCur[32] ;
2442    iCurAvg += piCur[33] ;
2443    iCurAvg += piCur[34] ;
2444    iCurAvg += piCur[35] ;
2445    iCurAvg += piCur[36] ;
2446    iCurAvg += piCur[37] ;
2447    iCurAvg += piCur[38] ;
2448    iCurAvg += piCur[39] ;
2449    iCurAvg += piCur[40] ;
2450    iCurAvg += piCur[41] ;
2451    iCurAvg += piCur[42] ;
2452    iCurAvg += piCur[43] ;
2453    iCurAvg += piCur[44] ;
2454    iCurAvg += piCur[45] ;
2455    iCurAvg += piCur[46] ;
2456    iCurAvg += piCur[47] ;
2457
2458    piOrg += iStrideOrg;
2459    piCur += iStrideCur;
2460    uiRowCnt++;
2461  }
2462
2463  piOrg   = pcDtParam->pOrg;
2464  piCur   = pcDtParam->pCur;
2465  iRows   = pcDtParam->iRows;
2466
2467  iDeltaC = uiRowCnt ? ((iOrigAvg - iCurAvg)/uiRowCnt/48) : 0;
2468
2469  for( ; iRows != 0; iRows-=iSubStep )
2470  {
2471    uiSum += abs( piOrg[0] - piCur[0] - iDeltaC );
2472    uiSum += abs( piOrg[1] - piCur[1] - iDeltaC );
2473    uiSum += abs( piOrg[2] - piCur[2] - iDeltaC );
2474    uiSum += abs( piOrg[3] - piCur[3] - iDeltaC );
2475    uiSum += abs( piOrg[4] - piCur[4] - iDeltaC );
2476    uiSum += abs( piOrg[5] - piCur[5] - iDeltaC );
2477    uiSum += abs( piOrg[6] - piCur[6] - iDeltaC );
2478    uiSum += abs( piOrg[7] - piCur[7] - iDeltaC );
2479    uiSum += abs( piOrg[8] - piCur[8] - iDeltaC );
2480    uiSum += abs( piOrg[9] - piCur[9] - iDeltaC );
2481    uiSum += abs( piOrg[10] - piCur[10] - iDeltaC );
2482    uiSum += abs( piOrg[11] - piCur[11] - iDeltaC );
2483    uiSum += abs( piOrg[12] - piCur[12] - iDeltaC );
2484    uiSum += abs( piOrg[13] - piCur[13] - iDeltaC );
2485    uiSum += abs( piOrg[14] - piCur[14] - iDeltaC );
2486    uiSum += abs( piOrg[15] - piCur[15] - iDeltaC );
2487    uiSum += abs( piOrg[16] - piCur[16] - iDeltaC );
2488    uiSum += abs( piOrg[17] - piCur[17] - iDeltaC );
2489    uiSum += abs( piOrg[18] - piCur[18] - iDeltaC );
2490    uiSum += abs( piOrg[19] - piCur[19] - iDeltaC );
2491    uiSum += abs( piOrg[20] - piCur[20] - iDeltaC );
2492    uiSum += abs( piOrg[21] - piCur[21] - iDeltaC );
2493    uiSum += abs( piOrg[22] - piCur[22] - iDeltaC );
2494    uiSum += abs( piOrg[23] - piCur[23] - iDeltaC );
2495    uiSum += abs( piOrg[24] - piCur[24] - iDeltaC );
2496    uiSum += abs( piOrg[25] - piCur[25] - iDeltaC );
2497    uiSum += abs( piOrg[26] - piCur[26] - iDeltaC );
2498    uiSum += abs( piOrg[27] - piCur[27] - iDeltaC );
2499    uiSum += abs( piOrg[28] - piCur[28] - iDeltaC );
2500    uiSum += abs( piOrg[29] - piCur[29] - iDeltaC );
2501    uiSum += abs( piOrg[30] - piCur[30] - iDeltaC );
2502    uiSum += abs( piOrg[31] - piCur[31] - iDeltaC );
2503    uiSum += abs( piOrg[32] - piCur[32] - iDeltaC );
2504    uiSum += abs( piOrg[33] - piCur[33] - iDeltaC );
2505    uiSum += abs( piOrg[34] - piCur[34] - iDeltaC );
2506    uiSum += abs( piOrg[35] - piCur[35] - iDeltaC );
2507    uiSum += abs( piOrg[36] - piCur[36] - iDeltaC );
2508    uiSum += abs( piOrg[37] - piCur[37] - iDeltaC );
2509    uiSum += abs( piOrg[38] - piCur[38] - iDeltaC );
2510    uiSum += abs( piOrg[39] - piCur[39] - iDeltaC );
2511    uiSum += abs( piOrg[40] - piCur[40] - iDeltaC );
2512    uiSum += abs( piOrg[41] - piCur[41] - iDeltaC );
2513    uiSum += abs( piOrg[42] - piCur[42] - iDeltaC );
2514    uiSum += abs( piOrg[43] - piCur[43] - iDeltaC );
2515    uiSum += abs( piOrg[44] - piCur[44] - iDeltaC );
2516    uiSum += abs( piOrg[45] - piCur[45] - iDeltaC );
2517    uiSum += abs( piOrg[46] - piCur[46] - iDeltaC );
2518    uiSum += abs( piOrg[47] - piCur[47] - iDeltaC );
2519
2520    piOrg += iStrideOrg;
2521    piCur += iStrideCur;
2522  }
2523
2524  uiSum <<= iSubShift;
2525  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT( pcDtParam->bitDepth - 8 ) );
2526}
2527#endif
2528// --------------------------------------------------------------------------------------------------------------------
2529// SSE
2530// --------------------------------------------------------------------------------------------------------------------
2531
2532Distortion TComRdCost::xGetSSE( DistParam* pcDtParam )
2533{
2534  if ( pcDtParam->bApplyWeight )
2535  {
2536    return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
2537  }
2538  const Pel* piOrg   = pcDtParam->pOrg;
2539  const Pel* piCur   = pcDtParam->pCur;
2540  Int  iRows   = pcDtParam->iRows;
2541  Int  iCols   = pcDtParam->iCols;
2542  Int  iStrideOrg = pcDtParam->iStrideOrg;
2543  Int  iStrideCur = pcDtParam->iStrideCur;
2544
2545  Distortion uiSum   = 0;
2546  UInt       uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
2547
2548  Intermediate_Int iTemp;
2549
2550  for( ; iRows != 0; iRows-- )
2551  {
2552    for (Int n = 0; n < iCols; n++ )
2553    {
2554      iTemp = piOrg[] - piCur[];
2555      uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2556    }
2557    piOrg += iStrideOrg;
2558    piCur += iStrideCur;
2559  }
2560
2561  return ( uiSum );
2562}
2563
2564Distortion TComRdCost::xGetSSE4( DistParam* pcDtParam )
2565{
2566  if ( pcDtParam->bApplyWeight )
2567  {
2568    assert( pcDtParam->iCols == 4 );
2569    return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
2570  }
2571  const Pel* piOrg   = pcDtParam->pOrg;
2572  const Pel* piCur   = pcDtParam->pCur;
2573  Int  iRows   = pcDtParam->iRows;
2574  Int  iStrideOrg = pcDtParam->iStrideOrg;
2575  Int  iStrideCur = pcDtParam->iStrideCur;
2576
2577  Distortion uiSum   = 0;
2578  UInt       uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
2579
2580  Intermediate_Int  iTemp;
2581
2582  for( ; iRows != 0; iRows-- )
2583  {
2584
2585    iTemp = piOrg[0] - piCur[0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2586    iTemp = piOrg[1] - piCur[1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2587    iTemp = piOrg[2] - piCur[2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2588    iTemp = piOrg[3] - piCur[3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2589
2590    piOrg += iStrideOrg;
2591    piCur += iStrideCur;
2592  }
2593
2594  return ( uiSum );
2595}
2596
2597Distortion TComRdCost::xGetSSE8( DistParam* pcDtParam )
2598{
2599  if ( pcDtParam->bApplyWeight )
2600  {
2601    assert( pcDtParam->iCols == 8 );
2602    return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
2603  }
2604  const Pel* piOrg   = pcDtParam->pOrg;
2605  const Pel* piCur   = pcDtParam->pCur;
2606  Int  iRows   = pcDtParam->iRows;
2607  Int  iStrideOrg = pcDtParam->iStrideOrg;
2608  Int  iStrideCur = pcDtParam->iStrideCur;
2609
2610  Distortion uiSum   = 0;
2611  UInt       uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
2612
2613  Intermediate_Int  iTemp;
2614
2615  for( ; iRows != 0; iRows-- )
2616  {
2617    iTemp = piOrg[0] - piCur[0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2618    iTemp = piOrg[1] - piCur[1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2619    iTemp = piOrg[2] - piCur[2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2620    iTemp = piOrg[3] - piCur[3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2621    iTemp = piOrg[4] - piCur[4]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2622    iTemp = piOrg[5] - piCur[5]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2623    iTemp = piOrg[6] - piCur[6]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2624    iTemp = piOrg[7] - piCur[7]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2625
2626    piOrg += iStrideOrg;
2627    piCur += iStrideCur;
2628  }
2629
2630  return ( uiSum );
2631}
2632
2633Distortion TComRdCost::xGetSSE16( DistParam* pcDtParam )
2634{
2635  if ( pcDtParam->bApplyWeight )
2636  {
2637    assert( pcDtParam->iCols == 16 );
2638    return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
2639  }
2640  const Pel* piOrg   = pcDtParam->pOrg;
2641  const Pel* piCur   = pcDtParam->pCur;
2642  Int  iRows   = pcDtParam->iRows;
2643  Int  iStrideOrg = pcDtParam->iStrideOrg;
2644  Int  iStrideCur = pcDtParam->iStrideCur;
2645
2646  Distortion uiSum   = 0;
2647  UInt       uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
2648
2649  Intermediate_Int  iTemp;
2650
2651  for( ; iRows != 0; iRows-- )
2652  {
2653
2654    iTemp = piOrg[ 0] - piCur[ 0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2655    iTemp = piOrg[ 1] - piCur[ 1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2656    iTemp = piOrg[ 2] - piCur[ 2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2657    iTemp = piOrg[ 3] - piCur[ 3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2658    iTemp = piOrg[ 4] - piCur[ 4]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2659    iTemp = piOrg[ 5] - piCur[ 5]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2660    iTemp = piOrg[ 6] - piCur[ 6]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2661    iTemp = piOrg[ 7] - piCur[ 7]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2662    iTemp = piOrg[ 8] - piCur[ 8]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2663    iTemp = piOrg[ 9] - piCur[ 9]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2664    iTemp = piOrg[10] - piCur[10]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2665    iTemp = piOrg[11] - piCur[11]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2666    iTemp = piOrg[12] - piCur[12]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2667    iTemp = piOrg[13] - piCur[13]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2668    iTemp = piOrg[14] - piCur[14]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2669    iTemp = piOrg[15] - piCur[15]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2670
2671    piOrg += iStrideOrg;
2672    piCur += iStrideCur;
2673  }
2674
2675  return ( uiSum );
2676}
2677
2678Distortion TComRdCost::xGetSSE16N( DistParam* pcDtParam )
2679{
2680  if ( pcDtParam->bApplyWeight )
2681  {
2682    return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
2683  }
2684  const Pel* piOrg   = pcDtParam->pOrg;
2685  const Pel* piCur   = pcDtParam->pCur;
2686  Int  iRows   = pcDtParam->iRows;
2687  Int  iCols   = pcDtParam->iCols;
2688  Int  iStrideOrg = pcDtParam->iStrideOrg;
2689  Int  iStrideCur = pcDtParam->iStrideCur;
2690
2691  Distortion uiSum   = 0;
2692  UInt       uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
2693
2694  Intermediate_Int  iTemp;
2695
2696  for( ; iRows != 0; iRows-- )
2697  {
2698    for (Int n = 0; n < iCols; n+=16 )
2699    {
2700
2701      iTemp = piOrg[n+ 0] - piCur[n+ 0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2702      iTemp = piOrg[n+ 1] - piCur[n+ 1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2703      iTemp = piOrg[n+ 2] - piCur[n+ 2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2704      iTemp = piOrg[n+ 3] - piCur[n+ 3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2705      iTemp = piOrg[n+ 4] - piCur[n+ 4]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2706      iTemp = piOrg[n+ 5] - piCur[n+ 5]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2707      iTemp = piOrg[n+ 6] - piCur[n+ 6]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2708      iTemp = piOrg[n+ 7] - piCur[n+ 7]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2709      iTemp = piOrg[n+ 8] - piCur[n+ 8]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2710      iTemp = piOrg[n+ 9] - piCur[n+ 9]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2711      iTemp = piOrg[n+10] - piCur[n+10]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2712      iTemp = piOrg[n+11] - piCur[n+11]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2713      iTemp = piOrg[n+12] - piCur[n+12]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2714      iTemp = piOrg[n+13] - piCur[n+13]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2715      iTemp = piOrg[n+14] - piCur[n+14]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2716      iTemp = piOrg[n+15] - piCur[n+15]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2717
2718    }
2719    piOrg += iStrideOrg;
2720    piCur += iStrideCur;
2721  }
2722
2723  return ( uiSum );
2724}
2725
2726Distortion TComRdCost::xGetSSE32( DistParam* pcDtParam )
2727{
2728  if ( pcDtParam->bApplyWeight )
2729  {
2730    assert( pcDtParam->iCols == 32 );
2731    return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
2732  }
2733  const Pel* piOrg   = pcDtParam->pOrg;
2734  const Pel* piCur   = pcDtParam->pCur;
2735  Int  iRows   = pcDtParam->iRows;
2736  Int  iStrideOrg = pcDtParam->iStrideOrg;
2737  Int  iStrideCur = pcDtParam->iStrideCur;
2738
2739  Distortion uiSum   = 0;
2740  UInt       uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
2741
2742  Intermediate_Int  iTemp;
2743
2744  for( ; iRows != 0; iRows-- )
2745  {
2746
2747    iTemp = piOrg[ 0] - piCur[ 0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2748    iTemp = piOrg[ 1] - piCur[ 1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2749    iTemp = piOrg[ 2] - piCur[ 2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2750    iTemp = piOrg[ 3] - piCur[ 3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2751    iTemp = piOrg[ 4] - piCur[ 4]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2752    iTemp = piOrg[ 5] - piCur[ 5]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2753    iTemp = piOrg[ 6] - piCur[ 6]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2754    iTemp = piOrg[ 7] - piCur[ 7]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2755    iTemp = piOrg[ 8] - piCur[ 8]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2756    iTemp = piOrg[ 9] - piCur[ 9]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2757    iTemp = piOrg[10] - piCur[10]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2758    iTemp = piOrg[11] - piCur[11]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2759    iTemp = piOrg[12] - piCur[12]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2760    iTemp = piOrg[13] - piCur[13]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2761    iTemp = piOrg[14] - piCur[14]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2762    iTemp = piOrg[15] - piCur[15]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2763    iTemp = piOrg[16] - piCur[16]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2764    iTemp = piOrg[17] - piCur[17]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2765    iTemp = piOrg[18] - piCur[18]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2766    iTemp = piOrg[19] - piCur[19]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2767    iTemp = piOrg[20] - piCur[20]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2768    iTemp = piOrg[21] - piCur[21]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2769    iTemp = piOrg[22] - piCur[22]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2770    iTemp = piOrg[23] - piCur[23]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2771    iTemp = piOrg[24] - piCur[24]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2772    iTemp = piOrg[25] - piCur[25]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2773    iTemp = piOrg[26] - piCur[26]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2774    iTemp = piOrg[27] - piCur[27]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2775    iTemp = piOrg[28] - piCur[28]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2776    iTemp = piOrg[29] - piCur[29]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2777    iTemp = piOrg[30] - piCur[30]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2778    iTemp = piOrg[31] - piCur[31]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2779
2780    piOrg += iStrideOrg;
2781    piCur += iStrideCur;
2782  }
2783
2784  return ( uiSum );
2785}
2786
2787Distortion TComRdCost::xGetSSE64( DistParam* pcDtParam )
2788{
2789  if ( pcDtParam->bApplyWeight )
2790  {
2791    assert( pcDtParam->iCols == 64 );
2792    return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
2793  }
2794  const Pel* piOrg   = pcDtParam->pOrg;
2795  const Pel* piCur   = pcDtParam->pCur;
2796  Int  iRows   = pcDtParam->iRows;
2797  Int  iStrideOrg = pcDtParam->iStrideOrg;
2798  Int  iStrideCur = pcDtParam->iStrideCur;
2799
2800  Distortion uiSum   = 0;
2801  UInt       uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
2802
2803  Intermediate_Int  iTemp;
2804
2805  for( ; iRows != 0; iRows-- )
2806  {
2807    iTemp = piOrg[ 0] - piCur[ 0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2808    iTemp = piOrg[ 1] - piCur[ 1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2809    iTemp = piOrg[ 2] - piCur[ 2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2810    iTemp = piOrg[ 3] - piCur[ 3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2811    iTemp = piOrg[ 4] - piCur[ 4]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2812    iTemp = piOrg[ 5] - piCur[ 5]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2813    iTemp = piOrg[ 6] - piCur[ 6]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2814    iTemp = piOrg[ 7] - piCur[ 7]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2815    iTemp = piOrg[ 8] - piCur[ 8]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2816    iTemp = piOrg[ 9] - piCur[ 9]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2817    iTemp = piOrg[10] - piCur[10]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2818    iTemp = piOrg[11] - piCur[11]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2819    iTemp = piOrg[12] - piCur[12]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2820    iTemp = piOrg[13] - piCur[13]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2821    iTemp = piOrg[14] - piCur[14]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2822    iTemp = piOrg[15] - piCur[15]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2823    iTemp = piOrg[16] - piCur[16]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2824    iTemp = piOrg[17] - piCur[17]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2825    iTemp = piOrg[18] - piCur[18]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2826    iTemp = piOrg[19] - piCur[19]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2827    iTemp = piOrg[20] - piCur[20]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2828    iTemp = piOrg[21] - piCur[21]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2829    iTemp = piOrg[22] - piCur[22]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2830    iTemp = piOrg[23] - piCur[23]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2831    iTemp = piOrg[24] - piCur[24]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2832    iTemp = piOrg[25] - piCur[25]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2833    iTemp = piOrg[26] - piCur[26]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2834    iTemp = piOrg[27] - piCur[27]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2835    iTemp = piOrg[28] - piCur[28]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2836    iTemp = piOrg[29] - piCur[29]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2837    iTemp = piOrg[30] - piCur[30]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2838    iTemp = piOrg[31] - piCur[31]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2839    iTemp = piOrg[32] - piCur[32]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2840    iTemp = piOrg[33] - piCur[33]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2841    iTemp = piOrg[34] - piCur[34]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2842    iTemp = piOrg[35] - piCur[35]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2843    iTemp = piOrg[36] - piCur[36]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2844    iTemp = piOrg[37] - piCur[37]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2845    iTemp = piOrg[38] - piCur[38]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2846    iTemp = piOrg[39] - piCur[39]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2847    iTemp = piOrg[40] - piCur[40]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2848    iTemp = piOrg[41] - piCur[41]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2849    iTemp = piOrg[42] - piCur[42]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2850    iTemp = piOrg[43] - piCur[43]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2851    iTemp = piOrg[44] - piCur[44]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2852    iTemp = piOrg[45] - piCur[45]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2853    iTemp = piOrg[46] - piCur[46]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2854    iTemp = piOrg[47] - piCur[47]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2855    iTemp = piOrg[48] - piCur[48]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2856    iTemp = piOrg[49] - piCur[49]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2857    iTemp = piOrg[50] - piCur[50]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2858    iTemp = piOrg[51] - piCur[51]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2859    iTemp = piOrg[52] - piCur[52]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2860    iTemp = piOrg[53] - piCur[53]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2861    iTemp = piOrg[54] - piCur[54]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2862    iTemp = piOrg[55] - piCur[55]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2863    iTemp = piOrg[56] - piCur[56]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2864    iTemp = piOrg[57] - piCur[57]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2865    iTemp = piOrg[58] - piCur[58]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2866    iTemp = piOrg[59] - piCur[59]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2867    iTemp = piOrg[60] - piCur[60]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2868    iTemp = piOrg[61] - piCur[61]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2869    iTemp = piOrg[62] - piCur[62]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2870    iTemp = piOrg[63] - piCur[63]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
2871
2872    piOrg += iStrideOrg;
2873    piCur += iStrideCur;
2874  }
2875
2876  return ( uiSum );
2877}
2878
2879#if NH_3D_VSO
2880//SAIT_VSO_EST_A0033
2881UInt TComRdCost::getVSDEstimate( Int dDM, Pel* pOrg, Int iOrgStride,  Pel* pVirRec, Pel* pVirOrg, Int iVirStride, Int x, Int y )
2882{ 
2883  // change to use bit depth from DistParam struct
2884  Double  dD = ( (Double) ( dDM >> ( ENC_INTERNAL_BIT_DEPTH - 8 ) ) ) * m_dDisparityCoeff;
2885
2886  Double dDepthWeight = ( pOrg[x] >=  ( (1<<(REN_BIT_DEPTH - 3)) + (1<<(REN_BIT_DEPTH - 2)) ) ? 4 : pOrg[x] > ((1<<REN_BIT_DEPTH) >> 4) ? (Float)(pOrg[x] - ((1<<REN_BIT_DEPTH) >> 4))/(Float)((1<<REN_BIT_DEPTH) >> 3) + 1 : 1.0 );
2887
2888  Double dTemp = ( 0.5 * fabs(dD) * dDepthWeight * ( abs( (Int) pVirRec[ x+y*iVirStride ] - (Int) pVirRec[ x-1+y*iVirStride ] ) + abs( (Int) pVirRec[ x+y*iVirStride ] - (Int) pVirRec[ x+1+y*iVirStride ] ) ) );
2889  Int iTemp = (Int) (((dTemp) < 0)? (Int)((dTemp) - 0.5) : (Int)((dTemp) + 0.5));
2890
2891  return (UInt) ( (iTemp*iTemp)>>1 );
2892}
2893
2894UInt TComRdCost::xGetVSD( DistParam* pcDtParam )
2895{
2896  Pel* piOrg    = pcDtParam->pOrg;
2897  Pel* piCur    = pcDtParam->pCur;
2898  Pel* piVirRec = pcDtParam->pVirRec;
2899  Pel* piVirOrg = pcDtParam->pVirOrg;
2900  Int  iRows    = pcDtParam->iRows;
2901  Int  iCols    = pcDtParam->iCols;
2902  Int  iStrideOrg = pcDtParam->iStrideOrg;
2903  Int  iStrideCur = pcDtParam->iStrideCur;
2904  Int  iStrideVir = pcDtParam->iStrideVir;
2905
2906  UInt uiSum = 0;
2907  UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8)<<1;
2908
2909  Int dDM;
2910
2911  for ( Int y = 0 ; y < iRows ; y++ )
2912  {
2913    for (Int x = 0; x < iCols; x++ )
2914    {
2915      dDM = (Int) ( piOrg[] - piCur[] );
2916      uiSum += getVSDEstimate( dDM, piOrg, iStrideOrg, piVirRec, piVirOrg, iStrideVir, x, y ) >> uiShift;
2917    }
2918    piOrg += iStrideOrg;
2919    piCur += iStrideCur; 
2920  }
2921
2922  return ( uiSum );
2923}
2924
2925UInt TComRdCost::xGetVSD4( DistParam* pcDtParam )
2926{
2927  Pel* piOrg   = pcDtParam->pOrg;
2928  Pel* piCur   = pcDtParam->pCur;
2929  Pel* piVirRec = pcDtParam->pVirRec;
2930  Pel* piVirOrg = pcDtParam->pVirOrg;
2931  Int  iRows   = pcDtParam->iRows;
2932  Int  iStrideOrg = pcDtParam->iStrideOrg;
2933  Int  iStrideCur = pcDtParam->iStrideCur;
2934  Int  iStrideVir = pcDtParam->iStrideVir;
2935
2936  UInt uiSum = 0;
2937  UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8)<<1;
2938
2939  Int dDM;
2940
2941  for ( Int y = 0 ; y < iRows ; y++ )
2942  {
2943    dDM = (Int) ( piOrg[0] - piCur[0] );  uiSum += ( getVSDEstimate( dDM, piOrg, iStrideOrg, piVirRec, piVirOrg, iStrideVir, 0, y ) ) >> uiShift;
2944    dDM = (Int) ( piOrg[1] - piCur[1] );  uiSum += ( getVSDEstimate( dDM, piOrg, iStrideOrg, piVirRec, piVirOrg, iStrideVir, 1, y ) ) >> uiShift;
2945    dDM = (Int) ( piOrg[2] - piCur[2] );  uiSum += ( getVSDEstimate( dDM, piOrg, iStrideOrg, piVirRec, piVirOrg, iStrideVir, 2, y ) ) >> uiShift;
2946    dDM = (Int) ( piOrg[3] - piCur[3] );  uiSum += ( getVSDEstimate( dDM, piOrg, iStrideOrg, piVirRec, piVirOrg, iStrideVir, 3, y ) ) >> uiShift;
2947
2948    piOrg += iStrideOrg;
2949    piCur += iStrideCur;
2950  }
2951
2952  return ( uiSum );
2953}
2954
2955UInt TComRdCost::xGetVSD8( DistParam* pcDtParam )
2956{
2957  Pel* piOrg   = pcDtParam->pOrg;
2958  Pel* piCur   = pcDtParam->pCur;
2959  Pel* piVirRec = pcDtParam->pVirRec;
2960  Pel* piVirOrg = pcDtParam->pVirOrg;
2961  Int  iRows   = pcDtParam->iRows;
2962  Int  iStrideOrg = pcDtParam->iStrideOrg;
2963  Int  iStrideCur = pcDtParam->iStrideCur;
2964  Int  iStrideVir = pcDtParam->iStrideVir;
2965
2966  UInt uiSum = 0;
2967  UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8)<<1;
2968
2969  Int dDM;
2970
2971  for ( Int y = 0 ; y < iRows ; y++ )
2972  {
2973    for (Int x = 0; x < 8; x++ )
2974    {
2975      dDM = (Int) ( piOrg[x] - piCur[x] );
2976      uiSum += getVSDEstimate( dDM, piOrg, iStrideOrg, piVirRec, piVirOrg, iStrideVir, x, y ) >> uiShift;
2977    }
2978    piOrg += iStrideOrg;
2979    piCur += iStrideCur;
2980  }
2981
2982  return ( uiSum );
2983}
2984
2985UInt TComRdCost::xGetVSD16( DistParam* pcDtParam )
2986{
2987  Pel* piOrg   = pcDtParam->pOrg;
2988  Pel* piCur   = pcDtParam->pCur;
2989  Pel* piVirRec = pcDtParam->pVirRec;
2990  Pel* piVirOrg = pcDtParam->pVirOrg;
2991  Int  iRows   = pcDtParam->iRows;
2992  Int  iStrideOrg = pcDtParam->iStrideOrg;
2993  Int  iStrideCur = pcDtParam->iStrideCur;
2994  Int  iStrideVir = pcDtParam->iStrideVir;
2995
2996  UInt uiSum = 0;
2997  UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8)<<1;
2998
2999  Int dDM;
3000
3001  for ( Int y = 0 ; y < iRows ; y++ )
3002  {
3003    for (Int x = 0; x < 16; x++ )
3004    {
3005      dDM = (Int) ( piOrg[x] - piCur[x] );
3006      uiSum += getVSDEstimate( dDM, piOrg, iStrideOrg, piVirRec, piVirOrg, iStrideVir, x, y ) >> uiShift;
3007    }
3008    piOrg += iStrideOrg;
3009    piCur += iStrideCur;
3010  }
3011
3012  return ( uiSum );
3013}
3014
3015UInt TComRdCost::xGetVSD16N( DistParam* pcDtParam )
3016{
3017  Pel* piOrg   = pcDtParam->pOrg;
3018  Pel* piCur   = pcDtParam->pCur;
3019  Pel* piVirRec = pcDtParam->pVirRec;
3020  Pel* piVirOrg = pcDtParam->pVirOrg;
3021  Int  iRows   = pcDtParam->iRows;
3022  Int  iCols   = pcDtParam->iCols;
3023  Int  iStrideOrg = pcDtParam->iStrideOrg;
3024  Int  iStrideCur = pcDtParam->iStrideCur;
3025  Int  iStrideVir = pcDtParam->iStrideVir;
3026
3027  UInt uiSum = 0;
3028  UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8)<<1;
3029
3030  Int dDM;
3031
3032  for ( Int y = 0 ; y < iRows ; y++ )
3033  {
3034    for (Int x = 0; x < iCols; x+=16 )
3035    {
3036      for ( Int k = 0 ; k < 16 ; k++ )
3037      {
3038        dDM = (Int) ( piOrg[x+k] - piCur[x+k] );
3039        uiSum += getVSDEstimate( dDM, piOrg, iStrideOrg, piVirRec, piVirOrg, iStrideVir, x+k, y ) >> uiShift;
3040      }
3041    }
3042    piOrg += iStrideOrg;
3043    piCur += iStrideCur;
3044  }
3045
3046  return ( uiSum );
3047}
3048
3049UInt TComRdCost::xGetVSD32( DistParam* pcDtParam )
3050{
3051  Pel* piOrg   = pcDtParam->pOrg;
3052  Pel* piCur   = pcDtParam->pCur;
3053  Pel* piVirRec = pcDtParam->pVirRec;
3054  Pel* piVirOrg = pcDtParam->pVirOrg;
3055  Int  iRows   = pcDtParam->iRows;
3056  Int  iStrideOrg = pcDtParam->iStrideOrg;
3057  Int  iStrideCur = pcDtParam->iStrideCur;
3058  Int  iStrideVir = pcDtParam->iStrideVir;
3059
3060  UInt uiSum = 0;
3061  UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8)<<1;
3062
3063  Int dDM;
3064
3065  for ( Int y = 0 ; y < iRows ; y++ )
3066  {
3067    for (Int x = 0; x < 32 ; x++ )
3068    {
3069      dDM = (Int) ( piOrg[x] - piCur[x] );
3070      uiSum += getVSDEstimate( dDM, piOrg, iStrideOrg, piVirRec, piVirOrg, iStrideVir, x, y ) >> uiShift;
3071    }
3072    piOrg += iStrideOrg;
3073    piCur += iStrideCur;
3074  }
3075
3076  return ( uiSum );
3077}
3078
3079UInt TComRdCost::xGetVSD64( DistParam* pcDtParam )
3080{
3081  Pel* piOrg      = pcDtParam->pOrg;
3082  Pel* piCur      = pcDtParam->pCur;
3083  Pel* piVirRec   = pcDtParam->pVirRec;
3084  Pel* piVirOrg   = pcDtParam->pVirOrg;
3085  Int  iRows      = pcDtParam->iRows;
3086  Int  iStrideOrg = pcDtParam->iStrideOrg;
3087  Int  iStrideCur = pcDtParam->iStrideCur;
3088  Int  iStrideVir = pcDtParam->iStrideVir;
3089
3090  UInt uiSum = 0;
3091  UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8)<<1;
3092
3093  Int dDM;
3094
3095  for ( Int y = 0 ; y < iRows ; y++ )
3096  {
3097    for (Int x = 0; x < 64; x++ )
3098    {
3099      dDM = (Int) ( piOrg[x] - piCur[x] );
3100      uiSum += getVSDEstimate( dDM, piOrg, iStrideOrg, piVirRec, piVirOrg, iStrideVir, x, y ) >> uiShift;
3101    }
3102    piOrg += iStrideOrg;
3103    piCur += iStrideCur;
3104  }
3105
3106  return ( uiSum );
3107}
3108
3109#endif
3110
3111// --------------------------------------------------------------------------------------------------------------------
3112// HADAMARD with step (used in fractional search)
3113// --------------------------------------------------------------------------------------------------------------------
3114
3115Distortion TComRdCost::xCalcHADs2x2( Pel *piOrg, Pel *piCur, Int iStrideOrg, Int iStrideCur, Int iStep )
3116{
3117  Distortion satd = 0;
3118  TCoeff diff[4], m[4];
3119  assert( iStep == 1 );
3120  diff[0] = piOrg[0             ] - piCur[0];
3121  diff[1] = piOrg[1             ] - piCur[1];
3122  diff[2] = piOrg[iStrideOrg    ] - piCur[0 + iStrideCur];
3123  diff[3] = piOrg[iStrideOrg + 1] - piCur[1 + iStrideCur];
3124  m[0] = diff[0] + diff[2];
3125  m[1] = diff[1] + diff[3];
3126  m[2] = diff[0] - diff[2];
3127  m[3] = diff[1] - diff[3];
3128
3129  satd += abs(m[0] + m[1]);
3130  satd += abs(m[0] - m[1]);
3131  satd += abs(m[2] + m[3]);
3132  satd += abs(m[2] - m[3]);
3133
3134  return satd;
3135}
3136
3137Distortion TComRdCost::xCalcHADs4x4( Pel *piOrg, Pel *piCur, Int iStrideOrg, Int iStrideCur, Int iStep )
3138{
3139  Int k;
3140  Distortion satd = 0;
3141  TCoeff diff[16], m[16], d[16];
3142
3143  assert( iStep == 1 );
3144  for( k = 0; k < 16; k+=4 )
3145  {
3146    diff[k+0] = piOrg[0] - piCur[0];
3147    diff[k+1] = piOrg[1] - piCur[1];
3148    diff[k+2] = piOrg[2] - piCur[2];
3149    diff[k+3] = piOrg[3] - piCur[3];
3150
3151    piCur += iStrideCur;
3152    piOrg += iStrideOrg;
3153  }
3154
3155  /*===== hadamard transform =====*/
3156  m[ 0] = diff[ 0] + diff[12];
3157  m[ 1] = diff[ 1] + diff[13];
3158  m[ 2] = diff[ 2] + diff[14];
3159  m[ 3] = diff[ 3] + diff[15];
3160  m[ 4] = diff[ 4] + diff[ 8];
3161  m[ 5] = diff[ 5] + diff[ 9];
3162  m[ 6] = diff[ 6] + diff[10];
3163  m[ 7] = diff[ 7] + diff[11];
3164  m[ 8] = diff[ 4] - diff[ 8];
3165  m[ 9] = diff[ 5] - diff[ 9];
3166  m[10] = diff[ 6] - diff[10];
3167  m[11] = diff[ 7] - diff[11];
3168  m[12] = diff[ 0] - diff[12];
3169  m[13] = diff[ 1] - diff[13];
3170  m[14] = diff[ 2] - diff[14];
3171  m[15] = diff[ 3] - diff[15];
3172
3173  d[ 0] = m[ 0] + m[ 4];
3174  d[ 1] = m[ 1] + m[ 5];
3175  d[ 2] = m[ 2] + m[ 6];
3176  d[ 3] = m[ 3] + m[ 7];
3177  d[ 4] = m[ 8] + m[12];
3178  d[ 5] = m[ 9] + m[13];
3179  d[ 6] = m[10] + m[14];
3180  d[ 7] = m[11] + m[15];
3181  d[ 8] = m[ 0] - m[ 4];
3182  d[ 9] = m[ 1] - m[ 5];
3183  d[10] = m[ 2] - m[ 6];
3184  d[11] = m[ 3] - m[ 7];
3185  d[12] = m[12] - m[ 8];
3186  d[13] = m[13] - m[ 9];
3187  d[14] = m[14] - m[10];
3188  d[15] = m[15] - m[11];
3189
3190  m[ 0] = d[ 0] + d[ 3];
3191  m[ 1] = d[ 1] + d[ 2];
3192  m[ 2] = d[ 1] - d[ 2];
3193  m[ 3] = d[ 0] - d[ 3];
3194  m[ 4] = d[ 4] + d[ 7];
3195  m[ 5] = d[ 5] + d[ 6];
3196  m[ 6] = d[ 5] - d[ 6];
3197  m[ 7] = d[ 4] - d[ 7];
3198  m[ 8] = d[ 8] + d[11];
3199  m[ 9] = d[ 9] + d[10];
3200  m[10] = d[ 9] - d[10];
3201  m[11] = d[ 8] - d[11];
3202  m[12] = d[12] + d[15];
3203  m[13] = d[13] + d[14];
3204  m[14] = d[13] - d[14];
3205  m[15] = d[12] - d[15];
3206
3207  d[ 0] = m[ 0] + m[ 1];
3208  d[ 1] = m[ 0] - m[ 1];
3209  d[ 2] = m[ 2] + m[ 3];
3210  d[ 3] = m[ 3] - m[ 2];
3211  d[ 4] = m[ 4] + m[ 5];
3212  d[ 5] = m[ 4] - m[ 5];
3213  d[ 6] = m[ 6] + m[ 7];
3214  d[ 7] = m[ 7] - m[ 6];
3215  d[ 8] = m[ 8] + m[ 9];
3216  d[ 9] = m[ 8] - m[ 9];
3217  d[10] = m[10] + m[11];
3218  d[11] = m[11] - m[10];
3219  d[12] = m[12] + m[13];
3220  d[13] = m[12] - m[13];
3221  d[14] = m[14] + m[15];
3222  d[15] = m[15] - m[14];
3223
3224  for (k=0; k<16; ++k)
3225  {
3226    satd += abs(d[k]);
3227  }
3228  satd = ((satd+1)>>1);
3229
3230  return satd;
3231}
3232
3233Distortion TComRdCost::xCalcHADs8x8( Pel *piOrg, Pel *piCur, Int iStrideOrg, Int iStrideCur, Int iStep )
3234{
3235  Int k, i, j, jj;
3236  Distortion sad = 0;
3237  TCoeff diff[64], m1[8][8], m2[8][8], m3[8][8];
3238  assert( iStep == 1 );
3239  for( k = 0; k < 64; k += 8 )
3240  {
3241    diff[k+0] = piOrg[0] - piCur[0];
3242    diff[k+1] = piOrg[1] - piCur[1];
3243    diff[k+2] = piOrg[2] - piCur[2];
3244    diff[k+3] = piOrg[3] - piCur[3];
3245    diff[k+4] = piOrg[4] - piCur[4];
3246    diff[k+5] = piOrg[5] - piCur[5];
3247    diff[k+6] = piOrg[6] - piCur[6];
3248    diff[k+7] = piOrg[7] - piCur[7];
3249
3250    piCur += iStrideCur;
3251    piOrg += iStrideOrg;
3252  }
3253
3254  //horizontal
3255  for (j=0; j < 8; j++)
3256  {
3257    jj = j << 3;
3258    m2[j][0] = diff[jj  ] + diff[jj+4];
3259    m2[j][1] = diff[jj+1] + diff[jj+5];
3260    m2[j][2] = diff[jj+2] + diff[jj+6];
3261    m2[j][3] = diff[jj+3] + diff[jj+7];
3262    m2[j][4] = diff[jj  ] - diff[jj+4];
3263    m2[j][5] = diff[jj+1] - diff[jj+5];
3264    m2[j][6] = diff[jj+2] - diff[jj+6];
3265    m2[j][7] = diff[jj+3] - diff[jj+7];
3266
3267    m1[j][0] = m2[j][0] + m2[j][2];
3268    m1[j][1] = m2[j][1] + m2[j][3];
3269    m1[j][2] = m2[j][0] - m2[j][2];
3270    m1[j][3] = m2[j][1] - m2[j][3];
3271    m1[j][4] = m2[j][4] + m2[j][6];
3272    m1[j][5] = m2[j][5] + m2[j][7];
3273    m1[j][6] = m2[j][4] - m2[j][6];
3274    m1[j][7] = m2[j][5] - m2[j][7];
3275
3276    m2[j][0] = m1[j][0] + m1[j][1];
3277    m2[j][1] = m1[j][0] - m1[j][1];
3278    m2[j][2] = m1[j][2] + m1[j][3];
3279    m2[j][3] = m1[j][2] - m1[j][3];
3280    m2[j][4] = m1[j][4] + m1[j][5];
3281    m2[j][5] = m1[j][4] - m1[j][5];
3282    m2[j][6] = m1[j][6] + m1[j][7];
3283    m2[j][7] = m1[j][6] - m1[j][7];
3284  }
3285
3286  //vertical
3287  for (i=0; i < 8; i++)
3288  {
3289    m3[0][i] = m2[0][i] + m2[4][i];
3290    m3[1][i] = m2[1][i] + m2[5][i];
3291    m3[2][i] = m2[2][i] + m2[6][i];
3292    m3[3][i] = m2[3][i] + m2[7][i];
3293    m3[4][i] = m2[0][i] - m2[4][i];
3294    m3[5][i] = m2[1][i] - m2[5][i];
3295    m3[6][i] = m2[2][i] - m2[6][i];
3296    m3[7][i] = m2[3][i] - m2[7][i];
3297
3298    m1[0][i] = m3[0][i] + m3[2][i];
3299    m1[1][i] = m3[1][i] + m3[3][i];
3300    m1[2][i] = m3[0][i] - m3[2][i];
3301    m1[3][i] = m3[1][i] - m3[3][i];
3302    m1[4][i] = m3[4][i] + m3[6][i];
3303    m1[5][i] = m3[5][i] + m3[7][i];
3304    m1[6][i] = m3[4][i] - m3[6][i];
3305    m1[7][i] = m3[5][i] - m3[7][i];
3306
3307    m2[0][i] = m1[0][i] + m1[1][i];
3308    m2[1][i] = m1[0][i] - m1[1][i];
3309    m2[2][i] = m1[2][i] + m1[3][i];
3310    m2[3][i] = m1[2][i] - m1[3][i];
3311    m2[4][i] = m1[4][i] + m1[5][i];
3312    m2[5][i] = m1[4][i] - m1[5][i];
3313    m2[6][i] = m1[6][i] + m1[7][i];
3314    m2[7][i] = m1[6][i] - m1[7][i];
3315  }
3316
3317  for (i = 0; i < 8; i++)
3318  {
3319    for (j = 0; j < 8; j++)
3320    {
3321      sad += abs(m2[i][j]);
3322    }
3323  }
3324
3325  sad=((sad+2)>>2);
3326
3327  return sad;
3328}
3329
3330
3331Distortion TComRdCost::xGetHADs( DistParam* pcDtParam )
3332{
3333  if ( pcDtParam->bApplyWeight )
3334  {
3335    return TComRdCostWeightPrediction::xGetHADsw( pcDtParam );
3336  }
3337#if NH_3D_IC
3338  if( pcDtParam->bUseIC )
3339  {
3340    return xGetHADsic( pcDtParam );
3341  }
3342#endif
3343#if NH_3D_SDC_INTER
3344  if( pcDtParam->bUseSDCMRSAD )
3345  {
3346    return xGetHADsic( pcDtParam );
3347  }
3348#endif
3349
3350  Pel* piOrg   = pcDtParam->pOrg;
3351  Pel* piCur   = pcDtParam->pCur;
3352  Int  iRows   = pcDtParam->iRows;
3353  Int  iCols   = pcDtParam->iCols;
3354  Int  iStrideCur = pcDtParam->iStrideCur;
3355  Int  iStrideOrg = pcDtParam->iStrideOrg;
3356  Int  iStep  = pcDtParam->iStep;
3357
3358  Int  x, y;
3359
3360  Distortion uiSum = 0;
3361
3362  if( ( iRows % 8 == 0) && (iCols % 8 == 0) )
3363  {
3364    Int  iOffsetOrg = iStrideOrg<<3;
3365    Int  iOffsetCur = iStrideCur<<3;
3366    for ( y=0; y<iRows; y+= 8 )
3367    {
3368      for ( x=0; x<iCols; x+= 8 )
3369      {
3370        uiSum += xCalcHADs8x8( &piOrg[x], &piCur[x*iStep], iStrideOrg, iStrideCur, iStep );
3371      }
3372      piOrg += iOffsetOrg;
3373      piCur += iOffsetCur;
3374    }
3375  }
3376  else if( ( iRows % 4 == 0) && (iCols % 4 == 0) )
3377  {
3378    Int  iOffsetOrg = iStrideOrg<<2;
3379    Int  iOffsetCur = iStrideCur<<2;
3380
3381    for ( y=0; y<iRows; y+= 4 )
3382    {
3383      for ( x=0; x<iCols; x+= 4 )
3384      {
3385        uiSum += xCalcHADs4x4( &piOrg[x], &piCur[x*iStep], iStrideOrg, iStrideCur, iStep );
3386      }
3387      piOrg += iOffsetOrg;
3388      piCur += iOffsetCur;
3389    }
3390  }
3391  else if( ( iRows % 2 == 0) && (iCols % 2 == 0) )
3392  {
3393    Int  iOffsetOrg = iStrideOrg<<1;
3394    Int  iOffsetCur = iStrideCur<<1;
3395    for ( y=0; y<iRows; y+=2 )
3396    {
3397      for ( x=0; x<iCols; x+=2 )
3398      {
3399        uiSum += xCalcHADs2x2( &piOrg[x], &piCur[x*iStep], iStrideOrg, iStrideCur, iStep );
3400      }
3401      piOrg += iOffsetOrg;
3402      piCur += iOffsetCur;
3403    }
3404  }
3405  else
3406  {
3407    assert(false);
3408  }
3409
3410  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
3411}
3412
3413#if NH_3D_IC || NH_3D_SDC_INTER
3414UInt TComRdCost::xGetHADsic( DistParam* pcDtParam )
3415{
3416  if ( pcDtParam->bApplyWeight )
3417  {
3418    return TComRdCostWeightPrediction::xGetHADsw( pcDtParam );
3419  }
3420  Pel* piOrg   = pcDtParam->pOrg;
3421  Pel* piCur   = pcDtParam->pCur;
3422  Int  iRows   = pcDtParam->iRows;
3423  Int  iCols   = pcDtParam->iCols;
3424  Int  iStrideCur = pcDtParam->iStrideCur;
3425  Int  iStrideOrg = pcDtParam->iStrideOrg;
3426  Int  iStep  = pcDtParam->iStep;
3427
3428  Int  x, y;
3429
3430  UInt uiSum = 0;
3431
3432  Int  iOrigAvg = 0, iCurAvg = 0;
3433  Int  iDeltaC;
3434
3435  for ( y=0; y<iRows; y++ )
3436  {
3437    for ( x=0; x<iCols; x++ )
3438    {       
3439      iOrigAvg += piOrg[x];
3440      iCurAvg  += piCur[x];
3441    }
3442    piOrg += iStrideOrg;
3443    piCur += iStrideCur;
3444  }
3445
3446  piOrg   = pcDtParam->pOrg;
3447  piCur   = pcDtParam->pCur;
3448
3449  iDeltaC = (iOrigAvg - iCurAvg)/iRows/iCols;
3450
3451  for ( y=0; y<iRows; y++ )
3452  {
3453    for ( x=0; x<iCols; x++ )
3454    {       
3455      piOrg[x] -= iDeltaC;
3456    }
3457    piOrg += iStrideOrg;
3458  }
3459
3460  piOrg   = pcDtParam->pOrg;
3461
3462#if NS_HAD
3463  if( ( ( iRows % 8 == 0) && (iCols % 8 == 0) && ( iRows == iCols ) ) || ( ( iRows % 8 == 0 ) && (iCols % 8 == 0) && !pcDtParam->bUseNSHAD ) )
3464#else
3465  if( ( iRows % 8 == 0) && (iCols % 8 == 0) )
3466#endif
3467  {
3468    Int  iOffsetOrg = iStrideOrg<<3;
3469    Int  iOffsetCur = iStrideCur<<3;
3470    for ( y=0; y<iRows; y+= 8 )
3471    {
3472      for ( x=0; x<iCols; x+= 8 )
3473      {
3474        uiSum += xCalcHADs8x8( &piOrg[x], &piCur[x*iStep], iStrideOrg, iStrideCur, iStep );
3475      }
3476      piOrg += iOffsetOrg;
3477      piCur += iOffsetCur;
3478    }
3479  }
3480#if NS_HAD
3481  else if ( ( iCols > 8 ) && ( iCols > iRows ) && pcDtParam->bUseNSHAD ) 
3482  {
3483    Int  iOffsetOrg = iStrideOrg<<2;
3484    Int  iOffsetCur = iStrideCur<<2;
3485    for ( y=0; y<iRows; y+= 4 )
3486    {
3487      for ( x=0; x<iCols; x+= 16 )
3488      {
3489        uiSum += xCalcHADs16x4( &piOrg[x], &piCur[x*iStep], iStrideOrg, iStrideCur, iStep );
3490      }
3491      piOrg += iOffsetOrg;
3492      piCur += iOffsetCur;
3493    }
3494  }
3495  else if ( ( iRows > 8 ) && ( iCols < iRows ) && pcDtParam->bUseNSHAD ) 
3496  {
3497    Int  iOffsetOrg = iStrideOrg<<4;
3498    Int  iOffsetCur = iStrideCur<<4;
3499    for ( y=0; y<iRows; y+= 16 )
3500    {
3501      for ( x=0; x<iCols; x+= 4 )
3502      {
3503        uiSum += xCalcHADs4x16( &piOrg[x], &piCur[x*iStep], iStrideOrg, iStrideCur, iStep );
3504      }
3505      piOrg += iOffsetOrg;
3506      piCur += iOffsetCur;
3507    }
3508  }
3509#endif
3510  else if( ( iRows % 4 == 0) && (iCols % 4 == 0) )
3511  {
3512    Int  iOffsetOrg = iStrideOrg<<2;
3513    Int  iOffsetCur = iStrideCur<<2;
3514
3515    for ( y=0; y<iRows; y+= 4 )
3516    {
3517      for ( x=0; x<iCols; x+= 4 )
3518      {
3519        uiSum += xCalcHADs4x4( &piOrg[x], &piCur[x*iStep], iStrideOrg, iStrideCur, iStep );
3520      }
3521      piOrg += iOffsetOrg;
3522      piCur += iOffsetCur;
3523    }
3524  }
3525  else if( ( iRows % 2 == 0) && (iCols % 2 == 0) )
3526  {
3527    Int  iOffsetOrg = iStrideOrg<<1;
3528    Int  iOffsetCur = iStrideCur<<1;
3529    for ( y=0; y<iRows; y+=2 )
3530    {
3531      for ( x=0; x<iCols; x+=2 )
3532      {
3533        uiSum += xCalcHADs2x2( &piOrg[x], &piCur[x*iStep], iStrideOrg, iStrideCur, iStep );
3534      }
3535      piOrg += iOffsetOrg;
3536      piCur += iOffsetCur;
3537    }
3538  }
3539  else
3540  {
3541    assert(false);
3542  }
3543
3544  piOrg   = pcDtParam->pOrg;
3545
3546  for ( y=0; y<iRows; y++ )
3547  {
3548    for ( x=0; x<iCols; x++ )
3549    {       
3550      piOrg[x] += iDeltaC;
3551    }
3552    piOrg += iStrideOrg;
3553  }
3554
3555  return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT( pcDtParam->bitDepth - 8 ) );
3556}
3557#endif
3558#if NH_3D_VSO
3559Void TComRdCost::setLambdaVSO( Double dLambdaVSO )
3560{
3561  m_dLambdaVSO           = dLambdaVSO;
3562  m_dSqrtLambdaVSO       = sqrt(m_dLambdaVSO); 
3563  m_uiLambdaMotionSADVSO = (UInt)floor(65536.0 *       m_dSqrtLambdaVSO);
3564  m_uiLambdaMotionSSEVSO = (UInt)floor(65536.0 *       m_dLambdaVSO    );
3565}
3566#endif
3567#if NH_3D_VSO
3568Dist TComRdCost::xGetDistVSOMode4( Int iStartPosX, Int iStartPosY, Pel* piCur, Int iCurStride, Pel* piOrg, Int iOrgStride, UInt uiBlkWidth, UInt uiBlkHeight, Bool bSAD )
3569{ 
3570  AOT(bSAD); 
3571#if H_3D_VSO_EARLY_SKIP
3572  RMDist iDist = m_pcRenModel->getDist( iStartPosX, iStartPosY, (Int) uiBlkWidth, (Int) uiBlkHeight, iCurStride, piCur, piOrg, iOrgStride); 
3573#else
3574  RMDist iDist = m_pcRenModel->getDist( iStartPosX, iStartPosY, (Int) uiBlkWidth, (Int) uiBlkHeight, iCurStride, piCur ); 
3575#endif
3576
3577  RMDist iDistMin = (RMDist) RDO_DIST_MIN; 
3578  iDistMin = m_bAllowNegDist ? RDO_DIST_MIN : 0; 
3579 
3580  iDist = std::min( iDist, (RMDist) RDO_DIST_MAX);
3581  iDist = std::max( iDist, iDistMin);
3582  return (Dist) iDist;
3583}
3584
3585
3586Dist TComRdCost::getDistPartVSO( TComDataCU* pcCU, UInt uiAbsPartIndex, Int bitDepth, Pel* piCur, Int iCurStride, Pel* piOrg, Int iOrgStride, UInt uiBlkWidth, UInt uiBlkHeight, Bool bHAD )
3587{ 
3588  assert( m_bUseVSO ); 
3589  assert( this->m_fpDistortFuncVSO != 0 );
3590
3591  Int iPosX;
3592  Int iPosY; 
3593 
3594  pcCU->getPosInPic( uiAbsPartIndex, iPosX, iPosY ); 
3595   
3596  Dist dist = (this->*m_fpDistortFuncVSO) ( iPosX, iPosY, piCur, iCurStride, piOrg, iOrgStride, uiBlkWidth, uiBlkHeight, bHAD ); 
3597 
3598  if ( m_bUseWVSO )   
3599  {
3600    Int iDWeight   = m_iDWeight   * m_iDWeight  ;
3601    Int iVSOWeight = m_iVSOWeight * m_iVSOWeight;
3602    Dist distDepth;
3603   
3604    if ( !bHAD )
3605    {
3606       distDepth = (Dist) getDistPart( bitDepth, piCur, iCurStride, piOrg, iOrgStride, uiBlkWidth, uiBlkHeight, COMPONENT_Y);
3607    }
3608    else
3609    {
3610       distDepth = (Dist) calcHAD    ( bitDepth, piCur, iCurStride, piOrg, iOrgStride, uiBlkWidth, uiBlkHeight);
3611    }
3612   
3613    dist = (Dist) (iDWeight * distDepth + iVSOWeight * dist ) / ( iDWeight + iVSOWeight);
3614  }
3615  return dist; 
3616}; 
3617
3618
3619Void TComRdCost::setVSOMode( UInt uiIn )
3620{
3621  m_uiVSOMode = uiIn;
3622  switch (m_uiVSOMode )
3623  {
3624  case   4:
3625    m_fpDistortFuncVSO = &TComRdCost::xGetDistVSOMode4;
3626    break;
3627  default:
3628    assert(0); 
3629    break; 
3630  }
3631}
3632
3633
3634Double TComRdCost::calcRdCostVSO( UInt uiBits, Dist uiDistortion, Bool bFlag, DFunc eDFunc )
3635{
3636  assert( m_bUseLambdaScaleVSO );   
3637
3638  Double dRdCost = 0.0;
3639  Double dLambda = 0.0;   
3640
3641  switch ( eDFunc )
3642  {
3643  case DF_SSE:
3644    assert(0);
3645    break;
3646  case DF_SAD:
3647    dLambda = (Double)m_uiLambdaMotionSADVSO;
3648    break;
3649  case DF_DEFAULT:
3650    dLambda =         m_dLambdaVSO;
3651    break;
3652  case DF_SSE_FRAME:
3653    dLambda =         m_dFrameLambdaVSO;
3654    break;
3655  default:
3656    assert (0);
3657    break;
3658  }
3659
3660  if (bFlag)
3661  {
3662    // Intra8x8, Intra4x4 Block only...
3663#if SEQUENCE_LEVEL_LOSSLESS
3664    dRdCost = (Double)(uiBits);
3665#else
3666    dRdCost = (((Double)uiDistortion) + ((Double)uiBits * dLambda));
3667#endif
3668  }
3669  else
3670  {
3671    if (eDFunc == DF_SAD)
3672    {
3673      dRdCost = ((Double)uiDistortion + (Double)((Int)(uiBits * dLambda+.5)>>16));
3674      dRdCost = (Double)(Dist)floor(dRdCost);
3675    }
3676    else
3677    {
3678#if SEQUENCE_LEVEL_LOSSLESS
3679      dRdCost = (Double)(uiBits);
3680#else
3681      dRdCost = ((Double)uiDistortion + (Double)((Int)(uiBits * dLambda+.5)));
3682      dRdCost = (Double)(Dist)floor(dRdCost);
3683#endif
3684    }
3685  }
3686
3687  D_PRINT_INDENT( g_traceRDCost, "VSO Dist: " + n2s(uiDistortion) + " Bits: " + n2s(uiBits) + " RD Cost: " + n2s(dRdCost)); 
3688
3689  return dRdCost;
3690}
3691
3692Void TComRdCost::setRenModelData( const TComDataCU* pcCU, UInt uiAbsPartIndex, const TComYuv* pcYuv, const TComTURecurse* tuRecurseWithPU )
3693{
3694  const TComRectangle &puRect=tuRecurseWithPU->getRect(COMPONENT_Y);
3695  const UInt  uiCompWidth   = puRect.width;
3696  const UInt  uiCompHeight  = puRect.height;
3697
3698  const Pel*  piSrc         = pcYuv->getAddr( COMPONENT_Y, uiAbsPartIndex );
3699  const UInt  uiSrcStride   = pcYuv->getStride( COMPONENT_Y);
3700  setRenModelData( pcCU, uiAbsPartIndex, piSrc, uiSrcStride, uiCompWidth, uiCompHeight ); 
3701}
3702
3703Void TComRdCost::setRenModelData( const TComDataCU* pcCU, UInt uiAbsPartIndex, const Pel* piData, Int iStride, Int iBlkWidth, Int iBlkHeight )
3704{
3705  UInt iBlkX = g_auiRasterToPelX[g_auiZscanToRaster[uiAbsPartIndex]];
3706  UInt iBlkY = g_auiRasterToPelY[g_auiZscanToRaster[uiAbsPartIndex]];
3707
3708  Int iStartPosX = iBlkX + pcCU->getCUPelX();
3709  Int iStartPosY = iBlkY + pcCU->getCUPelY();
3710
3711  m_pcRenModel->setData( iStartPosX, iStartPosY, iBlkWidth, iBlkHeight, iStride, piData );
3712}
3713
3714Void TComRdCost::setAllowNegDist( Bool bAllowNegDist )
3715{
3716  m_bAllowNegDist = bAllowNegDist;
3717}
3718#endif
3719
3720//! \}
Note: See TracBrowser for help on using the repository browser.