source: 3DVCSoftware/branches/HTM-14.1-update-dev1/source/Lib/TLibEncoder/TEncSampleAdaptiveOffset.cpp @ 1314

Last change on this file since 1314 was 1309, checked in by tech, 9 years ago

1) Further fixes in RD optimization process. Related to:

  • Depth Intra coding.
  • Intra skip.

2) Macros for debugging.

File size: 45.3 KB
RevLine 
[56]1/* The copyright in this software is being made available under the BSD
2 * License, included below. This software may be subject to other third party
3 * and contributor rights, including patent rights, and no such rights are
[1200]4 * granted under this license.
[56]5 *
[1179]6 * Copyright (c) 2010-2015, ITU/ISO/IEC
[56]7 * All rights reserved.
8 *
9 * Redistribution and use in source and binary forms, with or without
10 * modification, are permitted provided that the following conditions are met:
11 *
12 *  * Redistributions of source code must retain the above copyright notice,
13 *    this list of conditions and the following disclaimer.
14 *  * Redistributions in binary form must reproduce the above copyright notice,
15 *    this list of conditions and the following disclaimer in the documentation
16 *    and/or other materials provided with the distribution.
17 *  * Neither the name of the ITU/ISO/IEC nor the names of its contributors may
18 *    be used to endorse or promote products derived from this software without
19 *    specific prior written permission.
20 *
21 * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
22 * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
23 * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
24 * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS
25 * BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
26 * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
27 * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
28 * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
29 * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
30 * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF
31 * THE POSSIBILITY OF SUCH DAMAGE.
32 */
33
[1200]34/**
[608]35 \file     TEncSampleAdaptiveOffset.cpp
[56]36 \brief       estimation part of sample adaptive offset class
37 */
38#include "TEncSampleAdaptiveOffset.h"
39#include <string.h>
40#include <stdlib.h>
41#include <stdio.h>
42#include <math.h>
43
44//! \ingroup TLibEncoder
45//! \{
[608]46
[443]47
[1200]48//! rounding with IBDI
[608]49inline Double xRoundIbdi2(Int bitDepth, Double x)
[443]50{
[608]51  return ((x)>0) ? (Int)(((Int)(x)+(1<<(bitDepth-8-1)))/(1<<(bitDepth-8))) : ((Int)(((Int)(x)-(1<<(bitDepth-8-1)))/(1<<(bitDepth-8))));
[443]52}
53
[608]54inline Double xRoundIbdi(Int bitDepth, Double x)
[443]55{
[608]56  return (bitDepth > 8 ? xRoundIbdi2(bitDepth, (x)) : ((x)>=0 ? ((Int)((x)+0.5)) : ((Int)((x)-0.5)))) ;
[443]57}
58
[608]59
[872]60TEncSampleAdaptiveOffset::TEncSampleAdaptiveOffset()
61{
[1200]62  m_pppcRDSbacCoder = NULL;
[872]63  m_pcRDGoOnSbacCoder = NULL;
[1200]64  m_pppcBinCoderCABAC = NULL;
[872]65  m_statData = NULL;
66  m_preDBFstatData = NULL;
67}
[608]68
[872]69TEncSampleAdaptiveOffset::~TEncSampleAdaptiveOffset()
[443]70{
[872]71  destroyEncData();
72}
[443]73
[872]74Void TEncSampleAdaptiveOffset::createEncData(Bool isPreDBFSamplesUsed)
75{
[443]76
[872]77  //cabac coder for RDO
78  m_pppcRDSbacCoder = new TEncSbac* [NUM_SAO_CABACSTATE_LABELS];
[1200]79#if FAST_BIT_EST
[872]80  m_pppcBinCoderCABAC = new TEncBinCABACCounter* [NUM_SAO_CABACSTATE_LABELS];
[1200]81#else
82  m_pppcBinCoderCABAC = new TEncBinCABAC* [NUM_SAO_CABACSTATE_LABELS];
83#endif
[443]84
[872]85  for(Int cs=0; cs < NUM_SAO_CABACSTATE_LABELS; cs++)
86  {
87    m_pppcRDSbacCoder[cs] = new TEncSbac;
[1200]88#if FAST_BIT_EST
[872]89    m_pppcBinCoderCABAC[cs] = new TEncBinCABACCounter;
[1200]90#else
91    m_pppcBinCoderCABAC[cs] = new TEncBinCABAC;
92#endif
[872]93    m_pppcRDSbacCoder   [cs]->init( m_pppcBinCoderCABAC [cs] );
94  }
[443]95
96
[872]97  //statistics
98  m_statData = new SAOStatData**[m_numCTUsPic];
99  for(Int i=0; i< m_numCTUsPic; i++)
[608]100  {
[1200]101    m_statData[i] = new SAOStatData*[MAX_NUM_COMPONENT];
102    for(Int compIdx=0; compIdx < MAX_NUM_COMPONENT; compIdx++)
[443]103    {
[872]104      m_statData[i][compIdx] = new SAOStatData[NUM_SAO_NEW_TYPES];
[608]105    }
[872]106  }
107  if(isPreDBFSamplesUsed)
108  {
109    m_preDBFstatData = new SAOStatData**[m_numCTUsPic];
110    for(Int i=0; i< m_numCTUsPic; i++)
[608]111    {
[1200]112      m_preDBFstatData[i] = new SAOStatData*[MAX_NUM_COMPONENT];
113      for(Int compIdx=0; compIdx < MAX_NUM_COMPONENT; compIdx++)
[872]114      {
115        m_preDBFstatData[i][compIdx] = new SAOStatData[NUM_SAO_NEW_TYPES];
116      }
[608]117    }
118
[872]119  }
[608]120
[872]121  ::memset(m_saoDisabledRate, 0, sizeof(m_saoDisabledRate));
[443]122
[872]123  for(Int typeIdc=0; typeIdc < NUM_SAO_NEW_TYPES; typeIdc++)
124  {
[1200]125    m_skipLinesR[COMPONENT_Y ][typeIdc]= 5;
126    m_skipLinesR[COMPONENT_Cb][typeIdc]= m_skipLinesR[COMPONENT_Cr][typeIdc]= 3;
[443]127
[1200]128    m_skipLinesB[COMPONENT_Y ][typeIdc]= 4;
129    m_skipLinesB[COMPONENT_Cb][typeIdc]= m_skipLinesB[COMPONENT_Cr][typeIdc]= 2;
[443]130
[872]131    if(isPreDBFSamplesUsed)
[608]132    {
[872]133      switch(typeIdc)
[608]134      {
[872]135      case SAO_TYPE_EO_0:
136        {
[1200]137          m_skipLinesR[COMPONENT_Y ][typeIdc]= 5;
138          m_skipLinesR[COMPONENT_Cb][typeIdc]= m_skipLinesR[COMPONENT_Cr][typeIdc]= 3;
[608]139
[1200]140          m_skipLinesB[COMPONENT_Y ][typeIdc]= 3;
141          m_skipLinesB[COMPONENT_Cb][typeIdc]= m_skipLinesB[COMPONENT_Cr][typeIdc]= 1;
[872]142        }
143        break;
144      case SAO_TYPE_EO_90:
[443]145        {
[1200]146          m_skipLinesR[COMPONENT_Y ][typeIdc]= 4;
147          m_skipLinesR[COMPONENT_Cb][typeIdc]= m_skipLinesR[COMPONENT_Cr][typeIdc]= 2;
[443]148
[1200]149          m_skipLinesB[COMPONENT_Y ][typeIdc]= 4;
150          m_skipLinesB[COMPONENT_Cb][typeIdc]= m_skipLinesB[COMPONENT_Cr][typeIdc]= 2;
[608]151        }
[872]152        break;
153      case SAO_TYPE_EO_135:
154      case SAO_TYPE_EO_45:
155        {
[1200]156          m_skipLinesR[COMPONENT_Y ][typeIdc]= 5;
157          m_skipLinesR[COMPONENT_Cb][typeIdc]= m_skipLinesR[COMPONENT_Cr][typeIdc]= 3;
[443]158
[1200]159          m_skipLinesB[COMPONENT_Y ][typeIdc]= 4;
160          m_skipLinesB[COMPONENT_Cb][typeIdc]= m_skipLinesB[COMPONENT_Cr][typeIdc]= 2;
[608]161        }
[872]162        break;
163      case SAO_TYPE_BO:
[608]164        {
[1200]165          m_skipLinesR[COMPONENT_Y ][typeIdc]= 4;
166          m_skipLinesR[COMPONENT_Cb][typeIdc]= m_skipLinesR[COMPONENT_Cr][typeIdc]= 2;
[608]167
[1200]168          m_skipLinesB[COMPONENT_Y ][typeIdc]= 3;
169          m_skipLinesB[COMPONENT_Cb][typeIdc]= m_skipLinesB[COMPONENT_Cr][typeIdc]= 1;
[608]170        }
[872]171        break;
172      default:
[443]173        {
[872]174          printf("Not a supported type");
175          assert(0);
176          exit(-1);
[443]177        }
[608]178      }
[443]179    }
[608]180  }
[443]181
182}
183
[872]184Void TEncSampleAdaptiveOffset::destroyEncData()
[443]185{
[872]186  if(m_pppcRDSbacCoder != NULL)
[608]187  {
[872]188    for (Int cs = 0; cs < NUM_SAO_CABACSTATE_LABELS; cs ++ )
[443]189    {
[872]190      delete m_pppcRDSbacCoder[cs];
[443]191    }
[872]192    delete[] m_pppcRDSbacCoder; m_pppcRDSbacCoder = NULL;
[608]193  }
[443]194
[872]195  if(m_pppcBinCoderCABAC != NULL)
[608]196  {
[872]197    for (Int cs = 0; cs < NUM_SAO_CABACSTATE_LABELS; cs ++ )
[443]198    {
[872]199      delete m_pppcBinCoderCABAC[cs];
[443]200    }
[872]201    delete[] m_pppcBinCoderCABAC; m_pppcBinCoderCABAC = NULL;
[608]202  }
[443]203
[872]204  if(m_statData != NULL)
[443]205  {
[872]206    for(Int i=0; i< m_numCTUsPic; i++)
[443]207    {
[1200]208      for(Int compIdx=0; compIdx< MAX_NUM_COMPONENT; compIdx++)
[443]209      {
[872]210        delete[] m_statData[i][compIdx];
[443]211      }
[872]212      delete[] m_statData[i];
[443]213    }
[872]214    delete[] m_statData; m_statData = NULL;
[443]215  }
[872]216  if(m_preDBFstatData != NULL)
[443]217  {
[872]218    for(Int i=0; i< m_numCTUsPic; i++)
[443]219    {
[1200]220      for(Int compIdx=0; compIdx< MAX_NUM_COMPONENT; compIdx++)
[443]221      {
[872]222        delete[] m_preDBFstatData[i][compIdx];
[443]223      }
[872]224      delete[] m_preDBFstatData[i];
[443]225    }
[872]226    delete[] m_preDBFstatData; m_preDBFstatData = NULL;
[443]227  }
228}
229
[1200]230Void TEncSampleAdaptiveOffset::initRDOCabacCoder(TEncSbac* pcRDGoOnSbacCoder, TComSlice* pcSlice)
[443]231{
[872]232  m_pcRDGoOnSbacCoder = pcRDGoOnSbacCoder;
[1200]233  m_pcRDGoOnSbacCoder->resetEntropy(pcSlice);
[872]234  m_pcRDGoOnSbacCoder->resetBits();
[443]235
[872]236  m_pcRDGoOnSbacCoder->store( m_pppcRDSbacCoder[SAO_CABACSTATE_PIC_INIT]);
237}
[443]238
239
240
[1200]241Void TEncSampleAdaptiveOffset::SAOProcess(TComPic* pPic, Bool* sliceEnabled, const Double *lambdas, const Bool bTestSAODisableAtPictureLevel, const Double saoEncodingRate, const Double saoEncodingRateChroma, Bool isPreDBFSamplesUsed )
[872]242{
243  TComPicYuv* orgYuv= pPic->getPicYuvOrg();
244  TComPicYuv* resYuv= pPic->getPicYuvRec();
[1200]245  memcpy(m_lambda, lambdas, sizeof(m_lambda));
[872]246  TComPicYuv* srcYuv = m_tempPicYuv;
247  resYuv->copyToPic(srcYuv);
248  srcYuv->setBorderExtension(false);
249  srcYuv->extendPicBorder();
[443]250
[872]251  //collect statistics
252  getStatistics(m_statData, orgYuv, srcYuv, pPic);
253  if(isPreDBFSamplesUsed)
[443]254  {
[872]255    addPreDBFStatistics(m_statData);
[443]256  }
[1200]257  //slice on/off
258  decidePicParams(sliceEnabled, pPic->getSlice(0)->getDepth(), saoEncodingRate, saoEncodingRateChroma);
[443]259
[1200]260  //block on/off
[872]261  SAOBlkParam* reconParams = new SAOBlkParam[m_numCTUsPic]; //temporary parameter buffer for storing reconstructed SAO parameters
[1200]262  decideBlkParams(pPic, sliceEnabled, m_statData, srcYuv, resYuv, reconParams, pPic->getPicSym()->getSAOBlkParam(), bTestSAODisableAtPictureLevel, saoEncodingRate, saoEncodingRateChroma);
[872]263  delete[] reconParams;
[443]264}
265
[872]266Void TEncSampleAdaptiveOffset::getPreDBFStatistics(TComPic* pPic)
[443]267{
[872]268  getStatistics(m_preDBFstatData, pPic->getPicYuvOrg(), pPic->getPicYuvRec(), pPic, true);
[443]269}
270
[872]271Void TEncSampleAdaptiveOffset::addPreDBFStatistics(SAOStatData*** blkStats)
[443]272{
[872]273  for(Int n=0; n< m_numCTUsPic; n++)
[443]274  {
[1200]275    for(Int compIdx=0; compIdx < MAX_NUM_COMPONENT; compIdx++)
[443]276    {
[872]277      for(Int typeIdc=0; typeIdc < NUM_SAO_NEW_TYPES; typeIdc++)
[443]278      {
[872]279        blkStats[n][compIdx][typeIdc] += m_preDBFstatData[n][compIdx][typeIdc];
[443]280      }
281    }
282  }
[872]283}
[443]284
[1200]285Void TEncSampleAdaptiveOffset::getStatistics(SAOStatData*** blkStats, TComPicYuv* orgYuv, TComPicYuv* srcYuv, TComPic* pPic, Bool isCalculatePreDeblockSamples)
[872]286{
287  Bool isLeftAvail,isRightAvail,isAboveAvail,isBelowAvail,isAboveLeftAvail,isAboveRightAvail,isBelowLeftAvail,isBelowRightAvail;
[443]288
[1200]289  const Int numberOfComponents = getNumberValidComponents(m_chromaFormatIDC);
290
291  for(Int ctuRsAddr= 0; ctuRsAddr < m_numCTUsPic; ctuRsAddr++)
[443]292  {
[1200]293    Int yPos   = (ctuRsAddr / m_numCTUInWidth)*m_maxCUHeight;
294    Int xPos   = (ctuRsAddr % m_numCTUInWidth)*m_maxCUWidth;
[872]295    Int height = (yPos + m_maxCUHeight > m_picHeight)?(m_picHeight- yPos):m_maxCUHeight;
296    Int width  = (xPos + m_maxCUWidth  > m_picWidth )?(m_picWidth - xPos):m_maxCUWidth;
[443]297
[1200]298    pPic->getPicSym()->deriveLoopFilterBoundaryAvailibility(ctuRsAddr, isLeftAvail,isRightAvail,isAboveAvail,isBelowAvail,isAboveLeftAvail,isAboveRightAvail,isBelowLeftAvail,isBelowRightAvail);
[443]299
[872]300    //NOTE: The number of skipped lines during gathering CTU statistics depends on the slice boundary availabilities.
301    //For simplicity, here only picture boundaries are considered.
[443]302
[872]303    isRightAvail      = (xPos + m_maxCUWidth  < m_picWidth );
304    isBelowAvail      = (yPos + m_maxCUHeight < m_picHeight);
305    isBelowRightAvail = (isRightAvail && isBelowAvail);
306    isBelowLeftAvail  = ((xPos > 0) && (isBelowAvail));
307    isAboveRightAvail = ((yPos > 0) && (isRightAvail));
[443]308
[1200]309    for(Int compIdx = 0; compIdx < numberOfComponents; compIdx++)
[443]310    {
[1200]311      const ComponentID component = ComponentID(compIdx);
[443]312
[1200]313      const UInt componentScaleX = getComponentScaleX(component, pPic->getChromaFormat());
314      const UInt componentScaleY = getComponentScaleY(component, pPic->getChromaFormat());
[443]315
[1200]316      Int  srcStride  = srcYuv->getStride(component);
317      Pel* srcBlk     = srcYuv->getAddr(component) + ((yPos >> componentScaleY) * srcStride) + (xPos >> componentScaleX);
[443]318
[1200]319      Int  orgStride  = orgYuv->getStride(component);
320      Pel* orgBlk     = orgYuv->getAddr(component) + ((yPos >> componentScaleY) * orgStride) + (xPos >> componentScaleX);
321
322      getBlkStats(component, pPic->getPicSym()->getSPS().getBitDepth(toChannelType(component)), blkStats[ctuRsAddr][component]
323                , srcBlk, orgBlk, srcStride, orgStride, (width  >> componentScaleX), (height >> componentScaleY)
324                , isLeftAvail,  isRightAvail, isAboveAvail, isBelowAvail, isAboveLeftAvail, isAboveRightAvail
[872]325                , isCalculatePreDeblockSamples
326                );
[443]327
328    }
329  }
[872]330}
[443]331
[1200]332Void TEncSampleAdaptiveOffset::decidePicParams(Bool* sliceEnabled, Int picTempLayer, const Double saoEncodingRate, const Double saoEncodingRateChroma)
[872]333{
334  //decide sliceEnabled[compIdx]
[1200]335  const Int numberOfComponents = getNumberValidComponents(m_chromaFormatIDC);
336  for (Int compIdx = 0; compIdx < MAX_NUM_COMPONENT; compIdx++)
[443]337  {
[1200]338    sliceEnabled[compIdx] = false;
339  }
340
341  for (Int compIdx = 0; compIdx < numberOfComponents; compIdx++)
342  {
[872]343    // reset flags & counters
344    sliceEnabled[compIdx] = true;
[443]345
[1200]346    if (saoEncodingRate>0.0)
347    {
348      if (saoEncodingRateChroma>0.0)
349      {
[872]350    // decide slice-level on/off based on previous results
[1200]351    if( (picTempLayer > 0)
352          && (m_saoDisabledRate[compIdx][picTempLayer-1] > ((compIdx==COMPONENT_Y) ? saoEncodingRate : saoEncodingRateChroma)) )
[443]353    {
[872]354      sliceEnabled[compIdx] = false;
[443]355    }
[1200]356      }
357      else
358      {
[872]359    // decide slice-level on/off based on previous results
[1200]360    if( (picTempLayer > 0)
361          && (m_saoDisabledRate[COMPONENT_Y][0] > saoEncodingRate) )
[443]362    {
[872]363      sliceEnabled[compIdx] = false;
[443]364    }
[1200]365      }
366    }
[443]367  }
[872]368}
[443]369
[1200]370Int64 TEncSampleAdaptiveOffset::getDistortion(const Int channelBitDepth, Int typeIdc, Int typeAuxInfo, Int* invQuantOffset, SAOStatData& statData)
[872]371{
[1200]372  Int64 dist        = 0;
373  Int shift         = 2 * DISTORTION_PRECISION_ADJUSTMENT(channelBitDepth - 8);
[443]374
[872]375  switch(typeIdc)
[443]376  {
[872]377    case SAO_TYPE_EO_0:
378    case SAO_TYPE_EO_90:
379    case SAO_TYPE_EO_135:
380    case SAO_TYPE_EO_45:
381      {
382        for (Int offsetIdx=0; offsetIdx<NUM_SAO_EO_CLASSES; offsetIdx++)
383        {
384          dist += estSaoDist( statData.count[offsetIdx], invQuantOffset[offsetIdx], statData.diff[offsetIdx], shift);
[1200]385        }
[872]386      }
387      break;
388    case SAO_TYPE_BO:
389      {
390        for (Int offsetIdx=typeAuxInfo; offsetIdx<typeAuxInfo+4; offsetIdx++)
391        {
[1200]392          Int bandIdx = offsetIdx % NUM_SAO_BO_CLASSES ;
[872]393          dist += estSaoDist( statData.count[bandIdx], invQuantOffset[bandIdx], statData.diff[bandIdx], shift);
394        }
395      }
396      break;
397    default:
398      {
399        printf("Not a supported type");
400        assert(0);
401        exit(-1);
402      }
[443]403  }
[872]404
405  return dist;
[443]406}
407
[872]408inline Int64 TEncSampleAdaptiveOffset::estSaoDist(Int64 count, Int64 offset, Int64 diffSum, Int shift)
[443]409{
[872]410  return (( count*offset*offset-diffSum*offset*2 ) >> shift);
411}
[443]412
413
[1200]414inline Int TEncSampleAdaptiveOffset::estIterOffset(Int typeIdx, Double lambda, Int offsetInput, Int64 count, Int64 diffSum, Int shift, Int bitIncrease, Int64& bestDist, Double& bestCost, Int offsetTh )
[872]415{
416  Int iterOffset, tempOffset;
417  Int64 tempDist, tempRate;
418  Double tempCost, tempMinCost;
419  Int offsetOutput = 0;
420  iterOffset = offsetInput;
[1200]421  // Assuming sending quantized value 0 results in zero offset and sending the value zero needs 1 bit. entropy coder can be used to measure the exact rate here.
422  tempMinCost = lambda;
[872]423  while (iterOffset != 0)
424  {
425    // Calculate the bits required for signaling the offset
[1200]426    tempRate = (typeIdx == SAO_TYPE_BO) ? (abs((Int)iterOffset)+2) : (abs((Int)iterOffset)+1);
427    if (abs((Int)iterOffset)==offsetTh) //inclusive
428    {
[872]429      tempRate --;
430    }
431    // Do the dequantization before distortion calculation
432    tempOffset  = iterOffset << bitIncrease;
433    tempDist    = estSaoDist( count, tempOffset, diffSum, shift);
434    tempCost    = ((Double)tempDist + lambda * (Double) tempRate);
435    if(tempCost < tempMinCost)
[443]436    {
[872]437      tempMinCost = tempCost;
438      offsetOutput = iterOffset;
439      bestDist = tempDist;
440      bestCost = tempCost;
[443]441    }
[872]442    iterOffset = (iterOffset > 0) ? (iterOffset-1):(iterOffset+1);
[443]443  }
[872]444  return offsetOutput;
[443]445}
446
[1200]447Void TEncSampleAdaptiveOffset::deriveOffsets(ComponentID compIdx, const Int channelBitDepth, Int typeIdc, SAOStatData& statData, Int* quantOffsets, Int& typeAuxInfo)
[443]448{
[1200]449  Int bitDepth = channelBitDepth;
450  Int shift    = 2 * DISTORTION_PRECISION_ADJUSTMENT(bitDepth-8);
451  Int offsetTh = TComSampleAdaptiveOffset::getMaxOffsetQVal(channelBitDepth);  //inclusive
[443]452
[872]453  ::memset(quantOffsets, 0, sizeof(Int)*MAX_NUM_SAO_CLASSES);
[443]454
[1200]455  //derive initial offsets
[872]456  Int numClasses = (typeIdc == SAO_TYPE_BO)?((Int)NUM_SAO_BO_CLASSES):((Int)NUM_SAO_EO_CLASSES);
457  for(Int classIdx=0; classIdx< numClasses; classIdx++)
[443]458  {
[1200]459    if( (typeIdc != SAO_TYPE_BO) && (classIdx==SAO_CLASS_EO_PLAIN)  )
[443]460    {
[872]461      continue; //offset will be zero
[443]462    }
463
[872]464    if(statData.count[classIdx] == 0)
[443]465    {
[872]466      continue; //offset will be zero
[443]467    }
468
[1200]469    quantOffsets[classIdx] = (Int) xRoundIbdi(bitDepth, (Double)( statData.diff[classIdx]<<(bitDepth-8))
470                                                                  /
[872]471                                                          (Double)( statData.count[classIdx]<< m_offsetStepLog2[compIdx])
472                                               );
473    quantOffsets[classIdx] = Clip3(-offsetTh, offsetTh, quantOffsets[classIdx]);
[443]474  }
475
[872]476  // adjust offsets
477  switch(typeIdc)
[443]478  {
[872]479    case SAO_TYPE_EO_0:
480    case SAO_TYPE_EO_90:
481    case SAO_TYPE_EO_135:
482    case SAO_TYPE_EO_45:
[443]483      {
[872]484        Int64 classDist;
485        Double classCost;
[1200]486        for(Int classIdx=0; classIdx<NUM_SAO_EO_CLASSES; classIdx++)
487        {
488          if(classIdx==SAO_CLASS_EO_FULL_VALLEY && quantOffsets[classIdx] < 0)
489          {
490            quantOffsets[classIdx] =0;
491          }
492          if(classIdx==SAO_CLASS_EO_HALF_VALLEY && quantOffsets[classIdx] < 0)
493          {
494            quantOffsets[classIdx] =0;
495          }
496          if(classIdx==SAO_CLASS_EO_HALF_PEAK   && quantOffsets[classIdx] > 0)
497          {
498            quantOffsets[classIdx] =0;
499          }
500          if(classIdx==SAO_CLASS_EO_FULL_PEAK   && quantOffsets[classIdx] > 0)
501          {
502            quantOffsets[classIdx] =0;
503          }
[872]504
505          if( quantOffsets[classIdx] != 0 ) //iterative adjustment only when derived offset is not zero
506          {
[1200]507            quantOffsets[classIdx] = estIterOffset( typeIdc, m_lambda[compIdx], quantOffsets[classIdx], statData.count[classIdx], statData.diff[classIdx], shift, m_offsetStepLog2[compIdx], classDist , classCost , offsetTh );
[872]508          }
509        }
[1200]510
[872]511        typeAuxInfo =0;
[443]512      }
[872]513      break;
514    case SAO_TYPE_BO:
515      {
516        Int64  distBOClasses[NUM_SAO_BO_CLASSES];
517        Double costBOClasses[NUM_SAO_BO_CLASSES];
518        ::memset(distBOClasses, 0, sizeof(Int64)*NUM_SAO_BO_CLASSES);
519        for(Int classIdx=0; classIdx< NUM_SAO_BO_CLASSES; classIdx++)
[1200]520        {
[872]521          costBOClasses[classIdx]= m_lambda[compIdx];
522          if( quantOffsets[classIdx] != 0 ) //iterative adjustment only when derived offset is not zero
523          {
[1200]524            quantOffsets[classIdx] = estIterOffset( typeIdc, m_lambda[compIdx], quantOffsets[classIdx], statData.count[classIdx], statData.diff[classIdx], shift, m_offsetStepLog2[compIdx], distBOClasses[classIdx], costBOClasses[classIdx], offsetTh );
[872]525          }
526        }
[443]527
[872]528        //decide the starting band index
529        Double minCost = MAX_DOUBLE, cost;
[1200]530        for(Int band=0; band< NUM_SAO_BO_CLASSES- 4+ 1; band++)
[443]531        {
[872]532          cost  = costBOClasses[band  ];
533          cost += costBOClasses[band+1];
534          cost += costBOClasses[band+2];
535          cost += costBOClasses[band+3];
[443]536
[872]537          if(cost < minCost)
538          {
539            minCost = cost;
540            typeAuxInfo = band;
541          }
[443]542        }
[872]543        //clear those unused classes
544        Int clearQuantOffset[NUM_SAO_BO_CLASSES];
545        ::memset(clearQuantOffset, 0, sizeof(Int)*NUM_SAO_BO_CLASSES);
[1200]546        for(Int i=0; i< 4; i++)
[872]547        {
548          Int band = (typeAuxInfo+i)%NUM_SAO_BO_CLASSES;
549          clearQuantOffset[band] = quantOffsets[band];
550        }
[1200]551        ::memcpy(quantOffsets, clearQuantOffset, sizeof(Int)*NUM_SAO_BO_CLASSES);
[443]552      }
[872]553      break;
554    default:
[443]555      {
[872]556        printf("Not a supported type");
557        assert(0);
558        exit(-1);
[443]559      }
560
[872]561  }
[443]562
563
[872]564}
[443]565
[1200]566Void TEncSampleAdaptiveOffset::deriveModeNewRDO(const BitDepths &bitDepths, Int ctuRsAddr, SAOBlkParam* mergeList[NUM_SAO_MERGE_TYPES], Bool* sliceEnabled, SAOStatData*** blkStats, SAOBlkParam& modeParam, Double& modeNormCost, TEncSbac** cabacCoderRDO, Int inCabacLabel)
[872]567{
568  Double minCost, cost;
569  UInt previousWrittenBits;
[1200]570  const Int numberOfComponents = getNumberValidComponents(m_chromaFormatIDC);
571
572  Int64 dist[MAX_NUM_COMPONENT], modeDist[MAX_NUM_COMPONENT];
573  SAOOffset testOffset[MAX_NUM_COMPONENT];
[872]574  Int invQuantOffset[MAX_NUM_SAO_CLASSES];
[1200]575  for(Int comp=0; comp < MAX_NUM_COMPONENT; comp++)
576  {
577    modeDist[comp] = 0;
578  }
[443]579
[872]580  //pre-encode merge flags
[1200]581  modeParam[COMPONENT_Y].modeIdc = SAO_MODE_OFF;
[872]582  m_pcRDGoOnSbacCoder->load(cabacCoderRDO[inCabacLabel]);
[1200]583  m_pcRDGoOnSbacCoder->codeSAOBlkParam(modeParam, bitDepths, sliceEnabled, (mergeList[SAO_MERGE_LEFT]!= NULL), (mergeList[SAO_MERGE_ABOVE]!= NULL), true);
[872]584  m_pcRDGoOnSbacCoder->store(cabacCoderRDO[SAO_CABACSTATE_BLK_MID]);
[443]585
[1200]586    //------ luma --------//
[872]587  {
[1200]588    const ComponentID compIdx = COMPONENT_Y;
589    //"off" case as initial cost
590    modeParam[compIdx].modeIdc = SAO_MODE_OFF;
591    m_pcRDGoOnSbacCoder->resetBits();
592    m_pcRDGoOnSbacCoder->codeSAOOffsetParam(compIdx, modeParam[compIdx], sliceEnabled[compIdx], bitDepths.recon[CHANNEL_TYPE_LUMA]);
593    modeDist[compIdx] = 0;
594    minCost= m_lambda[compIdx]*((Double)m_pcRDGoOnSbacCoder->getNumberOfWrittenBits());
595    m_pcRDGoOnSbacCoder->store(cabacCoderRDO[SAO_CABACSTATE_BLK_TEMP]);
596    if(sliceEnabled[compIdx])
[443]597    {
[1200]598      for(Int typeIdc=0; typeIdc< NUM_SAO_NEW_TYPES; typeIdc++)
599      {
600        testOffset[compIdx].modeIdc = SAO_MODE_NEW;
601        testOffset[compIdx].typeIdc = typeIdc;
[443]602
[1200]603        //derive coded offset
604        deriveOffsets(compIdx, bitDepths.recon[CHANNEL_TYPE_LUMA], typeIdc, blkStats[ctuRsAddr][compIdx][typeIdc], testOffset[compIdx].offset, testOffset[compIdx].typeAuxInfo);
[443]605
[1200]606        //inversed quantized offsets
607        invertQuantOffsets(compIdx, typeIdc, testOffset[compIdx].typeAuxInfo, invQuantOffset, testOffset[compIdx].offset);
[443]608
[1200]609        //get distortion
610        dist[compIdx] = getDistortion(bitDepths.recon[CHANNEL_TYPE_LUMA], testOffset[compIdx].typeIdc, testOffset[compIdx].typeAuxInfo, invQuantOffset, blkStats[ctuRsAddr][compIdx][typeIdc]);
[443]611
[1200]612        //get rate
613        m_pcRDGoOnSbacCoder->load(cabacCoderRDO[SAO_CABACSTATE_BLK_MID]);
614        m_pcRDGoOnSbacCoder->resetBits();
615        m_pcRDGoOnSbacCoder->codeSAOOffsetParam(compIdx, testOffset[compIdx], sliceEnabled[compIdx], bitDepths.recon[CHANNEL_TYPE_LUMA]);
616        Int rate = m_pcRDGoOnSbacCoder->getNumberOfWrittenBits();
617        cost = (Double)dist[compIdx] + m_lambda[compIdx]*((Double)rate);
618        if(cost < minCost)
619        {
620          minCost = cost;
621          modeDist[compIdx] = dist[compIdx];
622          modeParam[compIdx]= testOffset[compIdx];
623          m_pcRDGoOnSbacCoder->store(cabacCoderRDO[SAO_CABACSTATE_BLK_TEMP]);
624        }
[443]625      }
[872]626    }
[1200]627    m_pcRDGoOnSbacCoder->load(cabacCoderRDO[SAO_CABACSTATE_BLK_TEMP]);
628    m_pcRDGoOnSbacCoder->store(cabacCoderRDO[SAO_CABACSTATE_BLK_MID]);
[443]629  }
630
[872]631  //------ chroma --------//
[1200]632//"off" case as initial cost
[872]633  cost = 0;
634  previousWrittenBits = 0;
635  m_pcRDGoOnSbacCoder->resetBits();
[1200]636  for(UInt componentIndex = COMPONENT_Cb; componentIndex < numberOfComponents; componentIndex++)
[872]637  {
[1200]638    const ComponentID component = ComponentID(componentIndex);
[443]639
[1200]640    modeParam[component].modeIdc = SAO_MODE_OFF;
641    modeDist [component]         = 0;
642    m_pcRDGoOnSbacCoder->codeSAOOffsetParam(component, modeParam[component], sliceEnabled[component], bitDepths.recon[CHANNEL_TYPE_CHROMA]);
643   
[872]644    const UInt currentWrittenBits = m_pcRDGoOnSbacCoder->getNumberOfWrittenBits();
645    cost += m_lambda[component] * (currentWrittenBits - previousWrittenBits);
646    previousWrittenBits = currentWrittenBits;
647  }
[443]648
[872]649  minCost = cost;
[443]650
[872]651  //doesn't need to store cabac status here since the whole CTU parameters will be re-encoded at the end of this function
[443]652
[872]653  for(Int typeIdc=0; typeIdc< NUM_SAO_NEW_TYPES; typeIdc++)
654  {
655    m_pcRDGoOnSbacCoder->load(cabacCoderRDO[SAO_CABACSTATE_BLK_MID]);
656    m_pcRDGoOnSbacCoder->resetBits();
657    previousWrittenBits = 0;
658    cost = 0;
[443]659
[1200]660    for(UInt componentIndex = COMPONENT_Cb; componentIndex < numberOfComponents; componentIndex++)
[443]661    {
[1200]662      const ComponentID component = ComponentID(componentIndex);
663      if(!sliceEnabled[component])
[443]664      {
[1200]665        testOffset[component].modeIdc = SAO_MODE_OFF;
666        dist[component]= 0;
[872]667        continue;
668      }
[1200]669      testOffset[component].modeIdc = SAO_MODE_NEW;
670      testOffset[component].typeIdc = typeIdc;
[443]671
[872]672      //derive offset & get distortion
[1200]673      deriveOffsets(component, bitDepths.recon[CHANNEL_TYPE_CHROMA], typeIdc, blkStats[ctuRsAddr][component][typeIdc], testOffset[component].offset, testOffset[component].typeAuxInfo);
674      invertQuantOffsets(component, typeIdc, testOffset[component].typeAuxInfo, invQuantOffset, testOffset[component].offset);
675      dist[component] = getDistortion(bitDepths.recon[CHANNEL_TYPE_CHROMA], typeIdc, testOffset[component].typeAuxInfo, invQuantOffset, blkStats[ctuRsAddr][component][typeIdc]);
[443]676
[1200]677      m_pcRDGoOnSbacCoder->codeSAOOffsetParam(component, testOffset[component], sliceEnabled[component], bitDepths.recon[CHANNEL_TYPE_CHROMA]);
678
[872]679      const UInt currentWrittenBits = m_pcRDGoOnSbacCoder->getNumberOfWrittenBits();
[1200]680      cost += dist[component] + (m_lambda[component] * (currentWrittenBits - previousWrittenBits));
[872]681      previousWrittenBits = currentWrittenBits;
682    }
[443]683
[872]684    if(cost < minCost)
685    {
686      minCost = cost;
[1200]687      for(UInt componentIndex = COMPONENT_Cb; componentIndex < numberOfComponents; componentIndex++)
[872]688      {
[1200]689        modeDist[componentIndex]  = dist[componentIndex];
690        modeParam[componentIndex] = testOffset[componentIndex];
[872]691      }
692    }
[443]693
[1200]694  } // SAO_TYPE loop
[443]695
[872]696  //----- re-gen rate & normalized cost----//
697  modeNormCost = 0;
[1200]698  for(UInt componentIndex = COMPONENT_Y; componentIndex < numberOfComponents; componentIndex++)
[872]699  {
[1200]700    modeNormCost += (Double)modeDist[componentIndex] / m_lambda[componentIndex];
[872]701  }
[1200]702
[872]703  m_pcRDGoOnSbacCoder->load(cabacCoderRDO[inCabacLabel]);
704  m_pcRDGoOnSbacCoder->resetBits();
[1200]705  m_pcRDGoOnSbacCoder->codeSAOBlkParam(modeParam, bitDepths, sliceEnabled, (mergeList[SAO_MERGE_LEFT]!= NULL), (mergeList[SAO_MERGE_ABOVE]!= NULL), false);
[872]706  modeNormCost += (Double)m_pcRDGoOnSbacCoder->getNumberOfWrittenBits();
707}
[443]708
[1200]709Void TEncSampleAdaptiveOffset::deriveModeMergeRDO(const BitDepths &bitDepths, Int ctuRsAddr, SAOBlkParam* mergeList[NUM_SAO_MERGE_TYPES], Bool* sliceEnabled, SAOStatData*** blkStats, SAOBlkParam& modeParam, Double& modeNormCost, TEncSbac** cabacCoderRDO, Int inCabacLabel)
[872]710{
711  modeNormCost = MAX_DOUBLE;
[443]712
[872]713  Double cost;
714  SAOBlkParam testBlkParam;
[1200]715  const Int numberOfComponents = getNumberValidComponents(m_chromaFormatIDC);
[443]716
[1200]717  for(Int mergeType=0; mergeType< NUM_SAO_MERGE_TYPES; mergeType++)
[872]718  {
719    if(mergeList[mergeType] == NULL)
720    {
721      continue;
722    }
[443]723
[872]724    testBlkParam = *(mergeList[mergeType]);
725    //normalized distortion
726    Double normDist=0;
[1200]727    for(Int compIdx = 0; compIdx < numberOfComponents; compIdx++)
[872]728    {
729      testBlkParam[compIdx].modeIdc = SAO_MODE_MERGE;
730      testBlkParam[compIdx].typeIdc = mergeType;
[443]731
[872]732      SAOOffset& mergedOffsetParam = (*(mergeList[mergeType]))[compIdx];
[443]733
[872]734      if( mergedOffsetParam.modeIdc != SAO_MODE_OFF)
735      {
736        //offsets have been reconstructed. Don't call inversed quantization function.
[1200]737        normDist += (((Double)getDistortion(bitDepths.recon[toChannelType(ComponentID(compIdx))], mergedOffsetParam.typeIdc, mergedOffsetParam.typeAuxInfo, mergedOffsetParam.offset, blkStats[ctuRsAddr][compIdx][mergedOffsetParam.typeIdc]))
[872]738                       /m_lambda[compIdx]
739                    );
740      }
[443]741
[872]742    }
[443]743
[872]744    //rate
745    m_pcRDGoOnSbacCoder->load(cabacCoderRDO[inCabacLabel]);
746    m_pcRDGoOnSbacCoder->resetBits();
[1200]747    m_pcRDGoOnSbacCoder->codeSAOBlkParam(testBlkParam, bitDepths, sliceEnabled, (mergeList[SAO_MERGE_LEFT]!= NULL), (mergeList[SAO_MERGE_ABOVE]!= NULL), false);
[872]748    Int rate = m_pcRDGoOnSbacCoder->getNumberOfWrittenBits();
[443]749
[872]750    cost = normDist+(Double)rate;
[443]751
[872]752    if(cost < modeNormCost)
753    {
754      modeNormCost = cost;
755      modeParam    = testBlkParam;
756      m_pcRDGoOnSbacCoder->store(cabacCoderRDO[SAO_CABACSTATE_BLK_TEMP]);
757    }
758  }
[443]759
[872]760  m_pcRDGoOnSbacCoder->load(cabacCoderRDO[SAO_CABACSTATE_BLK_TEMP]);
761}
[443]762
[1200]763Void TEncSampleAdaptiveOffset::decideBlkParams(TComPic* pic, Bool* sliceEnabled, SAOStatData*** blkStats, TComPicYuv* srcYuv, TComPicYuv* resYuv,
764                                               SAOBlkParam* reconParams, SAOBlkParam* codedParams, const Bool bTestSAODisableAtPictureLevel,
765                                               const Double saoEncodingRate, const Double saoEncodingRateChroma)
[872]766{
[1200]767  Bool allBlksDisabled = true;
768  const Int numberOfComponents = getNumberValidComponents(m_chromaFormatIDC);
769  for(Int compId = COMPONENT_Y; compId < numberOfComponents; compId++)
[872]770  {
[1200]771    if (sliceEnabled[compId])
772    {
773      allBlksDisabled = false;
774    }
[872]775  }
[443]776
[872]777  m_pcRDGoOnSbacCoder->load(m_pppcRDSbacCoder[ SAO_CABACSTATE_PIC_INIT ]);
[443]778
[872]779  SAOBlkParam modeParam;
780  Double minCost, modeCost;
[443]781
[1200]782
783  Double totalCost = 0; // Used if bTestSAODisableAtPictureLevel==true
784
785  for(Int ctuRsAddr=0; ctuRsAddr< m_numCTUsPic; ctuRsAddr++)
[872]786  {
[1200]787    if(allBlksDisabled)
[872]788    {
[1200]789      codedParams[ctuRsAddr].reset();
[872]790      continue;
791    }
[443]792
[872]793    m_pcRDGoOnSbacCoder->store(m_pppcRDSbacCoder[ SAO_CABACSTATE_BLK_CUR ]);
[443]794
[872]795    //get merge list
[1200]796    SAOBlkParam* mergeList[NUM_SAO_MERGE_TYPES] = { NULL };
797    getMergeList(pic, ctuRsAddr, reconParams, mergeList);
[443]798
[872]799    minCost = MAX_DOUBLE;
800    for(Int mode=0; mode < NUM_SAO_MODES; mode++)
801    {
802      switch(mode)
803      {
804      case SAO_MODE_OFF:
[443]805        {
[872]806          continue; //not necessary, since all-off case will be tested in SAO_MODE_NEW case.
[443]807        }
[872]808        break;
809      case SAO_MODE_NEW:
[443]810        {
[1200]811          deriveModeNewRDO(pic->getPicSym()->getSPS().getBitDepths(), ctuRsAddr, mergeList, sliceEnabled, blkStats, modeParam, modeCost, m_pppcRDSbacCoder, SAO_CABACSTATE_BLK_CUR);
[443]812
813        }
[872]814        break;
815      case SAO_MODE_MERGE:
[443]816        {
[1200]817          deriveModeMergeRDO(pic->getPicSym()->getSPS().getBitDepths(), ctuRsAddr, mergeList, sliceEnabled, blkStats , modeParam, modeCost, m_pppcRDSbacCoder, SAO_CABACSTATE_BLK_CUR);
[443]818        }
[872]819        break;
820      default:
[443]821        {
[872]822          printf("Not a supported SAO mode\n");
823          assert(0);
824          exit(-1);
[443]825        }
[872]826      }
[443]827
[1309]828      D_PRINT_INDENT( g_traceSAOCost, "SAO mode " + n2s( mode ) + " Cost:  " + n2s( modeCost) );
829
[872]830      if(modeCost < minCost)
831      {
832        minCost = modeCost;
[1200]833        codedParams[ctuRsAddr] = modeParam;
[872]834        m_pcRDGoOnSbacCoder->store(m_pppcRDSbacCoder[ SAO_CABACSTATE_BLK_NEXT ]);
[443]835      }
[872]836    } //mode
[1200]837
838    totalCost += minCost;
839
[872]840    m_pcRDGoOnSbacCoder->load(m_pppcRDSbacCoder[ SAO_CABACSTATE_BLK_NEXT ]);
[443]841
[872]842    //apply reconstructed offsets
[1200]843    reconParams[ctuRsAddr] = codedParams[ctuRsAddr];
844    reconstructBlkSAOParam(reconParams[ctuRsAddr], mergeList);
845    offsetCTU(ctuRsAddr, srcYuv, resYuv, reconParams[ctuRsAddr], pic);
846  } //ctuRsAddr
[443]847
[1200]848  if (!allBlksDisabled && (totalCost >= 0) && bTestSAODisableAtPictureLevel) //SAO has not beneficial in this case - disable it
849  {
850    for(Int ctuRsAddr = 0; ctuRsAddr < m_numCTUsPic; ctuRsAddr++)
851    {
852      codedParams[ctuRsAddr].reset();
853    }
854
855    for (UInt componentIndex = 0; componentIndex < MAX_NUM_COMPONENT; componentIndex++)
856    {
857      sliceEnabled[componentIndex] = false;
858    }
859
860    m_pcRDGoOnSbacCoder->load(m_pppcRDSbacCoder[ SAO_CABACSTATE_PIC_INIT ]);
861  }
862
863  if (saoEncodingRate > 0.0)
864  {
[872]865  Int picTempLayer = pic->getSlice(0)->getDepth();
[1200]866  Int numCtusForSAOOff[MAX_NUM_COMPONENT];
[443]867
[1200]868  for (Int compIdx = 0; compIdx < numberOfComponents; compIdx++)
[443]869  {
[1200]870    numCtusForSAOOff[compIdx] = 0;
871    for(Int ctuRsAddr=0; ctuRsAddr< m_numCTUsPic; ctuRsAddr++)
[443]872    {
[1200]873      if( reconParams[ctuRsAddr][compIdx].modeIdc == SAO_MODE_OFF)
[443]874      {
[1200]875        numCtusForSAOOff[compIdx]++;
[443]876      }
877    }
878  }
[1200]879    if (saoEncodingRateChroma > 0.0)
880    {
881  for (Int compIdx = 0; compIdx < numberOfComponents; compIdx++)
[443]882  {
[1200]883    m_saoDisabledRate[compIdx][picTempLayer] = (Double)numCtusForSAOOff[compIdx]/(Double)m_numCTUsPic;
[443]884  }
[1200]885    }
886    else if (picTempLayer == 0)
[443]887  {
[1200]888    m_saoDisabledRate[COMPONENT_Y][0] = (Double)(numCtusForSAOOff[COMPONENT_Y]+numCtusForSAOOff[COMPONENT_Cb]+numCtusForSAOOff[COMPONENT_Cr])/(Double)(m_numCTUsPic*3);
[443]889  }
[1200]890  }
[443]891}
892
[872]893
[1200]894Void TEncSampleAdaptiveOffset::getBlkStats(const ComponentID compIdx, const Int channelBitDepth, SAOStatData* statsDataTypes
[872]895                        , Pel* srcBlk, Pel* orgBlk, Int srcStride, Int orgStride, Int width, Int height
[1200]896                        , Bool isLeftAvail,  Bool isRightAvail, Bool isAboveAvail, Bool isBelowAvail, Bool isAboveLeftAvail, Bool isAboveRightAvail
[872]897                        , Bool isCalculatePreDeblockSamples
898                        )
[443]899{
[872]900  if(m_lineBufWidth != m_maxCUWidth)
[56]901  {
[872]902    m_lineBufWidth = m_maxCUWidth;
903
[1200]904    if (m_signLineBuf1)
905    {
906      delete[] m_signLineBuf1;
907      m_signLineBuf1 = NULL;
908    }
909    m_signLineBuf1 = new Char[m_lineBufWidth+1];
[872]910
[1200]911    if (m_signLineBuf2)
912    {
913      delete[] m_signLineBuf2;
914      m_signLineBuf2 = NULL;
915    }
[872]916    m_signLineBuf2 = new Char[m_lineBufWidth+1];
[56]917  }
918
[872]919  Int x,y, startX, startY, endX, endY, edgeType, firstLineStartX, firstLineEndX;
920  Char signLeft, signRight, signDown;
921  Int64 *diff, *count;
922  Pel *srcLine, *orgLine;
923  Int* skipLinesR = m_skipLinesR[compIdx];
924  Int* skipLinesB = m_skipLinesB[compIdx];
925
926  for(Int typeIdx=0; typeIdx< NUM_SAO_NEW_TYPES; typeIdx++)
[608]927  {
[872]928    SAOStatData& statsData= statsDataTypes[typeIdx];
929    statsData.reset();
930
931    srcLine = srcBlk;
932    orgLine = orgBlk;
933    diff    = statsData.diff;
934    count   = statsData.count;
935    switch(typeIdx)
936    {
937    case SAO_TYPE_EO_0:
938      {
939        diff +=2;
940        count+=2;
941        endY   = (isBelowAvail) ? (height - skipLinesB[typeIdx]) : height;
942        startX = (!isCalculatePreDeblockSamples) ? (isLeftAvail  ? 0 : 1)
943                                                 : (isRightAvail ? (width - skipLinesR[typeIdx]) : (width - 1))
944                                                 ;
945        endX   = (!isCalculatePreDeblockSamples) ? (isRightAvail ? (width - skipLinesR[typeIdx]) : (width - 1))
946                                                 : (isRightAvail ? width : (width - 1))
947                                                 ;
948        for (y=0; y<endY; y++)
[56]949        {
[964]950          signLeft = (Char)sgn(srcLine[startX] - srcLine[startX-1]);
[872]951          for (x=startX; x<endX; x++)
952          {
[964]953            signRight =  (Char)sgn(srcLine[x] - srcLine[x+1]);
[872]954            edgeType  =  signRight + signLeft;
955            signLeft  = -signRight;
956
957            diff [edgeType] += (orgLine[x] - srcLine[x]);
958            count[edgeType] ++;
959          }
960          srcLine  += srcStride;
961          orgLine  += orgStride;
[56]962        }
[872]963        if(isCalculatePreDeblockSamples)
[56]964        {
[872]965          if(isBelowAvail)
[56]966          {
[872]967            startX = isLeftAvail  ? 0 : 1;
968            endX   = isRightAvail ? width : (width -1);
969
970            for(y=0; y<skipLinesB[typeIdx]; y++)
971            {
[964]972              signLeft = (Char)sgn(srcLine[startX] - srcLine[startX-1]);
[872]973              for (x=startX; x<endX; x++)
974              {
[964]975                signRight =  (Char)sgn(srcLine[x] - srcLine[x+1]);
[872]976                edgeType  =  signRight + signLeft;
977                signLeft  = -signRight;
978
979                diff [edgeType] += (orgLine[x] - srcLine[x]);
980                count[edgeType] ++;
981              }
982              srcLine  += srcStride;
983              orgLine  += orgStride;
984            }
[56]985          }
986        }
987      }
[872]988      break;
989    case SAO_TYPE_EO_90:
[56]990      {
[872]991        diff +=2;
992        count+=2;
993        Char *signUpLine = m_signLineBuf1;
994
995        startX = (!isCalculatePreDeblockSamples) ? 0
996                                                 : (isRightAvail ? (width - skipLinesR[typeIdx]) : width)
997                                                 ;
998        startY = isAboveAvail ? 0 : 1;
[1200]999        endX   = (!isCalculatePreDeblockSamples) ? (isRightAvail ? (width - skipLinesR[typeIdx]) : width)
[872]1000                                                 : width
1001                                                 ;
1002        endY   = isBelowAvail ? (height - skipLinesB[typeIdx]) : (height - 1);
1003        if (!isAboveAvail)
[56]1004        {
[872]1005          srcLine += srcStride;
1006          orgLine += orgStride;
[56]1007        }
[872]1008
1009        Pel* srcLineAbove = srcLine - srcStride;
[1200]1010        for (x=startX; x<endX; x++)
[56]1011        {
[964]1012          signUpLine[x] = (Char)sgn(srcLine[x] - srcLineAbove[x]);
[56]1013        }
1014
[872]1015        Pel* srcLineBelow;
1016        for (y=startY; y<endY; y++)
1017        {
1018          srcLineBelow = srcLine + srcStride;
[56]1019
[872]1020          for (x=startX; x<endX; x++)
1021          {
[964]1022            signDown  = (Char)sgn(srcLine[x] - srcLineBelow[x]); 
[872]1023            edgeType  = signDown + signUpLine[x];
1024            signUpLine[x]= -signDown;
[56]1025
[872]1026            diff [edgeType] += (orgLine[x] - srcLine[x]);
1027            count[edgeType] ++;
1028          }
1029          srcLine += srcStride;
1030          orgLine += orgStride;
[56]1031        }
[872]1032        if(isCalculatePreDeblockSamples)
[56]1033        {
[872]1034          if(isBelowAvail)
1035          {
1036            startX = 0;
1037            endX   = width;
1038
1039            for(y=0; y<skipLinesB[typeIdx]; y++)
1040            {
1041              srcLineBelow = srcLine + srcStride;
1042              srcLineAbove = srcLine - srcStride;
1043
1044              for (x=startX; x<endX; x++)
1045              {
[964]1046                edgeType = sgn(srcLine[x] - srcLineBelow[x]) + sgn(srcLine[x] - srcLineAbove[x]);
[872]1047                diff [edgeType] += (orgLine[x] - srcLine[x]);
1048                count[edgeType] ++;
1049              }
1050              srcLine  += srcStride;
1051              orgLine  += orgStride;
1052            }
1053          }
[56]1054        }
1055
[872]1056      }
1057      break;
1058    case SAO_TYPE_EO_135:
1059      {
1060        diff +=2;
1061        count+=2;
1062        Char *signUpLine, *signDownLine, *signTmpLine;
[56]1063
[872]1064        signUpLine  = m_signLineBuf1;
1065        signDownLine= m_signLineBuf2;
[56]1066
[872]1067        startX = (!isCalculatePreDeblockSamples) ? (isLeftAvail  ? 0 : 1)
1068                                                 : (isRightAvail ? (width - skipLinesR[typeIdx]) : (width - 1))
1069                                                 ;
[56]1070
[872]1071        endX   = (!isCalculatePreDeblockSamples) ? (isRightAvail ? (width - skipLinesR[typeIdx]): (width - 1))
1072                                                 : (isRightAvail ? width : (width - 1))
1073                                                 ;
1074        endY   = isBelowAvail ? (height - skipLinesB[typeIdx]) : (height - 1);
[608]1075
[872]1076        //prepare 2nd line's upper sign
1077        Pel* srcLineBelow = srcLine + srcStride;
1078        for (x=startX; x<endX+1; x++)
[608]1079        {
[964]1080          signUpLine[x] = (Char)sgn(srcLineBelow[x] - srcLine[x-1]);
[608]1081        }
[872]1082
1083        //1st line
1084        Pel* srcLineAbove = srcLine - srcStride;
1085        firstLineStartX = (!isCalculatePreDeblockSamples) ? (isAboveLeftAvail ? 0    : 1) : startX;
1086        firstLineEndX   = (!isCalculatePreDeblockSamples) ? (isAboveAvail     ? endX : 1) : endX;
1087        for(x=firstLineStartX; x<firstLineEndX; x++)
[608]1088        {
[964]1089          edgeType = sgn(srcLine[x] - srcLineAbove[x-1]) - signUpLine[x+1];
[872]1090          diff [edgeType] += (orgLine[x] - srcLine[x]);
1091          count[edgeType] ++;
[608]1092        }
[872]1093        srcLine  += srcStride;
1094        orgLine  += orgStride;
[608]1095
[872]1096
1097        //middle lines
1098        for (y=1; y<endY; y++)
[56]1099        {
[872]1100          srcLineBelow = srcLine + srcStride;
1101
1102          for (x=startX; x<endX; x++)
[56]1103          {
[964]1104            signDown = (Char)sgn(srcLine[x] - srcLineBelow[x+1]);
[872]1105            edgeType = signDown + signUpLine[x];
1106            diff [edgeType] += (orgLine[x] - srcLine[x]);
1107            count[edgeType] ++;
[608]1108
[1200]1109            signDownLine[x+1] = -signDown;
[56]1110          }
[964]1111          signDownLine[startX] = (Char)sgn(srcLineBelow[startX] - srcLine[startX-1]);
[608]1112
[872]1113          signTmpLine  = signUpLine;
1114          signUpLine   = signDownLine;
1115          signDownLine = signTmpLine;
[608]1116
[872]1117          srcLine += srcStride;
1118          orgLine += orgStride;
1119        }
1120        if(isCalculatePreDeblockSamples)
[608]1121        {
[872]1122          if(isBelowAvail)
[608]1123          {
[872]1124            startX = isLeftAvail  ? 0     : 1 ;
1125            endX   = isRightAvail ? width : (width -1);
1126
1127            for(y=0; y<skipLinesB[typeIdx]; y++)
[608]1128            {
[872]1129              srcLineBelow = srcLine + srcStride;
1130              srcLineAbove = srcLine - srcStride;
[608]1131
[872]1132              for (x=startX; x< endX; x++)
[608]1133              {
[964]1134                edgeType = sgn(srcLine[x] - srcLineBelow[x+1]) + sgn(srcLine[x] - srcLineAbove[x-1]);
[872]1135                diff [edgeType] += (orgLine[x] - srcLine[x]);
1136                count[edgeType] ++;
[608]1137              }
[872]1138              srcLine  += srcStride;
1139              orgLine  += orgStride;
[608]1140            }
1141          }
1142        }
[56]1143      }
[872]1144      break;
1145    case SAO_TYPE_EO_45:
1146      {
1147        diff +=2;
1148        count+=2;
1149        Char *signUpLine = m_signLineBuf1+1;
1150
1151        startX = (!isCalculatePreDeblockSamples) ? (isLeftAvail  ? 0 : 1)
1152                                                 : (isRightAvail ? (width - skipLinesR[typeIdx]) : (width - 1))
1153                                                 ;
1154        endX   = (!isCalculatePreDeblockSamples) ? (isRightAvail ? (width - skipLinesR[typeIdx]) : (width - 1))
1155                                                 : (isRightAvail ? width : (width - 1))
1156                                                 ;
1157        endY   = isBelowAvail ? (height - skipLinesB[typeIdx]) : (height - 1);
[56]1158
[872]1159        //prepare 2nd line upper sign
1160        Pel* srcLineBelow = srcLine + srcStride;
1161        for (x=startX-1; x<endX; x++)
[608]1162        {
[964]1163          signUpLine[x] = (Char)sgn(srcLineBelow[x] - srcLine[x+1]);
[608]1164        }
[872]1165
1166
1167        //first line
1168        Pel* srcLineAbove = srcLine - srcStride;
1169        firstLineStartX = (!isCalculatePreDeblockSamples) ? (isAboveAvail ? startX : endX)
1170                                                          : startX
1171                                                          ;
1172        firstLineEndX   = (!isCalculatePreDeblockSamples) ? ((!isRightAvail && isAboveRightAvail) ? width : endX)
1173                                                          : endX
1174                                                          ;
1175        for(x=firstLineStartX; x<firstLineEndX; x++)
[608]1176        {
[964]1177          edgeType = sgn(srcLine[x] - srcLineAbove[x+1]) - signUpLine[x-1];
[872]1178          diff [edgeType] += (orgLine[x] - srcLine[x]);
1179          count[edgeType] ++;
[608]1180        }
1181
[872]1182        srcLine += srcStride;
1183        orgLine += orgStride;
[608]1184
[872]1185        //middle lines
1186        for (y=1; y<endY; y++)
1187        {
1188          srcLineBelow = srcLine + srcStride;
[608]1189
[872]1190          for(x=startX; x<endX; x++)
1191          {
[964]1192            signDown = (Char)sgn(srcLine[x] - srcLineBelow[x-1]);
[872]1193            edgeType = signDown + signUpLine[x];
[608]1194
[872]1195            diff [edgeType] += (orgLine[x] - srcLine[x]);
1196            count[edgeType] ++;
[56]1197
[1200]1198            signUpLine[x-1] = -signDown;
[872]1199          }
[964]1200          signUpLine[endX-1] = (Char)sgn(srcLineBelow[endX-1] - srcLine[endX]);
[872]1201          srcLine  += srcStride;
1202          orgLine  += orgStride;
[608]1203        }
[872]1204        if(isCalculatePreDeblockSamples)
[608]1205        {
[872]1206          if(isBelowAvail)
1207          {
1208            startX = isLeftAvail  ? 0     : 1 ;
1209            endX   = isRightAvail ? width : (width -1);
[608]1210
[872]1211            for(y=0; y<skipLinesB[typeIdx]; y++)
1212            {
1213              srcLineBelow = srcLine + srcStride;
1214              srcLineAbove = srcLine - srcStride;
[56]1215
[872]1216              for (x=startX; x<endX; x++)
1217              {
[964]1218                edgeType = sgn(srcLine[x] - srcLineBelow[x-1]) + sgn(srcLine[x] - srcLineAbove[x+1]);
[872]1219                diff [edgeType] += (orgLine[x] - srcLine[x]);
1220                count[edgeType] ++;
1221              }
1222              srcLine  += srcStride;
1223              orgLine  += orgStride;
1224            }
1225          }
[56]1226        }
[608]1227      }
[872]1228      break;
1229    case SAO_TYPE_BO:
[608]1230      {
[872]1231        startX = (!isCalculatePreDeblockSamples)?0
1232                                                :( isRightAvail?(width- skipLinesR[typeIdx]):width)
1233                                                ;
1234        endX   = (!isCalculatePreDeblockSamples)?(isRightAvail ? (width - skipLinesR[typeIdx]) : width )
1235                                                :width
1236                                                ;
1237        endY = isBelowAvail ? (height- skipLinesB[typeIdx]) : height;
[1200]1238        Int shiftBits = channelBitDepth - NUM_SAO_BO_CLASSES_LOG2;
[872]1239        for (y=0; y< endY; y++)
[56]1240        {
[872]1241          for (x=startX; x< endX; x++)
[56]1242          {
1243
[1200]1244            Int bandIdx= srcLine[x] >> shiftBits;
[872]1245            diff [bandIdx] += (orgLine[x] - srcLine[x]);
1246            count[bandIdx] ++;
[56]1247          }
[872]1248          srcLine += srcStride;
1249          orgLine += orgStride;
[56]1250        }
[872]1251        if(isCalculatePreDeblockSamples)
1252        {
1253          if(isBelowAvail)
1254          {
1255            startX = 0;
1256            endX   = width;
[56]1257
[872]1258            for(y= 0; y< skipLinesB[typeIdx]; y++)
1259            {
1260              for (x=startX; x< endX; x++)
1261              {
[1200]1262                Int bandIdx= srcLine[x] >> shiftBits;
[872]1263                diff [bandIdx] += (orgLine[x] - srcLine[x]);
1264                count[bandIdx] ++;
1265              }
1266              srcLine  += srcStride;
1267              orgLine  += orgStride;
1268
1269            }
1270
1271          }
[56]1272        }
1273      }
[872]1274      break;
1275    default:
[56]1276      {
[872]1277        printf("Not a supported SAO types\n");
1278        assert(0);
1279        exit(-1);
[56]1280      }
1281    }
1282  }
1283}
1284
[1200]1285
[56]1286//! \}
Note: See TracBrowser for help on using the repository browser.