Context navigation

source: SHVCSoftware/branches/SHM-dev/source/Lib/TLibCommon/TComRdCost.cpp @ 1396

Visit:

Last change on this file since 1396 was 1395, checked in by seregin, 10 years ago
port rev 4548
Property svn:eol-style set to `native`
File size: 51.7 KB

Line
1	/* The copyright in this software is being made available under the BSD
2	* License, included below. This software may be subject to other third party
3	* and contributor rights, including patent rights, and no such rights are
4	* granted under this license.
5	*
6	* Copyright (c) 2010-2015, ITU/ISO/IEC
7	* All rights reserved.
8	*
9	* Redistribution and use in source and binary forms, with or without
10	* modification, are permitted provided that the following conditions are met:
11	*
12	* * Redistributions of source code must retain the above copyright notice,
13	* this list of conditions and the following disclaimer.
14	* * Redistributions in binary form must reproduce the above copyright notice,
15	* this list of conditions and the following disclaimer in the documentation
16	* and/or other materials provided with the distribution.
17	* * Neither the name of the ITU/ISO/IEC nor the names of its contributors may
18	* be used to endorse or promote products derived from this software without
19	* specific prior written permission.
20	*
21	* THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
22	* AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
23	* IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
24	* ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS
25	* BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
26	* CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
27	* SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
28	* INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
29	* CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
30	* ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF
31	* THE POSSIBILITY OF SUCH DAMAGE.
32	*/
33
34	/** \file TComRdCost.cpp
35	\brief RD cost computation class
36	*/
37
38	#include <math.h>
39	#include <assert.h>
40	#include <limits>
41	#include "TComRom.h"
42	#include "TComRdCost.h"
43
44	//! \ingroup TLibCommon
45	//! \{
46
47	TComRdCost::TComRdCost()
48	{
49	init();
50	}
51
52	TComRdCost::~TComRdCost()
53	{
54	}
55
56	// Calculate RD functions
57	Double TComRdCost::calcRdCost( Double numBits, Double distortion, DFunc eDFunc )
58	{
59	Double lambda = 1.0;
60
61	switch ( eDFunc )
62	{
63	case DF_SSE:
64	assert(0);
65	break;
66	case DF_SAD:
67	lambda = m_dLambdaMotionSAD[0]; // 0 is valid, because for lossless blocks, the cost equation is modified to compensate.
68	break;
69	case DF_DEFAULT:
70	lambda = m_dLambda;
71	break;
72	case DF_SSE_FRAME:
73	lambda = m_dFrameLambda;
74	break;
75	default:
76	assert (0);
77	break;
78	}
79
80	if (eDFunc == DF_SAD)
81	{
82	if (m_costMode != COST_STANDARD_LOSSY)
83	{
84	return ((distortion * 65536.0) / lambda) + numBits; // all lossless costs would have uiDistortion=0, and therefore this cost function can be used.
85	}
86	else
87	{
88	return distortion + (((numBits * lambda) ) / 65536.0);
89	}
90	}
91	else
92	{
93	if (m_costMode != COST_STANDARD_LOSSY)
94	{
95	return (distortion / lambda) + numBits; // all lossless costs would have uiDistortion=0, and therefore this cost function can be used.
96	}
97	else
98	{
99	return distortion + (numBits * lambda);
100	}
101	}
102	}
103
104	Void TComRdCost::setLambda( Double dLambda, const BitDepths &bitDepths )
105	{
106	m_dLambda = dLambda;
107	m_sqrtLambda = sqrt(m_dLambda);
108	m_dLambdaMotionSAD[0] = 65536.0 * m_sqrtLambda;
109	m_dLambdaMotionSSE[0] = 65536.0 * m_dLambda;
110	#if FULL_NBIT
111	dLambda = 0.57 * pow(2.0, ((LOSSLESS_AND_MIXED_LOSSLESS_RD_COST_TEST_QP_PRIME - 12) / 3.0));
112	#else
113	dLambda = 0.57 * pow(2.0, ((LOSSLESS_AND_MIXED_LOSSLESS_RD_COST_TEST_QP_PRIME - 12 - 6 * (bitDepths.recon[CHANNEL_TYPE_LUMA] - 8)) / 3.0));
114	#endif
115	m_dLambdaMotionSAD[1] = 65536.0 * sqrt(dLambda);
116	m_dLambdaMotionSSE[1] = 65536.0 * dLambda;
117	}
118
119
120	// Initalize Function Pointer by [eDFunc]
121	Void TComRdCost::init()
122	{
123	m_afpDistortFunc[DF_DEFAULT] = NULL; // for DF_DEFAULT
124
125	m_afpDistortFunc[DF_SSE ] = TComRdCost::xGetSSE;
126	m_afpDistortFunc[DF_SSE4 ] = TComRdCost::xGetSSE4;
127	m_afpDistortFunc[DF_SSE8 ] = TComRdCost::xGetSSE8;
128	m_afpDistortFunc[DF_SSE16 ] = TComRdCost::xGetSSE16;
129	m_afpDistortFunc[DF_SSE32 ] = TComRdCost::xGetSSE32;
130	m_afpDistortFunc[DF_SSE64 ] = TComRdCost::xGetSSE64;
131	m_afpDistortFunc[DF_SSE16N ] = TComRdCost::xGetSSE16N;
132
133	m_afpDistortFunc[DF_SAD ] = TComRdCost::xGetSAD;
134	m_afpDistortFunc[DF_SAD4 ] = TComRdCost::xGetSAD4;
135	m_afpDistortFunc[DF_SAD8 ] = TComRdCost::xGetSAD8;
136	m_afpDistortFunc[DF_SAD16 ] = TComRdCost::xGetSAD16;
137	m_afpDistortFunc[DF_SAD32 ] = TComRdCost::xGetSAD32;
138	m_afpDistortFunc[DF_SAD64 ] = TComRdCost::xGetSAD64;
139	m_afpDistortFunc[DF_SAD16N ] = TComRdCost::xGetSAD16N;
140
141	m_afpDistortFunc[DF_SADS ] = TComRdCost::xGetSAD;
142	m_afpDistortFunc[DF_SADS4 ] = TComRdCost::xGetSAD4;
143	m_afpDistortFunc[DF_SADS8 ] = TComRdCost::xGetSAD8;
144	m_afpDistortFunc[DF_SADS16 ] = TComRdCost::xGetSAD16;
145	m_afpDistortFunc[DF_SADS32 ] = TComRdCost::xGetSAD32;
146	m_afpDistortFunc[DF_SADS64 ] = TComRdCost::xGetSAD64;
147	m_afpDistortFunc[DF_SADS16N] = TComRdCost::xGetSAD16N;
148
149	m_afpDistortFunc[DF_SAD12 ] = TComRdCost::xGetSAD12;
150	m_afpDistortFunc[DF_SAD24 ] = TComRdCost::xGetSAD24;
151	m_afpDistortFunc[DF_SAD48 ] = TComRdCost::xGetSAD48;
152
153	m_afpDistortFunc[DF_SADS12 ] = TComRdCost::xGetSAD12;
154	m_afpDistortFunc[DF_SADS24 ] = TComRdCost::xGetSAD24;
155	m_afpDistortFunc[DF_SADS48 ] = TComRdCost::xGetSAD48;
156
157	m_afpDistortFunc[DF_HADS ] = TComRdCost::xGetHADs;
158	m_afpDistortFunc[DF_HADS4 ] = TComRdCost::xGetHADs;
159	m_afpDistortFunc[DF_HADS8 ] = TComRdCost::xGetHADs;
160	m_afpDistortFunc[DF_HADS16 ] = TComRdCost::xGetHADs;
161	m_afpDistortFunc[DF_HADS32 ] = TComRdCost::xGetHADs;
162	m_afpDistortFunc[DF_HADS64 ] = TComRdCost::xGetHADs;
163	m_afpDistortFunc[DF_HADS16N] = TComRdCost::xGetHADs;
164
165	m_costMode = COST_STANDARD_LOSSY;
166
167	m_dCost = 0;
168	m_iCostScale = 0;
169	}
170
171	// Static member function
172	UInt TComRdCost::xGetExpGolombNumberOfBits( Int iVal )
173	{
174	assert(iVal != std::numeric_limits<Int>::min());
175	UInt uiLength = 1;
176	UInt uiTemp = ( iVal <= 0) ? (UInt(-iVal)<<1)+1: UInt(iVal<<1);
177
178	while ( 1 != uiTemp )
179	{
180	uiTemp >>= 1;
181	uiLength += 2;
182	}
183
184	return uiLength;
185	}
186
187	Void TComRdCost::setDistParam( UInt uiBlkWidth, UInt uiBlkHeight, DFunc eDFunc, DistParam& rcDistParam )
188	{
189	// set Block Width / Height
190	rcDistParam.iCols = uiBlkWidth;
191	rcDistParam.iRows = uiBlkHeight;
192	rcDistParam.DistFunc = m_afpDistortFunc[eDFunc + g_aucConvertToBit[ rcDistParam.iCols ] + 1 ];
193
194	// initialize
195	rcDistParam.iSubShift = 0;
196	}
197
198	// Setting the Distortion Parameter for Inter (ME)
199	Void TComRdCost::setDistParam( const TComPattern* const pcPatternKey, const Pel* piRefY, Int iRefStride, DistParam& rcDistParam )
200	{
201	// set Original & Curr Pointer / Stride
202	rcDistParam.pOrg = pcPatternKey->getROIY();
203	rcDistParam.pCur = piRefY;
204
205	rcDistParam.iStrideOrg = pcPatternKey->getPatternLStride();
206	rcDistParam.iStrideCur = iRefStride;
207
208	// set Block Width / Height
209	rcDistParam.iCols = pcPatternKey->getROIYWidth();
210	rcDistParam.iRows = pcPatternKey->getROIYHeight();
211	rcDistParam.DistFunc = m_afpDistortFunc[DF_SAD + g_aucConvertToBit[ rcDistParam.iCols ] + 1 ];
212
213	if (rcDistParam.iCols == 12)
214	{
215	rcDistParam.DistFunc = m_afpDistortFunc[DF_SAD12];
216	}
217	else if (rcDistParam.iCols == 24)
218	{
219	rcDistParam.DistFunc = m_afpDistortFunc[DF_SAD24];
220	}
221	else if (rcDistParam.iCols == 48)
222	{
223	rcDistParam.DistFunc = m_afpDistortFunc[DF_SAD48];
224	}
225
226	// initialize
227	rcDistParam.iSubShift = 0;
228	}
229
230	// Setting the Distortion Parameter for Inter (subpel ME with step)
231	Void TComRdCost::setDistParam( const TComPattern* const pcPatternKey, const Pel* piRefY, Int iRefStride, Int iStep, DistParam& rcDistParam, Bool bHADME )
232	{
233	// set Original & Curr Pointer / Stride
234	rcDistParam.pOrg = pcPatternKey->getROIY();
235	rcDistParam.pCur = piRefY;
236
237	rcDistParam.iStrideOrg = pcPatternKey->getPatternLStride();
238	rcDistParam.iStrideCur = iRefStride * iStep;
239
240	// set Step for interpolated buffer
241	rcDistParam.iStep = iStep;
242
243	// set Block Width / Height
244	rcDistParam.iCols = pcPatternKey->getROIYWidth();
245	rcDistParam.iRows = pcPatternKey->getROIYHeight();
246
247	// set distortion function
248	if ( !bHADME )
249	{
250	rcDistParam.DistFunc = m_afpDistortFunc[DF_SADS + g_aucConvertToBit[ rcDistParam.iCols ] + 1 ];
251	if (rcDistParam.iCols == 12)
252	{
253	rcDistParam.DistFunc = m_afpDistortFunc[DF_SADS12];
254	}
255	else if (rcDistParam.iCols == 24)
256	{
257	rcDistParam.DistFunc = m_afpDistortFunc[DF_SADS24];
258	}
259	else if (rcDistParam.iCols == 48)
260	{
261	rcDistParam.DistFunc = m_afpDistortFunc[DF_SADS48];
262	}
263	}
264	else
265	{
266	rcDistParam.DistFunc = m_afpDistortFunc[DF_HADS + g_aucConvertToBit[ rcDistParam.iCols ] + 1 ];
267	}
268
269	// initialize
270	rcDistParam.iSubShift = 0;
271	}
272
273	Void TComRdCost::setDistParam( DistParam& rcDP, Int bitDepth, const Pel* p1, Int iStride1, const Pel* p2, Int iStride2, Int iWidth, Int iHeight, Bool bHadamard )
274	{
275	rcDP.pOrg = p1;
276	rcDP.pCur = p2;
277	rcDP.iStrideOrg = iStride1;
278	rcDP.iStrideCur = iStride2;
279	rcDP.iCols = iWidth;
280	rcDP.iRows = iHeight;
281	rcDP.iStep = 1;
282	rcDP.iSubShift = 0;
283	rcDP.bitDepth = bitDepth;
284	rcDP.DistFunc = m_afpDistortFunc[ ( bHadamard ? DF_HADS : DF_SADS ) + g_aucConvertToBit[ iWidth ] + 1 ];
285	}
286
287	Distortion TComRdCost::calcHAD( Int bitDepth, const Pel* pi0, Int iStride0, const Pel* pi1, Int iStride1, Int iWidth, Int iHeight )
288	{
289	Distortion uiSum = 0;
290	Int x, y;
291
292	if ( ( (iWidth % 8) == 0 ) && ( (iHeight % 8) == 0 ) )
293	{
294	for ( y=0; y<iHeight; y+= 8 )
295	{
296	for ( x=0; x<iWidth; x+= 8 )
297	{
298	uiSum += xCalcHADs8x8( &pi0[x], &pi1[x], iStride0, iStride1, 1 );
299	}
300	pi0 += iStride0*8;
301	pi1 += iStride1*8;
302	}
303	}
304	else
305	{
306	assert ( ( (iWidth % 4) == 0 ) && ( (iHeight % 4) == 0 ) );
307
308	for ( y=0; y<iHeight; y+= 4 )
309	{
310	for ( x=0; x<iWidth; x+= 4 )
311	{
312	uiSum += xCalcHADs4x4( &pi0[x], &pi1[x], iStride0, iStride1, 1 );
313	}
314	pi0 += iStride0*4;
315	pi1 += iStride1*4;
316	}
317	}
318
319	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(bitDepth-8) );
320	}
321
322	Distortion TComRdCost::getDistPart( Int bitDepth, const Pel* piCur, Int iCurStride, const Pel* piOrg, Int iOrgStride, UInt uiBlkWidth, UInt uiBlkHeight, const ComponentID compID, DFunc eDFunc )
323	{
324	DistParam cDtParam;
325	setDistParam( uiBlkWidth, uiBlkHeight, eDFunc, cDtParam );
326	cDtParam.pOrg = piOrg;
327	cDtParam.pCur = piCur;
328	cDtParam.iStrideOrg = iOrgStride;
329	cDtParam.iStrideCur = iCurStride;
330	cDtParam.iStep = 1;
331
332	cDtParam.bApplyWeight = false;
333	cDtParam.compIdx = MAX_NUM_COMPONENT; // just for assert: to be sure it was set before use
334	cDtParam.bitDepth = bitDepth;
335
336	if (isChroma(compID))
337	{
338	return ((Distortion) (m_distortionWeight[compID] * cDtParam.DistFunc( &cDtParam )));
339	}
340	else
341	{
342	return cDtParam.DistFunc( &cDtParam );
343	}
344	}
345
346	// ====================================================================================================================
347	// Distortion functions
348	// ====================================================================================================================
349
350	// --------------------------------------------------------------------------------------------------------------------
351	// SAD
352	// --------------------------------------------------------------------------------------------------------------------
353
354	Distortion TComRdCost::xGetSAD( DistParam* pcDtParam )
355	{
356	if ( pcDtParam->bApplyWeight )
357	{
358	return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
359	}
360	const Pel* piOrg = pcDtParam->pOrg;
361	const Pel* piCur = pcDtParam->pCur;
362	Int iRows = pcDtParam->iRows;
363	Int iCols = pcDtParam->iCols;
364	Int iStrideCur = pcDtParam->iStrideCur;
365	Int iStrideOrg = pcDtParam->iStrideOrg;
366
367	Distortion uiSum = 0;
368
369	for( ; iRows != 0; iRows-- )
370	{
371	for (Int n = 0; n < iCols; n++ )
372	{
373	uiSum += abs( piOrg[n] - piCur[n] );
374	}
375	piOrg += iStrideOrg;
376	piCur += iStrideCur;
377	}
378
379	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
380	}
381
382	Distortion TComRdCost::xGetSAD4( DistParam* pcDtParam )
383	{
384	if ( pcDtParam->bApplyWeight )
385	{
386	return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
387	}
388	const Pel* piOrg = pcDtParam->pOrg;
389	const Pel* piCur = pcDtParam->pCur;
390	Int iRows = pcDtParam->iRows;
391	Int iSubShift = pcDtParam->iSubShift;
392	Int iSubStep = ( 1 << iSubShift );
393	Int iStrideCur = pcDtParam->iStrideCur*iSubStep;
394	Int iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
395
396	Distortion uiSum = 0;
397
398	for( ; iRows != 0; iRows-=iSubStep )
399	{
400	uiSum += abs( piOrg[0] - piCur[0] );
401	uiSum += abs( piOrg[1] - piCur[1] );
402	uiSum += abs( piOrg[2] - piCur[2] );
403	uiSum += abs( piOrg[3] - piCur[3] );
404
405	piOrg += iStrideOrg;
406	piCur += iStrideCur;
407	}
408
409	uiSum <<= iSubShift;
410	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
411	}
412
413	Distortion TComRdCost::xGetSAD8( DistParam* pcDtParam )
414	{
415	if ( pcDtParam->bApplyWeight )
416	{
417	return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
418	}
419	const Pel* piOrg = pcDtParam->pOrg;
420	const Pel* piCur = pcDtParam->pCur;
421	Int iRows = pcDtParam->iRows;
422	Int iSubShift = pcDtParam->iSubShift;
423	Int iSubStep = ( 1 << iSubShift );
424	Int iStrideCur = pcDtParam->iStrideCur*iSubStep;
425	Int iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
426
427	Distortion uiSum = 0;
428
429	for( ; iRows != 0; iRows-=iSubStep )
430	{
431	uiSum += abs( piOrg[0] - piCur[0] );
432	uiSum += abs( piOrg[1] - piCur[1] );
433	uiSum += abs( piOrg[2] - piCur[2] );
434	uiSum += abs( piOrg[3] - piCur[3] );
435	uiSum += abs( piOrg[4] - piCur[4] );
436	uiSum += abs( piOrg[5] - piCur[5] );
437	uiSum += abs( piOrg[6] - piCur[6] );
438	uiSum += abs( piOrg[7] - piCur[7] );
439
440	piOrg += iStrideOrg;
441	piCur += iStrideCur;
442	}
443
444	uiSum <<= iSubShift;
445	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
446	}
447
448	Distortion TComRdCost::xGetSAD16( DistParam* pcDtParam )
449	{
450	if ( pcDtParam->bApplyWeight )
451	{
452	return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
453	}
454	const Pel* piOrg = pcDtParam->pOrg;
455	const Pel* piCur = pcDtParam->pCur;
456	Int iRows = pcDtParam->iRows;
457	Int iSubShift = pcDtParam->iSubShift;
458	Int iSubStep = ( 1 << iSubShift );
459	Int iStrideCur = pcDtParam->iStrideCur*iSubStep;
460	Int iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
461
462	Distortion uiSum = 0;
463
464	for( ; iRows != 0; iRows-=iSubStep )
465	{
466	uiSum += abs( piOrg[0] - piCur[0] );
467	uiSum += abs( piOrg[1] - piCur[1] );
468	uiSum += abs( piOrg[2] - piCur[2] );
469	uiSum += abs( piOrg[3] - piCur[3] );
470	uiSum += abs( piOrg[4] - piCur[4] );
471	uiSum += abs( piOrg[5] - piCur[5] );
472	uiSum += abs( piOrg[6] - piCur[6] );
473	uiSum += abs( piOrg[7] - piCur[7] );
474	uiSum += abs( piOrg[8] - piCur[8] );
475	uiSum += abs( piOrg[9] - piCur[9] );
476	uiSum += abs( piOrg[10] - piCur[10] );
477	uiSum += abs( piOrg[11] - piCur[11] );
478	uiSum += abs( piOrg[12] - piCur[12] );
479	uiSum += abs( piOrg[13] - piCur[13] );
480	uiSum += abs( piOrg[14] - piCur[14] );
481	uiSum += abs( piOrg[15] - piCur[15] );
482
483	piOrg += iStrideOrg;
484	piCur += iStrideCur;
485	}
486
487	uiSum <<= iSubShift;
488	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
489	}
490
491	Distortion TComRdCost::xGetSAD12( DistParam* pcDtParam )
492	{
493	if ( pcDtParam->bApplyWeight )
494	{
495	return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
496	}
497	const Pel* piOrg = pcDtParam->pOrg;
498	const Pel* piCur = pcDtParam->pCur;
499	Int iRows = pcDtParam->iRows;
500	Int iSubShift = pcDtParam->iSubShift;
501	Int iSubStep = ( 1 << iSubShift );
502	Int iStrideCur = pcDtParam->iStrideCur*iSubStep;
503	Int iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
504
505	Distortion uiSum = 0;
506
507	for( ; iRows != 0; iRows-=iSubStep )
508	{
509	uiSum += abs( piOrg[0] - piCur[0] );
510	uiSum += abs( piOrg[1] - piCur[1] );
511	uiSum += abs( piOrg[2] - piCur[2] );
512	uiSum += abs( piOrg[3] - piCur[3] );
513	uiSum += abs( piOrg[4] - piCur[4] );
514	uiSum += abs( piOrg[5] - piCur[5] );
515	uiSum += abs( piOrg[6] - piCur[6] );
516	uiSum += abs( piOrg[7] - piCur[7] );
517	uiSum += abs( piOrg[8] - piCur[8] );
518	uiSum += abs( piOrg[9] - piCur[9] );
519	uiSum += abs( piOrg[10] - piCur[10] );
520	uiSum += abs( piOrg[11] - piCur[11] );
521
522	piOrg += iStrideOrg;
523	piCur += iStrideCur;
524	}
525
526	uiSum <<= iSubShift;
527	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
528	}
529
530	Distortion TComRdCost::xGetSAD16N( DistParam* pcDtParam )
531	{
532	const Pel* piOrg = pcDtParam->pOrg;
533	const Pel* piCur = pcDtParam->pCur;
534	Int iRows = pcDtParam->iRows;
535	Int iCols = pcDtParam->iCols;
536	Int iSubShift = pcDtParam->iSubShift;
537	Int iSubStep = ( 1 << iSubShift );
538	Int iStrideCur = pcDtParam->iStrideCur*iSubStep;
539	Int iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
540
541	Distortion uiSum = 0;
542
543	for( ; iRows != 0; iRows-=iSubStep )
544	{
545	for (Int n = 0; n < iCols; n+=16 )
546	{
547	uiSum += abs( piOrg[n+ 0] - piCur[n+ 0] );
548	uiSum += abs( piOrg[n+ 1] - piCur[n+ 1] );
549	uiSum += abs( piOrg[n+ 2] - piCur[n+ 2] );
550	uiSum += abs( piOrg[n+ 3] - piCur[n+ 3] );
551	uiSum += abs( piOrg[n+ 4] - piCur[n+ 4] );
552	uiSum += abs( piOrg[n+ 5] - piCur[n+ 5] );
553	uiSum += abs( piOrg[n+ 6] - piCur[n+ 6] );
554	uiSum += abs( piOrg[n+ 7] - piCur[n+ 7] );
555	uiSum += abs( piOrg[n+ 8] - piCur[n+ 8] );
556	uiSum += abs( piOrg[n+ 9] - piCur[n+ 9] );
557	uiSum += abs( piOrg[n+10] - piCur[n+10] );
558	uiSum += abs( piOrg[n+11] - piCur[n+11] );
559	uiSum += abs( piOrg[n+12] - piCur[n+12] );
560	uiSum += abs( piOrg[n+13] - piCur[n+13] );
561	uiSum += abs( piOrg[n+14] - piCur[n+14] );
562	uiSum += abs( piOrg[n+15] - piCur[n+15] );
563	}
564	piOrg += iStrideOrg;
565	piCur += iStrideCur;
566	}
567
568	uiSum <<= iSubShift;
569	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
570	}
571
572	Distortion TComRdCost::xGetSAD32( DistParam* pcDtParam )
573	{
574	if ( pcDtParam->bApplyWeight )
575	{
576	return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
577	}
578	const Pel* piOrg = pcDtParam->pOrg;
579	const Pel* piCur = pcDtParam->pCur;
580	Int iRows = pcDtParam->iRows;
581	Int iSubShift = pcDtParam->iSubShift;
582	Int iSubStep = ( 1 << iSubShift );
583	Int iStrideCur = pcDtParam->iStrideCur*iSubStep;
584	Int iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
585
586	Distortion uiSum = 0;
587
588	for( ; iRows != 0; iRows-=iSubStep )
589	{
590	uiSum += abs( piOrg[0] - piCur[0] );
591	uiSum += abs( piOrg[1] - piCur[1] );
592	uiSum += abs( piOrg[2] - piCur[2] );
593	uiSum += abs( piOrg[3] - piCur[3] );
594	uiSum += abs( piOrg[4] - piCur[4] );
595	uiSum += abs( piOrg[5] - piCur[5] );
596	uiSum += abs( piOrg[6] - piCur[6] );
597	uiSum += abs( piOrg[7] - piCur[7] );
598	uiSum += abs( piOrg[8] - piCur[8] );
599	uiSum += abs( piOrg[9] - piCur[9] );
600	uiSum += abs( piOrg[10] - piCur[10] );
601	uiSum += abs( piOrg[11] - piCur[11] );
602	uiSum += abs( piOrg[12] - piCur[12] );
603	uiSum += abs( piOrg[13] - piCur[13] );
604	uiSum += abs( piOrg[14] - piCur[14] );
605	uiSum += abs( piOrg[15] - piCur[15] );
606	uiSum += abs( piOrg[16] - piCur[16] );
607	uiSum += abs( piOrg[17] - piCur[17] );
608	uiSum += abs( piOrg[18] - piCur[18] );
609	uiSum += abs( piOrg[19] - piCur[19] );
610	uiSum += abs( piOrg[20] - piCur[20] );
611	uiSum += abs( piOrg[21] - piCur[21] );
612	uiSum += abs( piOrg[22] - piCur[22] );
613	uiSum += abs( piOrg[23] - piCur[23] );
614	uiSum += abs( piOrg[24] - piCur[24] );
615	uiSum += abs( piOrg[25] - piCur[25] );
616	uiSum += abs( piOrg[26] - piCur[26] );
617	uiSum += abs( piOrg[27] - piCur[27] );
618	uiSum += abs( piOrg[28] - piCur[28] );
619	uiSum += abs( piOrg[29] - piCur[29] );
620	uiSum += abs( piOrg[30] - piCur[30] );
621	uiSum += abs( piOrg[31] - piCur[31] );
622
623	piOrg += iStrideOrg;
624	piCur += iStrideCur;
625	}
626
627	uiSum <<= iSubShift;
628	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
629	}
630
631	Distortion TComRdCost::xGetSAD24( DistParam* pcDtParam )
632	{
633	if ( pcDtParam->bApplyWeight )
634	{
635	return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
636	}
637	const Pel* piOrg = pcDtParam->pOrg;
638	const Pel* piCur = pcDtParam->pCur;
639	Int iRows = pcDtParam->iRows;
640	Int iSubShift = pcDtParam->iSubShift;
641	Int iSubStep = ( 1 << iSubShift );
642	Int iStrideCur = pcDtParam->iStrideCur*iSubStep;
643	Int iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
644
645	Distortion uiSum = 0;
646
647	for( ; iRows != 0; iRows-=iSubStep )
648	{
649	uiSum += abs( piOrg[0] - piCur[0] );
650	uiSum += abs( piOrg[1] - piCur[1] );
651	uiSum += abs( piOrg[2] - piCur[2] );
652	uiSum += abs( piOrg[3] - piCur[3] );
653	uiSum += abs( piOrg[4] - piCur[4] );
654	uiSum += abs( piOrg[5] - piCur[5] );
655	uiSum += abs( piOrg[6] - piCur[6] );
656	uiSum += abs( piOrg[7] - piCur[7] );
657	uiSum += abs( piOrg[8] - piCur[8] );
658	uiSum += abs( piOrg[9] - piCur[9] );
659	uiSum += abs( piOrg[10] - piCur[10] );
660	uiSum += abs( piOrg[11] - piCur[11] );
661	uiSum += abs( piOrg[12] - piCur[12] );
662	uiSum += abs( piOrg[13] - piCur[13] );
663	uiSum += abs( piOrg[14] - piCur[14] );
664	uiSum += abs( piOrg[15] - piCur[15] );
665	uiSum += abs( piOrg[16] - piCur[16] );
666	uiSum += abs( piOrg[17] - piCur[17] );
667	uiSum += abs( piOrg[18] - piCur[18] );
668	uiSum += abs( piOrg[19] - piCur[19] );
669	uiSum += abs( piOrg[20] - piCur[20] );
670	uiSum += abs( piOrg[21] - piCur[21] );
671	uiSum += abs( piOrg[22] - piCur[22] );
672	uiSum += abs( piOrg[23] - piCur[23] );
673
674	piOrg += iStrideOrg;
675	piCur += iStrideCur;
676	}
677
678	uiSum <<= iSubShift;
679	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
680	}
681
682	Distortion TComRdCost::xGetSAD64( DistParam* pcDtParam )
683	{
684	if ( pcDtParam->bApplyWeight )
685	{
686	return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
687	}
688	const Pel* piOrg = pcDtParam->pOrg;
689	const Pel* piCur = pcDtParam->pCur;
690	Int iRows = pcDtParam->iRows;
691	Int iSubShift = pcDtParam->iSubShift;
692	Int iSubStep = ( 1 << iSubShift );
693	Int iStrideCur = pcDtParam->iStrideCur*iSubStep;
694	Int iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
695
696	Distortion uiSum = 0;
697
698	for( ; iRows != 0; iRows-=iSubStep )
699	{
700	uiSum += abs( piOrg[0] - piCur[0] );
701	uiSum += abs( piOrg[1] - piCur[1] );
702	uiSum += abs( piOrg[2] - piCur[2] );
703	uiSum += abs( piOrg[3] - piCur[3] );
704	uiSum += abs( piOrg[4] - piCur[4] );
705	uiSum += abs( piOrg[5] - piCur[5] );
706	uiSum += abs( piOrg[6] - piCur[6] );
707	uiSum += abs( piOrg[7] - piCur[7] );
708	uiSum += abs( piOrg[8] - piCur[8] );
709	uiSum += abs( piOrg[9] - piCur[9] );
710	uiSum += abs( piOrg[10] - piCur[10] );
711	uiSum += abs( piOrg[11] - piCur[11] );
712	uiSum += abs( piOrg[12] - piCur[12] );
713	uiSum += abs( piOrg[13] - piCur[13] );
714	uiSum += abs( piOrg[14] - piCur[14] );
715	uiSum += abs( piOrg[15] - piCur[15] );
716	uiSum += abs( piOrg[16] - piCur[16] );
717	uiSum += abs( piOrg[17] - piCur[17] );
718	uiSum += abs( piOrg[18] - piCur[18] );
719	uiSum += abs( piOrg[19] - piCur[19] );
720	uiSum += abs( piOrg[20] - piCur[20] );
721	uiSum += abs( piOrg[21] - piCur[21] );
722	uiSum += abs( piOrg[22] - piCur[22] );
723	uiSum += abs( piOrg[23] - piCur[23] );
724	uiSum += abs( piOrg[24] - piCur[24] );
725	uiSum += abs( piOrg[25] - piCur[25] );
726	uiSum += abs( piOrg[26] - piCur[26] );
727	uiSum += abs( piOrg[27] - piCur[27] );
728	uiSum += abs( piOrg[28] - piCur[28] );
729	uiSum += abs( piOrg[29] - piCur[29] );
730	uiSum += abs( piOrg[30] - piCur[30] );
731	uiSum += abs( piOrg[31] - piCur[31] );
732	uiSum += abs( piOrg[32] - piCur[32] );
733	uiSum += abs( piOrg[33] - piCur[33] );
734	uiSum += abs( piOrg[34] - piCur[34] );
735	uiSum += abs( piOrg[35] - piCur[35] );
736	uiSum += abs( piOrg[36] - piCur[36] );
737	uiSum += abs( piOrg[37] - piCur[37] );
738	uiSum += abs( piOrg[38] - piCur[38] );
739	uiSum += abs( piOrg[39] - piCur[39] );
740	uiSum += abs( piOrg[40] - piCur[40] );
741	uiSum += abs( piOrg[41] - piCur[41] );
742	uiSum += abs( piOrg[42] - piCur[42] );
743	uiSum += abs( piOrg[43] - piCur[43] );
744	uiSum += abs( piOrg[44] - piCur[44] );
745	uiSum += abs( piOrg[45] - piCur[45] );
746	uiSum += abs( piOrg[46] - piCur[46] );
747	uiSum += abs( piOrg[47] - piCur[47] );
748	uiSum += abs( piOrg[48] - piCur[48] );
749	uiSum += abs( piOrg[49] - piCur[49] );
750	uiSum += abs( piOrg[50] - piCur[50] );
751	uiSum += abs( piOrg[51] - piCur[51] );
752	uiSum += abs( piOrg[52] - piCur[52] );
753	uiSum += abs( piOrg[53] - piCur[53] );
754	uiSum += abs( piOrg[54] - piCur[54] );
755	uiSum += abs( piOrg[55] - piCur[55] );
756	uiSum += abs( piOrg[56] - piCur[56] );
757	uiSum += abs( piOrg[57] - piCur[57] );
758	uiSum += abs( piOrg[58] - piCur[58] );
759	uiSum += abs( piOrg[59] - piCur[59] );
760	uiSum += abs( piOrg[60] - piCur[60] );
761	uiSum += abs( piOrg[61] - piCur[61] );
762	uiSum += abs( piOrg[62] - piCur[62] );
763	uiSum += abs( piOrg[63] - piCur[63] );
764
765	piOrg += iStrideOrg;
766	piCur += iStrideCur;
767	}
768
769	uiSum <<= iSubShift;
770	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
771	}
772
773	Distortion TComRdCost::xGetSAD48( DistParam* pcDtParam )
774	{
775	if ( pcDtParam->bApplyWeight )
776	{
777	return TComRdCostWeightPrediction::xGetSADw( pcDtParam );
778	}
779	const Pel* piOrg = pcDtParam->pOrg;
780	const Pel* piCur = pcDtParam->pCur;
781	Int iRows = pcDtParam->iRows;
782	Int iSubShift = pcDtParam->iSubShift;
783	Int iSubStep = ( 1 << iSubShift );
784	Int iStrideCur = pcDtParam->iStrideCur*iSubStep;
785	Int iStrideOrg = pcDtParam->iStrideOrg*iSubStep;
786
787	Distortion uiSum = 0;
788
789	for( ; iRows != 0; iRows-=iSubStep )
790	{
791	uiSum += abs( piOrg[0] - piCur[0] );
792	uiSum += abs( piOrg[1] - piCur[1] );
793	uiSum += abs( piOrg[2] - piCur[2] );
794	uiSum += abs( piOrg[3] - piCur[3] );
795	uiSum += abs( piOrg[4] - piCur[4] );
796	uiSum += abs( piOrg[5] - piCur[5] );
797	uiSum += abs( piOrg[6] - piCur[6] );
798	uiSum += abs( piOrg[7] - piCur[7] );
799	uiSum += abs( piOrg[8] - piCur[8] );
800	uiSum += abs( piOrg[9] - piCur[9] );
801	uiSum += abs( piOrg[10] - piCur[10] );
802	uiSum += abs( piOrg[11] - piCur[11] );
803	uiSum += abs( piOrg[12] - piCur[12] );
804	uiSum += abs( piOrg[13] - piCur[13] );
805	uiSum += abs( piOrg[14] - piCur[14] );
806	uiSum += abs( piOrg[15] - piCur[15] );
807	uiSum += abs( piOrg[16] - piCur[16] );
808	uiSum += abs( piOrg[17] - piCur[17] );
809	uiSum += abs( piOrg[18] - piCur[18] );
810	uiSum += abs( piOrg[19] - piCur[19] );
811	uiSum += abs( piOrg[20] - piCur[20] );
812	uiSum += abs( piOrg[21] - piCur[21] );
813	uiSum += abs( piOrg[22] - piCur[22] );
814	uiSum += abs( piOrg[23] - piCur[23] );
815	uiSum += abs( piOrg[24] - piCur[24] );
816	uiSum += abs( piOrg[25] - piCur[25] );
817	uiSum += abs( piOrg[26] - piCur[26] );
818	uiSum += abs( piOrg[27] - piCur[27] );
819	uiSum += abs( piOrg[28] - piCur[28] );
820	uiSum += abs( piOrg[29] - piCur[29] );
821	uiSum += abs( piOrg[30] - piCur[30] );
822	uiSum += abs( piOrg[31] - piCur[31] );
823	uiSum += abs( piOrg[32] - piCur[32] );
824	uiSum += abs( piOrg[33] - piCur[33] );
825	uiSum += abs( piOrg[34] - piCur[34] );
826	uiSum += abs( piOrg[35] - piCur[35] );
827	uiSum += abs( piOrg[36] - piCur[36] );
828	uiSum += abs( piOrg[37] - piCur[37] );
829	uiSum += abs( piOrg[38] - piCur[38] );
830	uiSum += abs( piOrg[39] - piCur[39] );
831	uiSum += abs( piOrg[40] - piCur[40] );
832	uiSum += abs( piOrg[41] - piCur[41] );
833	uiSum += abs( piOrg[42] - piCur[42] );
834	uiSum += abs( piOrg[43] - piCur[43] );
835	uiSum += abs( piOrg[44] - piCur[44] );
836	uiSum += abs( piOrg[45] - piCur[45] );
837	uiSum += abs( piOrg[46] - piCur[46] );
838	uiSum += abs( piOrg[47] - piCur[47] );
839
840	piOrg += iStrideOrg;
841	piCur += iStrideCur;
842	}
843
844	uiSum <<= iSubShift;
845	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
846	}
847
848	// --------------------------------------------------------------------------------------------------------------------
849	// SSE
850	// --------------------------------------------------------------------------------------------------------------------
851
852	Distortion TComRdCost::xGetSSE( DistParam* pcDtParam )
853	{
854	if ( pcDtParam->bApplyWeight )
855	{
856	return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
857	}
858	const Pel* piOrg = pcDtParam->pOrg;
859	const Pel* piCur = pcDtParam->pCur;
860	Int iRows = pcDtParam->iRows;
861	Int iCols = pcDtParam->iCols;
862	Int iStrideOrg = pcDtParam->iStrideOrg;
863	Int iStrideCur = pcDtParam->iStrideCur;
864
865	Distortion uiSum = 0;
866	UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
867
868	Intermediate_Int iTemp;
869
870	for( ; iRows != 0; iRows-- )
871	{
872	for (Int n = 0; n < iCols; n++ )
873	{
874	iTemp = piOrg[n ] - piCur[n ];
875	uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
876	}
877	piOrg += iStrideOrg;
878	piCur += iStrideCur;
879	}
880
881	return ( uiSum );
882	}
883
884	Distortion TComRdCost::xGetSSE4( DistParam* pcDtParam )
885	{
886	if ( pcDtParam->bApplyWeight )
887	{
888	assert( pcDtParam->iCols == 4 );
889	return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
890	}
891	const Pel* piOrg = pcDtParam->pOrg;
892	const Pel* piCur = pcDtParam->pCur;
893	Int iRows = pcDtParam->iRows;
894	Int iStrideOrg = pcDtParam->iStrideOrg;
895	Int iStrideCur = pcDtParam->iStrideCur;
896
897	Distortion uiSum = 0;
898	UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
899
900	Intermediate_Int iTemp;
901
902	for( ; iRows != 0; iRows-- )
903	{
904
905	iTemp = piOrg[0] - piCur[0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
906	iTemp = piOrg[1] - piCur[1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
907	iTemp = piOrg[2] - piCur[2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
908	iTemp = piOrg[3] - piCur[3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
909
910	piOrg += iStrideOrg;
911	piCur += iStrideCur;
912	}
913
914	return ( uiSum );
915	}
916
917	Distortion TComRdCost::xGetSSE8( DistParam* pcDtParam )
918	{
919	if ( pcDtParam->bApplyWeight )
920	{
921	assert( pcDtParam->iCols == 8 );
922	return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
923	}
924	const Pel* piOrg = pcDtParam->pOrg;
925	const Pel* piCur = pcDtParam->pCur;
926	Int iRows = pcDtParam->iRows;
927	Int iStrideOrg = pcDtParam->iStrideOrg;
928	Int iStrideCur = pcDtParam->iStrideCur;
929
930	Distortion uiSum = 0;
931	UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
932
933	Intermediate_Int iTemp;
934
935	for( ; iRows != 0; iRows-- )
936	{
937	iTemp = piOrg[0] - piCur[0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
938	iTemp = piOrg[1] - piCur[1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
939	iTemp = piOrg[2] - piCur[2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
940	iTemp = piOrg[3] - piCur[3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
941	iTemp = piOrg[4] - piCur[4]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
942	iTemp = piOrg[5] - piCur[5]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
943	iTemp = piOrg[6] - piCur[6]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
944	iTemp = piOrg[7] - piCur[7]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
945
946	piOrg += iStrideOrg;
947	piCur += iStrideCur;
948	}
949
950	return ( uiSum );
951	}
952
953	Distortion TComRdCost::xGetSSE16( DistParam* pcDtParam )
954	{
955	if ( pcDtParam->bApplyWeight )
956	{
957	assert( pcDtParam->iCols == 16 );
958	return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
959	}
960	const Pel* piOrg = pcDtParam->pOrg;
961	const Pel* piCur = pcDtParam->pCur;
962	Int iRows = pcDtParam->iRows;
963	Int iStrideOrg = pcDtParam->iStrideOrg;
964	Int iStrideCur = pcDtParam->iStrideCur;
965
966	Distortion uiSum = 0;
967	UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
968
969	Intermediate_Int iTemp;
970
971	for( ; iRows != 0; iRows-- )
972	{
973
974	iTemp = piOrg[ 0] - piCur[ 0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
975	iTemp = piOrg[ 1] - piCur[ 1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
976	iTemp = piOrg[ 2] - piCur[ 2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
977	iTemp = piOrg[ 3] - piCur[ 3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
978	iTemp = piOrg[ 4] - piCur[ 4]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
979	iTemp = piOrg[ 5] - piCur[ 5]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
980	iTemp = piOrg[ 6] - piCur[ 6]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
981	iTemp = piOrg[ 7] - piCur[ 7]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
982	iTemp = piOrg[ 8] - piCur[ 8]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
983	iTemp = piOrg[ 9] - piCur[ 9]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
984	iTemp = piOrg[10] - piCur[10]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
985	iTemp = piOrg[11] - piCur[11]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
986	iTemp = piOrg[12] - piCur[12]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
987	iTemp = piOrg[13] - piCur[13]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
988	iTemp = piOrg[14] - piCur[14]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
989	iTemp = piOrg[15] - piCur[15]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
990
991	piOrg += iStrideOrg;
992	piCur += iStrideCur;
993	}
994
995	return ( uiSum );
996	}
997
998	Distortion TComRdCost::xGetSSE16N( DistParam* pcDtParam )
999	{
1000	if ( pcDtParam->bApplyWeight )
1001	{
1002	return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
1003	}
1004	const Pel* piOrg = pcDtParam->pOrg;
1005	const Pel* piCur = pcDtParam->pCur;
1006	Int iRows = pcDtParam->iRows;
1007	Int iCols = pcDtParam->iCols;
1008	Int iStrideOrg = pcDtParam->iStrideOrg;
1009	Int iStrideCur = pcDtParam->iStrideCur;
1010
1011	Distortion uiSum = 0;
1012	UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
1013
1014	Intermediate_Int iTemp;
1015
1016	for( ; iRows != 0; iRows-- )
1017	{
1018	for (Int n = 0; n < iCols; n+=16 )
1019	{
1020
1021	iTemp = piOrg[n+ 0] - piCur[n+ 0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1022	iTemp = piOrg[n+ 1] - piCur[n+ 1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1023	iTemp = piOrg[n+ 2] - piCur[n+ 2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1024	iTemp = piOrg[n+ 3] - piCur[n+ 3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1025	iTemp = piOrg[n+ 4] - piCur[n+ 4]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1026	iTemp = piOrg[n+ 5] - piCur[n+ 5]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1027	iTemp = piOrg[n+ 6] - piCur[n+ 6]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1028	iTemp = piOrg[n+ 7] - piCur[n+ 7]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1029	iTemp = piOrg[n+ 8] - piCur[n+ 8]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1030	iTemp = piOrg[n+ 9] - piCur[n+ 9]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1031	iTemp = piOrg[n+10] - piCur[n+10]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1032	iTemp = piOrg[n+11] - piCur[n+11]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1033	iTemp = piOrg[n+12] - piCur[n+12]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1034	iTemp = piOrg[n+13] - piCur[n+13]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1035	iTemp = piOrg[n+14] - piCur[n+14]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1036	iTemp = piOrg[n+15] - piCur[n+15]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1037
1038	}
1039	piOrg += iStrideOrg;
1040	piCur += iStrideCur;
1041	}
1042
1043	return ( uiSum );
1044	}
1045
1046	Distortion TComRdCost::xGetSSE32( DistParam* pcDtParam )
1047	{
1048	if ( pcDtParam->bApplyWeight )
1049	{
1050	assert( pcDtParam->iCols == 32 );
1051	return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
1052	}
1053	const Pel* piOrg = pcDtParam->pOrg;
1054	const Pel* piCur = pcDtParam->pCur;
1055	Int iRows = pcDtParam->iRows;
1056	Int iStrideOrg = pcDtParam->iStrideOrg;
1057	Int iStrideCur = pcDtParam->iStrideCur;
1058
1059	Distortion uiSum = 0;
1060	UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
1061
1062	Intermediate_Int iTemp;
1063
1064	for( ; iRows != 0; iRows-- )
1065	{
1066
1067	iTemp = piOrg[ 0] - piCur[ 0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1068	iTemp = piOrg[ 1] - piCur[ 1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1069	iTemp = piOrg[ 2] - piCur[ 2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1070	iTemp = piOrg[ 3] - piCur[ 3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1071	iTemp = piOrg[ 4] - piCur[ 4]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1072	iTemp = piOrg[ 5] - piCur[ 5]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1073	iTemp = piOrg[ 6] - piCur[ 6]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1074	iTemp = piOrg[ 7] - piCur[ 7]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1075	iTemp = piOrg[ 8] - piCur[ 8]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1076	iTemp = piOrg[ 9] - piCur[ 9]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1077	iTemp = piOrg[10] - piCur[10]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1078	iTemp = piOrg[11] - piCur[11]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1079	iTemp = piOrg[12] - piCur[12]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1080	iTemp = piOrg[13] - piCur[13]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1081	iTemp = piOrg[14] - piCur[14]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1082	iTemp = piOrg[15] - piCur[15]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1083	iTemp = piOrg[16] - piCur[16]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1084	iTemp = piOrg[17] - piCur[17]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1085	iTemp = piOrg[18] - piCur[18]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1086	iTemp = piOrg[19] - piCur[19]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1087	iTemp = piOrg[20] - piCur[20]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1088	iTemp = piOrg[21] - piCur[21]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1089	iTemp = piOrg[22] - piCur[22]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1090	iTemp = piOrg[23] - piCur[23]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1091	iTemp = piOrg[24] - piCur[24]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1092	iTemp = piOrg[25] - piCur[25]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1093	iTemp = piOrg[26] - piCur[26]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1094	iTemp = piOrg[27] - piCur[27]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1095	iTemp = piOrg[28] - piCur[28]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1096	iTemp = piOrg[29] - piCur[29]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1097	iTemp = piOrg[30] - piCur[30]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1098	iTemp = piOrg[31] - piCur[31]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1099
1100	piOrg += iStrideOrg;
1101	piCur += iStrideCur;
1102	}
1103
1104	return ( uiSum );
1105	}
1106
1107	Distortion TComRdCost::xGetSSE64( DistParam* pcDtParam )
1108	{
1109	if ( pcDtParam->bApplyWeight )
1110	{
1111	assert( pcDtParam->iCols == 64 );
1112	return TComRdCostWeightPrediction::xGetSSEw( pcDtParam );
1113	}
1114	const Pel* piOrg = pcDtParam->pOrg;
1115	const Pel* piCur = pcDtParam->pCur;
1116	Int iRows = pcDtParam->iRows;
1117	Int iStrideOrg = pcDtParam->iStrideOrg;
1118	Int iStrideCur = pcDtParam->iStrideCur;
1119
1120	Distortion uiSum = 0;
1121	UInt uiShift = DISTORTION_PRECISION_ADJUSTMENT((pcDtParam->bitDepth-8) << 1);
1122
1123	Intermediate_Int iTemp;
1124
1125	for( ; iRows != 0; iRows-- )
1126	{
1127	iTemp = piOrg[ 0] - piCur[ 0]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1128	iTemp = piOrg[ 1] - piCur[ 1]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1129	iTemp = piOrg[ 2] - piCur[ 2]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1130	iTemp = piOrg[ 3] - piCur[ 3]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1131	iTemp = piOrg[ 4] - piCur[ 4]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1132	iTemp = piOrg[ 5] - piCur[ 5]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1133	iTemp = piOrg[ 6] - piCur[ 6]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1134	iTemp = piOrg[ 7] - piCur[ 7]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1135	iTemp = piOrg[ 8] - piCur[ 8]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1136	iTemp = piOrg[ 9] - piCur[ 9]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1137	iTemp = piOrg[10] - piCur[10]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1138	iTemp = piOrg[11] - piCur[11]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1139	iTemp = piOrg[12] - piCur[12]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1140	iTemp = piOrg[13] - piCur[13]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1141	iTemp = piOrg[14] - piCur[14]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1142	iTemp = piOrg[15] - piCur[15]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1143	iTemp = piOrg[16] - piCur[16]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1144	iTemp = piOrg[17] - piCur[17]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1145	iTemp = piOrg[18] - piCur[18]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1146	iTemp = piOrg[19] - piCur[19]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1147	iTemp = piOrg[20] - piCur[20]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1148	iTemp = piOrg[21] - piCur[21]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1149	iTemp = piOrg[22] - piCur[22]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1150	iTemp = piOrg[23] - piCur[23]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1151	iTemp = piOrg[24] - piCur[24]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1152	iTemp = piOrg[25] - piCur[25]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1153	iTemp = piOrg[26] - piCur[26]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1154	iTemp = piOrg[27] - piCur[27]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1155	iTemp = piOrg[28] - piCur[28]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1156	iTemp = piOrg[29] - piCur[29]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1157	iTemp = piOrg[30] - piCur[30]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1158	iTemp = piOrg[31] - piCur[31]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1159	iTemp = piOrg[32] - piCur[32]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1160	iTemp = piOrg[33] - piCur[33]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1161	iTemp = piOrg[34] - piCur[34]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1162	iTemp = piOrg[35] - piCur[35]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1163	iTemp = piOrg[36] - piCur[36]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1164	iTemp = piOrg[37] - piCur[37]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1165	iTemp = piOrg[38] - piCur[38]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1166	iTemp = piOrg[39] - piCur[39]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1167	iTemp = piOrg[40] - piCur[40]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1168	iTemp = piOrg[41] - piCur[41]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1169	iTemp = piOrg[42] - piCur[42]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1170	iTemp = piOrg[43] - piCur[43]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1171	iTemp = piOrg[44] - piCur[44]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1172	iTemp = piOrg[45] - piCur[45]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1173	iTemp = piOrg[46] - piCur[46]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1174	iTemp = piOrg[47] - piCur[47]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1175	iTemp = piOrg[48] - piCur[48]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1176	iTemp = piOrg[49] - piCur[49]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1177	iTemp = piOrg[50] - piCur[50]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1178	iTemp = piOrg[51] - piCur[51]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1179	iTemp = piOrg[52] - piCur[52]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1180	iTemp = piOrg[53] - piCur[53]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1181	iTemp = piOrg[54] - piCur[54]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1182	iTemp = piOrg[55] - piCur[55]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1183	iTemp = piOrg[56] - piCur[56]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1184	iTemp = piOrg[57] - piCur[57]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1185	iTemp = piOrg[58] - piCur[58]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1186	iTemp = piOrg[59] - piCur[59]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1187	iTemp = piOrg[60] - piCur[60]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1188	iTemp = piOrg[61] - piCur[61]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1189	iTemp = piOrg[62] - piCur[62]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1190	iTemp = piOrg[63] - piCur[63]; uiSum += Distortion(( iTemp * iTemp ) >> uiShift);
1191
1192	piOrg += iStrideOrg;
1193	piCur += iStrideCur;
1194	}
1195
1196	return ( uiSum );
1197	}
1198
1199	// --------------------------------------------------------------------------------------------------------------------
1200	// HADAMARD with step (used in fractional search)
1201	// --------------------------------------------------------------------------------------------------------------------
1202
1203	Distortion TComRdCost::xCalcHADs2x2( const Pel piOrg, const Pel piCur, Int iStrideOrg, Int iStrideCur, Int iStep )
1204	{
1205	Distortion satd = 0;
1206	TCoeff diff[4], m[4];
1207	assert( iStep == 1 );
1208	diff[0] = piOrg[0 ] - piCur[0];
1209	diff[1] = piOrg[1 ] - piCur[1];
1210	diff[2] = piOrg[iStrideOrg ] - piCur[0 + iStrideCur];
1211	diff[3] = piOrg[iStrideOrg + 1] - piCur[1 + iStrideCur];
1212	m[0] = diff[0] + diff[2];
1213	m[1] = diff[1] + diff[3];
1214	m[2] = diff[0] - diff[2];
1215	m[3] = diff[1] - diff[3];
1216
1217	satd += abs(m[0] + m[1]);
1218	satd += abs(m[0] - m[1]);
1219	satd += abs(m[2] + m[3]);
1220	satd += abs(m[2] - m[3]);
1221
1222	return satd;
1223	}
1224
1225	Distortion TComRdCost::xCalcHADs4x4( const Pel piOrg, const Pel piCur, Int iStrideOrg, Int iStrideCur, Int iStep )
1226	{
1227	Int k;
1228	Distortion satd = 0;
1229	TCoeff diff[16], m[16], d[16];
1230
1231	assert( iStep == 1 );
1232	for( k = 0; k < 16; k+=4 )
1233	{
1234	diff[k+0] = piOrg[0] - piCur[0];
1235	diff[k+1] = piOrg[1] - piCur[1];
1236	diff[k+2] = piOrg[2] - piCur[2];
1237	diff[k+3] = piOrg[3] - piCur[3];
1238
1239	piCur += iStrideCur;
1240	piOrg += iStrideOrg;
1241	}
1242
1243	/===== hadamard transform =====/
1244	m[ 0] = diff[ 0] + diff[12];
1245	m[ 1] = diff[ 1] + diff[13];
1246	m[ 2] = diff[ 2] + diff[14];
1247	m[ 3] = diff[ 3] + diff[15];
1248	m[ 4] = diff[ 4] + diff[ 8];
1249	m[ 5] = diff[ 5] + diff[ 9];
1250	m[ 6] = diff[ 6] + diff[10];
1251	m[ 7] = diff[ 7] + diff[11];
1252	m[ 8] = diff[ 4] - diff[ 8];
1253	m[ 9] = diff[ 5] - diff[ 9];
1254	m[10] = diff[ 6] - diff[10];
1255	m[11] = diff[ 7] - diff[11];
1256	m[12] = diff[ 0] - diff[12];
1257	m[13] = diff[ 1] - diff[13];
1258	m[14] = diff[ 2] - diff[14];
1259	m[15] = diff[ 3] - diff[15];
1260
1261	d[ 0] = m[ 0] + m[ 4];
1262	d[ 1] = m[ 1] + m[ 5];
1263	d[ 2] = m[ 2] + m[ 6];
1264	d[ 3] = m[ 3] + m[ 7];
1265	d[ 4] = m[ 8] + m[12];
1266	d[ 5] = m[ 9] + m[13];
1267	d[ 6] = m[10] + m[14];
1268	d[ 7] = m[11] + m[15];
1269	d[ 8] = m[ 0] - m[ 4];
1270	d[ 9] = m[ 1] - m[ 5];
1271	d[10] = m[ 2] - m[ 6];
1272	d[11] = m[ 3] - m[ 7];
1273	d[12] = m[12] - m[ 8];
1274	d[13] = m[13] - m[ 9];
1275	d[14] = m[14] - m[10];
1276	d[15] = m[15] - m[11];
1277
1278	m[ 0] = d[ 0] + d[ 3];
1279	m[ 1] = d[ 1] + d[ 2];
1280	m[ 2] = d[ 1] - d[ 2];
1281	m[ 3] = d[ 0] - d[ 3];
1282	m[ 4] = d[ 4] + d[ 7];
1283	m[ 5] = d[ 5] + d[ 6];
1284	m[ 6] = d[ 5] - d[ 6];
1285	m[ 7] = d[ 4] - d[ 7];
1286	m[ 8] = d[ 8] + d[11];
1287	m[ 9] = d[ 9] + d[10];
1288	m[10] = d[ 9] - d[10];
1289	m[11] = d[ 8] - d[11];
1290	m[12] = d[12] + d[15];
1291	m[13] = d[13] + d[14];
1292	m[14] = d[13] - d[14];
1293	m[15] = d[12] - d[15];
1294
1295	d[ 0] = m[ 0] + m[ 1];
1296	d[ 1] = m[ 0] - m[ 1];
1297	d[ 2] = m[ 2] + m[ 3];
1298	d[ 3] = m[ 3] - m[ 2];
1299	d[ 4] = m[ 4] + m[ 5];
1300	d[ 5] = m[ 4] - m[ 5];
1301	d[ 6] = m[ 6] + m[ 7];
1302	d[ 7] = m[ 7] - m[ 6];
1303	d[ 8] = m[ 8] + m[ 9];
1304	d[ 9] = m[ 8] - m[ 9];
1305	d[10] = m[10] + m[11];
1306	d[11] = m[11] - m[10];
1307	d[12] = m[12] + m[13];
1308	d[13] = m[12] - m[13];
1309	d[14] = m[14] + m[15];
1310	d[15] = m[15] - m[14];
1311
1312	for (k=0; k<16; ++k)
1313	{
1314	satd += abs(d[k]);
1315	}
1316	satd = ((satd+1)>>1);
1317
1318	return satd;
1319	}
1320
1321	Distortion TComRdCost::xCalcHADs8x8( const Pel piOrg, const Pel piCur, Int iStrideOrg, Int iStrideCur, Int iStep )
1322	{
1323	Int k, i, j, jj;
1324	Distortion sad = 0;
1325	TCoeff diff[64], m1[8][8], m2[8][8], m3[8][8];
1326	assert( iStep == 1 );
1327	for( k = 0; k < 64; k += 8 )
1328	{
1329	diff[k+0] = piOrg[0] - piCur[0];
1330	diff[k+1] = piOrg[1] - piCur[1];
1331	diff[k+2] = piOrg[2] - piCur[2];
1332	diff[k+3] = piOrg[3] - piCur[3];
1333	diff[k+4] = piOrg[4] - piCur[4];
1334	diff[k+5] = piOrg[5] - piCur[5];
1335	diff[k+6] = piOrg[6] - piCur[6];
1336	diff[k+7] = piOrg[7] - piCur[7];
1337
1338	piCur += iStrideCur;
1339	piOrg += iStrideOrg;
1340	}
1341
1342	//horizontal
1343	for (j=0; j < 8; j++)
1344	{
1345	jj = j << 3;
1346	m2[j][0] = diff[jj ] + diff[jj+4];
1347	m2[j][1] = diff[jj+1] + diff[jj+5];
1348	m2[j][2] = diff[jj+2] + diff[jj+6];
1349	m2[j][3] = diff[jj+3] + diff[jj+7];
1350	m2[j][4] = diff[jj ] - diff[jj+4];
1351	m2[j][5] = diff[jj+1] - diff[jj+5];
1352	m2[j][6] = diff[jj+2] - diff[jj+6];
1353	m2[j][7] = diff[jj+3] - diff[jj+7];
1354
1355	m1[j][0] = m2[j][0] + m2[j][2];
1356	m1[j][1] = m2[j][1] + m2[j][3];
1357	m1[j][2] = m2[j][0] - m2[j][2];
1358	m1[j][3] = m2[j][1] - m2[j][3];
1359	m1[j][4] = m2[j][4] + m2[j][6];
1360	m1[j][5] = m2[j][5] + m2[j][7];
1361	m1[j][6] = m2[j][4] - m2[j][6];
1362	m1[j][7] = m2[j][5] - m2[j][7];
1363
1364	m2[j][0] = m1[j][0] + m1[j][1];
1365	m2[j][1] = m1[j][0] - m1[j][1];
1366	m2[j][2] = m1[j][2] + m1[j][3];
1367	m2[j][3] = m1[j][2] - m1[j][3];
1368	m2[j][4] = m1[j][4] + m1[j][5];
1369	m2[j][5] = m1[j][4] - m1[j][5];
1370	m2[j][6] = m1[j][6] + m1[j][7];
1371	m2[j][7] = m1[j][6] - m1[j][7];
1372	}
1373
1374	//vertical
1375	for (i=0; i < 8; i++)
1376	{
1377	m3[0][i] = m2[0][i] + m2[4][i];
1378	m3[1][i] = m2[1][i] + m2[5][i];
1379	m3[2][i] = m2[2][i] + m2[6][i];
1380	m3[3][i] = m2[3][i] + m2[7][i];
1381	m3[4][i] = m2[0][i] - m2[4][i];
1382	m3[5][i] = m2[1][i] - m2[5][i];
1383	m3[6][i] = m2[2][i] - m2[6][i];
1384	m3[7][i] = m2[3][i] - m2[7][i];
1385
1386	m1[0][i] = m3[0][i] + m3[2][i];
1387	m1[1][i] = m3[1][i] + m3[3][i];
1388	m1[2][i] = m3[0][i] - m3[2][i];
1389	m1[3][i] = m3[1][i] - m3[3][i];
1390	m1[4][i] = m3[4][i] + m3[6][i];
1391	m1[5][i] = m3[5][i] + m3[7][i];
1392	m1[6][i] = m3[4][i] - m3[6][i];
1393	m1[7][i] = m3[5][i] - m3[7][i];
1394
1395	m2[0][i] = m1[0][i] + m1[1][i];
1396	m2[1][i] = m1[0][i] - m1[1][i];
1397	m2[2][i] = m1[2][i] + m1[3][i];
1398	m2[3][i] = m1[2][i] - m1[3][i];
1399	m2[4][i] = m1[4][i] + m1[5][i];
1400	m2[5][i] = m1[4][i] - m1[5][i];
1401	m2[6][i] = m1[6][i] + m1[7][i];
1402	m2[7][i] = m1[6][i] - m1[7][i];
1403	}
1404
1405	for (i = 0; i < 8; i++)
1406	{
1407	for (j = 0; j < 8; j++)
1408	{
1409	sad += abs(m2[i][j]);
1410	}
1411	}
1412
1413	sad=((sad+2)>>2);
1414
1415	return sad;
1416	}
1417
1418
1419	Distortion TComRdCost::xGetHADs( DistParam* pcDtParam )
1420	{
1421	if ( pcDtParam->bApplyWeight )
1422	{
1423	return TComRdCostWeightPrediction::xGetHADsw( pcDtParam );
1424	}
1425	const Pel* piOrg = pcDtParam->pOrg;
1426	const Pel* piCur = pcDtParam->pCur;
1427	const Int iRows = pcDtParam->iRows;
1428	const Int iCols = pcDtParam->iCols;
1429	const Int iStrideCur = pcDtParam->iStrideCur;
1430	const Int iStrideOrg = pcDtParam->iStrideOrg;
1431	const Int iStep = pcDtParam->iStep;
1432
1433	Int x, y;
1434
1435	Distortion uiSum = 0;
1436
1437	if( ( iRows % 8 == 0) && (iCols % 8 == 0) )
1438	{
1439	Int iOffsetOrg = iStrideOrg<<3;
1440	Int iOffsetCur = iStrideCur<<3;
1441	for ( y=0; y<iRows; y+= 8 )
1442	{
1443	for ( x=0; x<iCols; x+= 8 )
1444	{
1445	uiSum += xCalcHADs8x8( &piOrg[x], &piCur[x*iStep], iStrideOrg, iStrideCur, iStep );
1446	}
1447	piOrg += iOffsetOrg;
1448	piCur += iOffsetCur;
1449	}
1450	}
1451	else if( ( iRows % 4 == 0) && (iCols % 4 == 0) )
1452	{
1453	Int iOffsetOrg = iStrideOrg<<2;
1454	Int iOffsetCur = iStrideCur<<2;
1455
1456	for ( y=0; y<iRows; y+= 4 )
1457	{
1458	for ( x=0; x<iCols; x+= 4 )
1459	{
1460	uiSum += xCalcHADs4x4( &piOrg[x], &piCur[x*iStep], iStrideOrg, iStrideCur, iStep );
1461	}
1462	piOrg += iOffsetOrg;
1463	piCur += iOffsetCur;
1464	}
1465	}
1466	else if( ( iRows % 2 == 0) && (iCols % 2 == 0) )
1467	{
1468	Int iOffsetOrg = iStrideOrg<<1;
1469	Int iOffsetCur = iStrideCur<<1;
1470	for ( y=0; y<iRows; y+=2 )
1471	{
1472	for ( x=0; x<iCols; x+=2 )
1473	{
1474	uiSum += xCalcHADs2x2( &piOrg[x], &piCur[x*iStep], iStrideOrg, iStrideCur, iStep );
1475	}
1476	piOrg += iOffsetOrg;
1477	piCur += iOffsetCur;
1478	}
1479	}
1480	else
1481	{
1482	assert(false);
1483	}
1484
1485	return ( uiSum >> DISTORTION_PRECISION_ADJUSTMENT(pcDtParam->bitDepth-8) );
1486	}
1487
1488	//! \}

Note: See TracBrowser for help on using the repository browser.

Download in other formats: