2 years ago · bbe95f7353
--- a/libavcodec/x86/aacpsdsp.asm
+++ b/libavcodec/x86/aacpsdsp.asm
@@ -49,7 +49,7 @@ align 16
 
															     add  dstq, mmsize
														
 
															     add    nq, mmsize*2
														
 
															     jl .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 INIT_XMM sse
														
@@ -83,7 +83,7 @@ align 16
 
															     add   src2q, mmsize
														
 
															     add      nq, mmsize*2
														
 
															     jl .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 ;***********************************************************************
														
 
															 ;void ff_ps_stereo_interpolate_sse3(float (*l)[2], float (*r)[2],
														
@@ -116,7 +116,7 @@ align 16
 
															     movhps [rq+nq], m2
														
 
															     add      nq, 8
														
 
															     jl .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 ;***************************************************************************
														
 
															 ;void ps_stereo_interpolate_ipdopd_sse3(float (*l)[2], float (*r)[2],
														
@@ -164,7 +164,7 @@ align 16
 
															     movhps [rq+nq], m2
														
 
															     add      nq, 8
														
 
															     jl .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 ;**********************************************************
														
 
															 ;void ps_hybrid_analysis_ileave_sse(float out[2][38][64],
														
@@ -484,7 +484,7 @@ align 16
 
															     add    outq, strideq
														
 
															     add      nq, 64
														
 
															     jl .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 INIT_XMM sse
														
--- a/libavcodec/x86/ac3dsp.asm
+++ b/libavcodec/x86/ac3dsp.asm
@@ -60,7 +60,7 @@ cglobal ac3_exponent_min, 3, 4, 2, exp, reuse_blks, expn, offset
 
															     sub        expnq, mmsize
														
 
															     jg .nextexp
														
 
															 .end:
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 %define LOOP_ALIGN ALIGN 16
														
@@ -126,7 +126,7 @@ cglobal float_to_fixed24, 3, 3, 9, dst, src, len
 
															     sub      lenq, 16
														
 
															 %endif
														
 
															     ja .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 ;------------------------------------------------------------------------------
														
 
															 ; int ff_ac3_compute_mantissa_size(uint16_t mant_cnt[6][16])
														
@@ -220,7 +220,7 @@ cglobal ac3_extract_exponents, 3, 3, 4, exp, coef, len
 
															     add     lenq, 4
														
 
															     jl .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 %if HAVE_SSE2_EXTERNAL
														
--- a/libavcodec/x86/alacdsp.asm
+++ b/libavcodec/x86/alacdsp.asm
@@ -100,7 +100,7 @@ align 16
 
															     add     lenq, mmsize*2
														
 
															     jl .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %if ARCH_X86_64
														
 
															 cglobal alac_append_extra_bits_mono, 2, 5, 3, buf, exbuf, exbits, ch, len
														
@@ -130,4 +130,4 @@ align 16
 
															     add     lenq, mmsize*2
														
 
															     jl .loop
														
 
															-    REP_RET
														
 
															+    RET
														
--- a/libavcodec/x86/audiodsp.asm
+++ b/libavcodec/x86/audiodsp.asm
@@ -123,7 +123,7 @@ cglobal vector_clip_int32%5, 5,5,%1, dst, src, min, max, len
 
															     add     dstq, mmsize*4*(%2+%3)
														
 
															     sub     lend, mmsize*(%2+%3)
														
 
															     jg .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 INIT_XMM sse2
														
--- a/libavcodec/x86/dirac_dwt.asm
+++ b/libavcodec/x86/dirac_dwt.asm
@@ -75,7 +75,7 @@ cglobal vertical_compose53iL0_%1, 4,4,1, b0, b1, b2, width
 
															     COMPOSE_53iL0 m0, m1, [b2q+2*widthq], m2
														
 
															     mova    [b1q+2*widthq], m0
														
 
															     jg      .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 ; void vertical_compose_dirac53iH0(IDWTELEM *b0, IDWTELEM *b1, IDWTELEM *b2,
														
 
															 ;                                  int width)
														
@@ -93,7 +93,7 @@ cglobal vertical_compose_dirac53iH0_%1, 4,4,1, b0, b1, b2, width
 
															     paddw   m0, [b1q+2*widthq]
														
 
															     mova    [b1q+2*widthq], m0
														
 
															     jg      .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 ; void vertical_compose_dd97iH0(IDWTELEM *b0, IDWTELEM *b1, IDWTELEM *b2,
														
 
															 ;                               IDWTELEM *b3, IDWTELEM *b4, int width)
														
@@ -110,7 +110,7 @@ cglobal vertical_compose_dd97iH0_%1, 6,6,5, b0, b1, b2, b3, b4, width
 
															     COMPOSE_DD97iH0 [b2q+2*widthq], [b3q+2*widthq], [b4q+2*widthq]
														
 
															     mova    [b2q+2*widthq], m1
														
 
															     jg      .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 ; void vertical_compose_dd137iL0(IDWTELEM *b0, IDWTELEM *b1, IDWTELEM *b2,
														
 
															 ;                                IDWTELEM *b3, IDWTELEM *b4, int width)
														
@@ -139,7 +139,7 @@ cglobal vertical_compose_dd137iL0_%1, 6,6,6, b0, b1, b2, b3, b4, width
 
															     psubw   m5, m1
														
 
															     mova    [b2q+2*widthq], m5
														
 
															     jg      .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 ; void vertical_compose_haar(IDWTELEM *b0, IDWTELEM *b1, int width)
														
 
															 cglobal vertical_compose_haar_%1, 3,4,3, b0, b1, width
														
@@ -159,7 +159,7 @@ cglobal vertical_compose_haar_%1, 3,4,3, b0, b1, width
 
															     paddw   m2, m0
														
 
															     mova    [b1q+2*widthq], m2
														
 
															     jg      .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 ; extend the left and right edges of the tmp array by %1 and %2 respectively
														
@@ -225,7 +225,7 @@ cglobal horizontal_compose_haar%2i_%1, 3,6,4, b, tmp, w, x, w2, b_w2
 
															     cmp     xq, w2q
														
 
															     jl      .highpass_loop
														
 
															 .end:
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
@@ -290,7 +290,7 @@ cglobal horizontal_compose_dd97i_ssse3, 3,6,8, b, tmp, w, x, w2, b_w2
 
															     cmp     xd, w2d
														
 
															     jl      .highpass_loop
														
 
															 .end:
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 INIT_XMM
														
--- a/libavcodec/x86/fft.asm
+++ b/libavcodec/x86/fft.asm
@@ -475,7 +475,7 @@ cglobal fft_calc, 2,5,8
 
															     mov     r0, r1
														
 
															     mov     r1, r3
														
 
															     FFT_DISPATCH _interleave %+ SUFFIX, r1
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endif
														
@@ -510,7 +510,7 @@ cglobal fft_calc, 2,5,8
 
															     add      r2, mmsize*2
														
 
															     jl       .loop
														
 
															 .end:
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 cglobal fft_permute, 2,7,1
														
 
															     mov     r4,  [r0 + FFTContext.revtab]
														
@@ -543,7 +543,7 @@ cglobal fft_permute, 2,7,1
 
															     movaps  [r1 + r2 + 16], xmm1
														
 
															     add     r2, 32
														
 
															     jl      .loopcopy
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 INIT_XMM sse
														
 
															 cglobal imdct_calc, 3,5,3
														
@@ -583,7 +583,7 @@ cglobal imdct_calc, 3,5,3
 
															     sub     r3, mmsize
														
 
															     add     r2, mmsize
														
 
															     jl      .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %ifdef PIC
														
 
															 %define SECTION_REL - $$
														
--- a/libavcodec/x86/flacdsp.asm
+++ b/libavcodec/x86/flacdsp.asm
@@ -79,7 +79,7 @@ ALIGN 16
 
															     movd   [decodedq+4], m1
														
 
															     jg .loop_sample
														
 
															 .ret:
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 %if HAVE_XOP_EXTERNAL
														
@@ -133,7 +133,7 @@ align 16
 
															     mova [outq + lenq], m%2
														
 
															     add      lenq, 16
														
 
															     jl .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 INIT_XMM sse2
														
@@ -177,7 +177,7 @@ align 16
 
															     add      outq, mmsize*2
														
 
															     sub      lend, mmsize/4
														
 
															     jg .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 INIT_XMM sse2
														
@@ -302,7 +302,7 @@ align 16
 
															     add      outq, mmsize*REPCOUNT
														
 
															     sub      lend, mmsize/4
														
 
															     jg .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 INIT_XMM ssse3
														
--- a/libavcodec/x86/h264_chromamc.asm
+++ b/libavcodec/x86/h264_chromamc.asm
@@ -112,7 +112,7 @@ cglobal %1_%2_chroma_mc8%3, 6, 7 + extra_regs, 0
 
															     jne .at_least_one_non_zero
														
 
															     ; mx == 0 AND my == 0 - no filter needed
														
 
															     mv0_pixels_mc8
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 .at_least_one_non_zero:
														
 
															 %ifidn %2, rv40
														
@@ -192,7 +192,7 @@ cglobal %1_%2_chroma_mc8%3, 6, 7 + extra_regs, 0
 
															     add           r1, r2
														
 
															     dec           r3d
														
 
															     jne .next1drow
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 .both_non_zero: ; general case, bilinear
														
 
															     movd          m4, r4d         ; x
														
@@ -365,7 +365,7 @@ cglobal %1_%2_chroma_mc4, 6, 6 + extra_regs, 0
 
															     add           r0, r2
														
 
															     sub          r3d, 2
														
 
															     jnz .next2rows
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 %macro chroma_mc2_mmx_func 2
														
@@ -407,7 +407,7 @@ cglobal %1_%2_chroma_mc2, 6, 7, 0
 
															     add           r0, r2
														
 
															     sub          r3d, 1
														
 
															     jnz .nextrow
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 %define rnd_1d_h264 pw_4
														
@@ -453,7 +453,7 @@ cglobal %1_%2_chroma_mc8%3, 6, 7, 8
 
															     jne .at_least_one_non_zero
														
 
															     ; mx == 0 AND my == 0 - no filter needed
														
 
															     mv0_pixels_mc8
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 .at_least_one_non_zero:
														
 
															     test         r5d, r5d
														
@@ -514,7 +514,7 @@ cglobal %1_%2_chroma_mc8%3, 6, 7, 8
 
															     sub          r3d, 2
														
 
															     lea           r0, [r0+r2*2]
														
 
															     jg .next2rows
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 .my_is_zero:
														
 
															     mov          r5d, r4d
														
@@ -551,7 +551,7 @@ cglobal %1_%2_chroma_mc8%3, 6, 7, 8
 
															     lea           r0, [r0+r2*2]
														
 
															     lea           r1, [r1+r2*2]
														
 
															     jg .next2xrows
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 .mx_is_zero:
														
 
															     mov          r4d, r5d
														
@@ -588,7 +588,7 @@ cglobal %1_%2_chroma_mc8%3, 6, 7, 8
 
															     sub          r3d, 2
														
 
															     lea           r0, [r0+r2*2]
														
 
															     jg .next2yrows
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 %macro chroma_mc4_ssse3_func 2
														
@@ -638,7 +638,7 @@ cglobal %1_%2_chroma_mc4, 6, 7, 0
 
															     sub          r3d, 2
														
 
															     lea           r0, [r0+r2*2]
														
 
															     jg .next2rows
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 %define CHROMAMC_AVG NOTHING
														
--- a/libavcodec/x86/h264_chromamc_10bit.asm
+++ b/libavcodec/x86/h264_chromamc_10bit.asm
@@ -67,7 +67,7 @@ cglobal %1_h264_chroma_mc8_10, 6,7,8
 
															     jne .at_least_one_non_zero
														
 
															     ; mx == 0 AND my == 0 - no filter needed
														
 
															     MV0_PIXELS_MC8
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 .at_least_one_non_zero:
														
 
															     mov          r6d, 2
														
@@ -102,7 +102,7 @@ cglobal %1_h264_chroma_mc8_10, 6,7,8
 
															     add           r1, r2
														
 
															     dec           r3d
														
 
															     jne .next1drow
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 .xy_interpolation: ; general case, bilinear
														
 
															     movd          m4, r4m         ; x
														
@@ -144,7 +144,7 @@ cglobal %1_h264_chroma_mc8_10, 6,7,8
 
															     add           r0, r2
														
 
															     dec          r3d
														
 
															     jne .next2drow
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 ;-----------------------------------------------------------------------------
														
@@ -194,7 +194,7 @@ cglobal %1_h264_chroma_mc4_10, 6,6,7
 
															     MC4_OP m6, m0
														
 
															     sub   r3d, 2
														
 
															     jnz .next2rows
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 ;-----------------------------------------------------------------------------
														
@@ -234,7 +234,7 @@ cglobal %1_h264_chroma_mc2_10, 6,7
 
															     add           r0, r2
														
 
															     dec          r3d
														
 
															     jnz .nextrow
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 %macro NOTHING 2-3
														
--- a/libavcodec/x86/h264_deblock_10bit.asm
+++ b/libavcodec/x86/h264_deblock_10bit.asm
@@ -372,7 +372,7 @@ cglobal deblock_v_luma_10, 5,5,15
 
															     add         r4, 2
														
 
															     dec         r3
														
 
															     jg .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 cglobal deblock_h_luma_10, 5,7,15
														
 
															     shl        r2d, 2
														
@@ -411,7 +411,7 @@ cglobal deblock_h_luma_10, 5,7,15
 
															     lea         r5, [r5+r1*8]
														
 
															     dec         r6
														
 
															     jg .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 %endmacro
														
 
															 INIT_XMM sse2
														
@@ -648,7 +648,7 @@ cglobal deblock_v_luma_intra_10, 4,7,16
 
															     add     r4, mmsize
														
 
															     dec     r6
														
 
															     jg .loop
														
 
															-    REP_RET
														
 
															+    RET
														
 
															 ;-----------------------------------------------------------------------------
														
 
															 ; void ff_deblock_h_luma_intra_10(uint16_t *pix, int stride, int alpha,