Update code

leiwen2025 · leiwen2025 · commit fbcf370e4793 · 2025-12-04T15:52:23.000+08:00
Signed-off-by: WenLei &lt;lei.wen2@zte.com.cn&gt;
diff --git a/igzip/riscv64/igzip_isal_adler32_rvv.S b/igzip/riscv64/igzip_isal_adler32_rvv.S
@@ -34,7 +34,7 @@ adler32_rvv:
   slli          t2, a0, 48
   srli          t2, t2, 48                           // t2: A = adler32 & 0xffff;
   srliw         t3, a0, 16                           // t3: B = adler32 >> 16;
-  beqz          a2, 4f
+  beqz          a2, 3f
 
   vsetvli       t0, a2, e64, m8, ta, ma
   vmv.v.i       v8, 0
@@ -69,6 +69,7 @@ unroll_loop_4x:
   vsub.vx       v12, v12, t1                         // len-vl, len-vl-1, len-vl-2
   vadd.vv       v8, v8, v28
   vwmaccu.vv    v16, v12, v28
+  sub           a2, a2, a4
   vzext.vf4     v4, v2
   vzext.vf4     v28, v3
   vsub.vx       v12, v12, t1
@@ -77,25 +78,24 @@ unroll_loop_4x:
   vsub.vx       v12, v12, t1
   vadd.vv       v8, v8, v28
   vwmaccu.vv    v16, v12, v28
-  sub           a2, a2, a4
   bge           a2, t0, unroll_loop_4x
 
 1:
-  beqz          a2, 3f
+  beqz          a2, 2f
 single:
   vsetvli       t1, a2, e8, m1, ta, ma
   vle8.v        v0, (a1)
   vsetvli       zero, zero, e32, m4, tu, ma
   vzext.vf4     v4, v0
-  vid.v         v12                                 // 0, 1, 2, .. vl-1
+  vid.v         v12                                  // 0, 1, 2, .. vl-1
   vadd.vv       v8, v8, v4
-  vrsub.vx      v12, v12, a2                        // len, len-1, len-2
-  vwmaccu.vv    v16, v12, v4                        // v16: B += weight * next
-  add           a1, a1, t1
+  vrsub.vx      v12, v12, a2                         // len, len-1, len-2
+  vwmaccu.vv    v16, v12, v4                         // v16: B += weight * next
   sub           a2, a2, t1
+  add           a1, a1, t1
   bnez          a2, single
 
-3:
+2:
   vsetvli       zero, t6, e32, m4, tu, ma
   vwredsumu.vs  v24, v8, v24
   mul           a7, t6, t2                           // B += A(init) * len
@@ -106,7 +106,7 @@ single:
   vmv.x.s       t2, v24                              // A = t2
   add           t3, t4, t3
 
-4:
+3:
   li            t0, 65521
   remu          t2, t2, t0                           // A = A % ADLER_MOD
   remu          t3, t3, t0                           // B = B % ADLER_MOD