1 | // Copyright (c) 2017, the HRSS authors. |
2 | // |
3 | // Permission to use, copy, modify, and/or distribute this software for any |
4 | // purpose with or without fee is hereby granted, provided that the above |
5 | // copyright notice and this permission notice appear in all copies. |
6 | // |
7 | // THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES |
8 | // WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF |
9 | // MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY |
10 | // SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES |
11 | // WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN ACTION |
12 | // OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF OR IN |
13 | // CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE. |
14 | |
15 | #if !defined(OPENSSL_NO_ASM) && !defined(OPENSSL_SMALL) && defined(__linux__) |
16 | |
17 | // This is the polynomial multiplication function from [HRSS], provided by kind |
18 | // permission of the authors. |
19 | // |
20 | // HRSS: https://eprint.iacr.org/2017/1005 |
21 | |
22 | # This file was generated by poly_rq_mul.py |
23 | .text |
24 | .align 32 |
25 | mask_low9words: |
26 | .word 0xffff |
27 | .word 0xffff |
28 | .word 0xffff |
29 | .word 0xffff |
30 | .word 0xffff |
31 | .word 0xffff |
32 | .word 0xffff |
33 | .word 0xffff |
34 | .word 0xffff |
35 | .word 0x0 |
36 | .word 0x0 |
37 | .word 0x0 |
38 | .word 0x0 |
39 | .word 0x0 |
40 | .word 0x0 |
41 | .word 0x0 |
42 | const3: |
43 | .word 3 |
44 | .word 3 |
45 | .word 3 |
46 | .word 3 |
47 | .word 3 |
48 | .word 3 |
49 | .word 3 |
50 | .word 3 |
51 | .word 3 |
52 | .word 3 |
53 | .word 3 |
54 | .word 3 |
55 | .word 3 |
56 | .word 3 |
57 | .word 3 |
58 | .word 3 |
59 | const9: |
60 | .word 9 |
61 | .word 9 |
62 | .word 9 |
63 | .word 9 |
64 | .word 9 |
65 | .word 9 |
66 | .word 9 |
67 | .word 9 |
68 | .word 9 |
69 | .word 9 |
70 | .word 9 |
71 | .word 9 |
72 | .word 9 |
73 | .word 9 |
74 | .word 9 |
75 | .word 9 |
76 | const0: |
77 | .word 0 |
78 | .word 0 |
79 | .word 0 |
80 | .word 0 |
81 | .word 0 |
82 | .word 0 |
83 | .word 0 |
84 | .word 0 |
85 | .word 0 |
86 | .word 0 |
87 | .word 0 |
88 | .word 0 |
89 | .word 0 |
90 | .word 0 |
91 | .word 0 |
92 | .word 0 |
93 | const729: |
94 | .word 729 |
95 | .word 729 |
96 | .word 729 |
97 | .word 729 |
98 | .word 729 |
99 | .word 729 |
100 | .word 729 |
101 | .word 729 |
102 | .word 729 |
103 | .word 729 |
104 | .word 729 |
105 | .word 729 |
106 | .word 729 |
107 | .word 729 |
108 | .word 729 |
109 | .word 729 |
110 | const3_inv: |
111 | .word 43691 |
112 | .word 43691 |
113 | .word 43691 |
114 | .word 43691 |
115 | .word 43691 |
116 | .word 43691 |
117 | .word 43691 |
118 | .word 43691 |
119 | .word 43691 |
120 | .word 43691 |
121 | .word 43691 |
122 | .word 43691 |
123 | .word 43691 |
124 | .word 43691 |
125 | .word 43691 |
126 | .word 43691 |
127 | const5_inv: |
128 | .word 52429 |
129 | .word 52429 |
130 | .word 52429 |
131 | .word 52429 |
132 | .word 52429 |
133 | .word 52429 |
134 | .word 52429 |
135 | .word 52429 |
136 | .word 52429 |
137 | .word 52429 |
138 | .word 52429 |
139 | .word 52429 |
140 | .word 52429 |
141 | .word 52429 |
142 | .word 52429 |
143 | .word 52429 |
144 | shuf48_16: |
145 | .byte 10 |
146 | .byte 11 |
147 | .byte 12 |
148 | .byte 13 |
149 | .byte 14 |
150 | .byte 15 |
151 | .byte 0 |
152 | .byte 1 |
153 | .byte 2 |
154 | .byte 3 |
155 | .byte 4 |
156 | .byte 5 |
157 | .byte 6 |
158 | .byte 7 |
159 | .byte 8 |
160 | .byte 9 |
161 | .byte 10 |
162 | .byte 11 |
163 | .byte 12 |
164 | .byte 13 |
165 | .byte 14 |
166 | .byte 15 |
167 | .byte 0 |
168 | .byte 1 |
169 | .byte 2 |
170 | .byte 3 |
171 | .byte 4 |
172 | .byte 5 |
173 | .byte 6 |
174 | .byte 7 |
175 | .byte 8 |
176 | .byte 9 |
177 | shufmin1_mask3: |
178 | .byte 2 |
179 | .byte 3 |
180 | .byte 4 |
181 | .byte 5 |
182 | .byte 6 |
183 | .byte 7 |
184 | .byte 255 |
185 | .byte 255 |
186 | .byte 255 |
187 | .byte 255 |
188 | .byte 255 |
189 | .byte 255 |
190 | .byte 255 |
191 | .byte 255 |
192 | .byte 255 |
193 | .byte 255 |
194 | .byte 255 |
195 | .byte 255 |
196 | .byte 255 |
197 | .byte 255 |
198 | .byte 255 |
199 | .byte 255 |
200 | .byte 255 |
201 | .byte 255 |
202 | .byte 255 |
203 | .byte 255 |
204 | .byte 255 |
205 | .byte 255 |
206 | .byte 255 |
207 | .byte 255 |
208 | .byte 255 |
209 | .byte 255 |
210 | mask32_to_16: |
211 | .word 0xffff |
212 | .word 0x0 |
213 | .word 0xffff |
214 | .word 0x0 |
215 | .word 0xffff |
216 | .word 0x0 |
217 | .word 0xffff |
218 | .word 0x0 |
219 | .word 0xffff |
220 | .word 0x0 |
221 | .word 0xffff |
222 | .word 0x0 |
223 | .word 0xffff |
224 | .word 0x0 |
225 | .word 0xffff |
226 | .word 0x0 |
227 | mask5_3_5_3: |
228 | .word 0 |
229 | .word 0 |
230 | .word 0 |
231 | .word 65535 |
232 | .word 65535 |
233 | .word 65535 |
234 | .word 65535 |
235 | .word 65535 |
236 | .word 0 |
237 | .word 0 |
238 | .word 0 |
239 | .word 65535 |
240 | .word 65535 |
241 | .word 65535 |
242 | .word 65535 |
243 | .word 65535 |
244 | mask3_5_3_5: |
245 | .word 65535 |
246 | .word 65535 |
247 | .word 65535 |
248 | .word 0 |
249 | .word 0 |
250 | .word 0 |
251 | .word 0 |
252 | .word 0 |
253 | .word 65535 |
254 | .word 65535 |
255 | .word 65535 |
256 | .word 0 |
257 | .word 0 |
258 | .word 0 |
259 | .word 0 |
260 | .word 0 |
261 | mask3_5_4_3_1: |
262 | .word 65535 |
263 | .word 65535 |
264 | .word 65535 |
265 | .word 0 |
266 | .word 0 |
267 | .word 0 |
268 | .word 0 |
269 | .word 0 |
270 | .word 0 |
271 | .word 0 |
272 | .word 0 |
273 | .word 0 |
274 | .word 65535 |
275 | .word 65535 |
276 | .word 65535 |
277 | .word 0 |
278 | mask_keephigh: |
279 | .word 0 |
280 | .word 0 |
281 | .word 0 |
282 | .word 0 |
283 | .word 0 |
284 | .word 0 |
285 | .word 0 |
286 | .word 0 |
287 | .word 65535 |
288 | .word 65535 |
289 | .word 65535 |
290 | .word 65535 |
291 | .word 65535 |
292 | .word 65535 |
293 | .word 65535 |
294 | .word 65535 |
295 | mask_mod8192: |
296 | .word 8191 |
297 | .word 8191 |
298 | .word 8191 |
299 | .word 8191 |
300 | .word 8191 |
301 | .word 8191 |
302 | .word 8191 |
303 | .word 8191 |
304 | .word 8191 |
305 | .word 8191 |
306 | .word 8191 |
307 | .word 8191 |
308 | .word 8191 |
309 | .word 8191 |
310 | .word 8191 |
311 | .word 8191 |
312 | .text |
313 | .global poly_Rq_mul |
314 | .hidden poly_Rq_mul |
315 | .type poly_Rq_mul, @function |
316 | .att_syntax prefix |
317 | poly_Rq_mul: |
318 | .cfi_startproc |
319 | push %rbp |
320 | .cfi_adjust_cfa_offset 8 |
321 | .cfi_offset rbp, -16 |
322 | movq %rsp, %rbp |
323 | .cfi_def_cfa_register rbp |
324 | push %r12 |
325 | .cfi_offset r12, -24 |
326 | mov %rsp, %r8 |
327 | andq $-32, %rsp |
328 | subq $6144, %rsp |
329 | mov %rsp, %rax |
330 | subq $6144, %rsp |
331 | mov %rsp, %r11 |
332 | subq $12288, %rsp |
333 | mov %rsp, %r12 |
334 | subq $512, %rsp |
335 | vmovdqa const3(%rip), %ymm3 |
336 | vmovdqu 0(%rsi), %ymm0 |
337 | vmovdqu 88(%rsi), %ymm1 |
338 | vmovdqu 176(%rsi), %ymm2 |
339 | vmovdqu 264(%rsi), %ymm12 |
340 | vmovdqu 1056(%rsi), %ymm4 |
341 | vmovdqu 1144(%rsi), %ymm5 |
342 | vmovdqu 1232(%rsi), %ymm6 |
343 | vmovdqu 1320(%rsi), %ymm7 |
344 | vmovdqu 352(%rsi), %ymm8 |
345 | vmovdqu 440(%rsi), %ymm9 |
346 | vmovdqu 528(%rsi), %ymm10 |
347 | vmovdqu 616(%rsi), %ymm11 |
348 | vmovdqa %ymm0, 0(%rax) |
349 | vmovdqa %ymm1, 96(%rax) |
350 | vpaddw %ymm0, %ymm1, %ymm14 |
351 | vmovdqa %ymm14, 192(%rax) |
352 | vmovdqa %ymm2, 288(%rax) |
353 | vmovdqa %ymm12, 384(%rax) |
354 | vpaddw %ymm2, %ymm12, %ymm14 |
355 | vmovdqa %ymm14, 480(%rax) |
356 | vpaddw %ymm0, %ymm2, %ymm14 |
357 | vmovdqa %ymm14, 576(%rax) |
358 | vpaddw %ymm1, %ymm12, %ymm15 |
359 | vmovdqa %ymm15, 672(%rax) |
360 | vpaddw %ymm14, %ymm15, %ymm14 |
361 | vmovdqa %ymm14, 768(%rax) |
362 | vmovdqa %ymm4, 5184(%rax) |
363 | vmovdqa %ymm5, 5280(%rax) |
364 | vpaddw %ymm4, %ymm5, %ymm14 |
365 | vmovdqa %ymm14, 5376(%rax) |
366 | vmovdqa %ymm6, 5472(%rax) |
367 | vmovdqa %ymm7, 5568(%rax) |
368 | vpaddw %ymm6, %ymm7, %ymm14 |
369 | vmovdqa %ymm14, 5664(%rax) |
370 | vpaddw %ymm4, %ymm6, %ymm14 |
371 | vmovdqa %ymm14, 5760(%rax) |
372 | vpaddw %ymm5, %ymm7, %ymm15 |
373 | vmovdqa %ymm15, 5856(%rax) |
374 | vpaddw %ymm14, %ymm15, %ymm14 |
375 | vmovdqa %ymm14, 5952(%rax) |
376 | vmovdqa %ymm0, 0(%rsp) |
377 | vmovdqa %ymm1, 32(%rsp) |
378 | vmovdqa %ymm2, 64(%rsp) |
379 | vmovdqa %ymm12, 96(%rsp) |
380 | vmovdqa %ymm8, 128(%rsp) |
381 | vmovdqa %ymm9, 160(%rsp) |
382 | vmovdqa %ymm10, 192(%rsp) |
383 | vmovdqa %ymm11, 224(%rsp) |
384 | vmovdqu 704(%rsi), %ymm0 |
385 | vpaddw 0(%rsp), %ymm0, %ymm1 |
386 | vpaddw 128(%rsp), %ymm4, %ymm2 |
387 | vpaddw %ymm2, %ymm1, %ymm8 |
388 | vpsubw %ymm2, %ymm1, %ymm12 |
389 | vmovdqa %ymm0, 256(%rsp) |
390 | vmovdqu 792(%rsi), %ymm0 |
391 | vpaddw 32(%rsp), %ymm0, %ymm1 |
392 | vpaddw 160(%rsp), %ymm5, %ymm2 |
393 | vpaddw %ymm2, %ymm1, %ymm9 |
394 | vpsubw %ymm2, %ymm1, %ymm13 |
395 | vmovdqa %ymm0, 288(%rsp) |
396 | vmovdqu 880(%rsi), %ymm0 |
397 | vpaddw 64(%rsp), %ymm0, %ymm1 |
398 | vpaddw 192(%rsp), %ymm6, %ymm2 |
399 | vpaddw %ymm2, %ymm1, %ymm10 |
400 | vpsubw %ymm2, %ymm1, %ymm14 |
401 | vmovdqa %ymm0, 320(%rsp) |
402 | vmovdqu 968(%rsi), %ymm0 |
403 | vpaddw 96(%rsp), %ymm0, %ymm1 |
404 | vpaddw 224(%rsp), %ymm7, %ymm2 |
405 | vpaddw %ymm2, %ymm1, %ymm11 |
406 | vpsubw %ymm2, %ymm1, %ymm15 |
407 | vmovdqa %ymm0, 352(%rsp) |
408 | vmovdqa %ymm8, 864(%rax) |
409 | vmovdqa %ymm9, 960(%rax) |
410 | vpaddw %ymm8, %ymm9, %ymm0 |
411 | vmovdqa %ymm0, 1056(%rax) |
412 | vmovdqa %ymm10, 1152(%rax) |
413 | vmovdqa %ymm11, 1248(%rax) |
414 | vpaddw %ymm10, %ymm11, %ymm0 |
415 | vmovdqa %ymm0, 1344(%rax) |
416 | vpaddw %ymm8, %ymm10, %ymm0 |
417 | vmovdqa %ymm0, 1440(%rax) |
418 | vpaddw %ymm9, %ymm11, %ymm1 |
419 | vmovdqa %ymm1, 1536(%rax) |
420 | vpaddw %ymm0, %ymm1, %ymm0 |
421 | vmovdqa %ymm0, 1632(%rax) |
422 | vmovdqa %ymm12, 1728(%rax) |
423 | vmovdqa %ymm13, 1824(%rax) |
424 | vpaddw %ymm12, %ymm13, %ymm0 |
425 | vmovdqa %ymm0, 1920(%rax) |
426 | vmovdqa %ymm14, 2016(%rax) |
427 | vmovdqa %ymm15, 2112(%rax) |
428 | vpaddw %ymm14, %ymm15, %ymm0 |
429 | vmovdqa %ymm0, 2208(%rax) |
430 | vpaddw %ymm12, %ymm14, %ymm0 |
431 | vmovdqa %ymm0, 2304(%rax) |
432 | vpaddw %ymm13, %ymm15, %ymm1 |
433 | vmovdqa %ymm1, 2400(%rax) |
434 | vpaddw %ymm0, %ymm1, %ymm0 |
435 | vmovdqa %ymm0, 2496(%rax) |
436 | vmovdqa 256(%rsp), %ymm0 |
437 | vpsllw $2, %ymm0, %ymm0 |
438 | vpaddw 0(%rsp), %ymm0, %ymm0 |
439 | vpsllw $2, %ymm4, %ymm1 |
440 | vpaddw 128(%rsp), %ymm1, %ymm1 |
441 | vpsllw $1, %ymm1, %ymm1 |
442 | vpaddw %ymm1, %ymm0, %ymm8 |
443 | vpsubw %ymm1, %ymm0, %ymm12 |
444 | vmovdqa 288(%rsp), %ymm0 |
445 | vpsllw $2, %ymm0, %ymm0 |
446 | vpaddw 32(%rsp), %ymm0, %ymm0 |
447 | vpsllw $2, %ymm5, %ymm1 |
448 | vpaddw 160(%rsp), %ymm1, %ymm1 |
449 | vpsllw $1, %ymm1, %ymm1 |
450 | vpaddw %ymm1, %ymm0, %ymm9 |
451 | vpsubw %ymm1, %ymm0, %ymm13 |
452 | vmovdqa 320(%rsp), %ymm0 |
453 | vpsllw $2, %ymm0, %ymm0 |
454 | vpaddw 64(%rsp), %ymm0, %ymm0 |
455 | vpsllw $2, %ymm6, %ymm1 |
456 | vpaddw 192(%rsp), %ymm1, %ymm1 |
457 | vpsllw $1, %ymm1, %ymm1 |
458 | vpaddw %ymm1, %ymm0, %ymm10 |
459 | vpsubw %ymm1, %ymm0, %ymm14 |
460 | vmovdqa 352(%rsp), %ymm0 |
461 | vpsllw $2, %ymm0, %ymm0 |
462 | vpaddw 96(%rsp), %ymm0, %ymm0 |
463 | vpsllw $2, %ymm7, %ymm1 |
464 | vpaddw 224(%rsp), %ymm1, %ymm1 |
465 | vpsllw $1, %ymm1, %ymm1 |
466 | vpaddw %ymm1, %ymm0, %ymm11 |
467 | vpsubw %ymm1, %ymm0, %ymm15 |
468 | vmovdqa %ymm8, 2592(%rax) |
469 | vmovdqa %ymm9, 2688(%rax) |
470 | vpaddw %ymm8, %ymm9, %ymm0 |
471 | vmovdqa %ymm0, 2784(%rax) |
472 | vmovdqa %ymm10, 2880(%rax) |
473 | vmovdqa %ymm11, 2976(%rax) |
474 | vpaddw %ymm10, %ymm11, %ymm0 |
475 | vmovdqa %ymm0, 3072(%rax) |
476 | vpaddw %ymm8, %ymm10, %ymm0 |
477 | vmovdqa %ymm0, 3168(%rax) |
478 | vpaddw %ymm9, %ymm11, %ymm1 |
479 | vmovdqa %ymm1, 3264(%rax) |
480 | vpaddw %ymm0, %ymm1, %ymm0 |
481 | vmovdqa %ymm0, 3360(%rax) |
482 | vmovdqa %ymm12, 3456(%rax) |
483 | vmovdqa %ymm13, 3552(%rax) |
484 | vpaddw %ymm12, %ymm13, %ymm0 |
485 | vmovdqa %ymm0, 3648(%rax) |
486 | vmovdqa %ymm14, 3744(%rax) |
487 | vmovdqa %ymm15, 3840(%rax) |
488 | vpaddw %ymm14, %ymm15, %ymm0 |
489 | vmovdqa %ymm0, 3936(%rax) |
490 | vpaddw %ymm12, %ymm14, %ymm0 |
491 | vmovdqa %ymm0, 4032(%rax) |
492 | vpaddw %ymm13, %ymm15, %ymm1 |
493 | vmovdqa %ymm1, 4128(%rax) |
494 | vpaddw %ymm0, %ymm1, %ymm0 |
495 | vmovdqa %ymm0, 4224(%rax) |
496 | vpmullw %ymm3, %ymm4, %ymm0 |
497 | vpaddw 256(%rsp), %ymm0, %ymm0 |
498 | vpmullw %ymm3, %ymm0, %ymm0 |
499 | vpaddw 128(%rsp), %ymm0, %ymm0 |
500 | vpmullw %ymm3, %ymm0, %ymm0 |
501 | vpaddw 0(%rsp), %ymm0, %ymm12 |
502 | vpmullw %ymm3, %ymm5, %ymm0 |
503 | vpaddw 288(%rsp), %ymm0, %ymm0 |
504 | vpmullw %ymm3, %ymm0, %ymm0 |
505 | vpaddw 160(%rsp), %ymm0, %ymm0 |
506 | vpmullw %ymm3, %ymm0, %ymm0 |
507 | vpaddw 32(%rsp), %ymm0, %ymm13 |
508 | vpmullw %ymm3, %ymm6, %ymm0 |
509 | vpaddw 320(%rsp), %ymm0, %ymm0 |
510 | vpmullw %ymm3, %ymm0, %ymm0 |
511 | vpaddw 192(%rsp), %ymm0, %ymm0 |
512 | vpmullw %ymm3, %ymm0, %ymm0 |
513 | vpaddw 64(%rsp), %ymm0, %ymm14 |
514 | vpmullw %ymm3, %ymm7, %ymm0 |
515 | vpaddw 352(%rsp), %ymm0, %ymm0 |
516 | vpmullw %ymm3, %ymm0, %ymm0 |
517 | vpaddw 224(%rsp), %ymm0, %ymm0 |
518 | vpmullw %ymm3, %ymm0, %ymm0 |
519 | vpaddw 96(%rsp), %ymm0, %ymm15 |
520 | vmovdqa %ymm12, 4320(%rax) |
521 | vmovdqa %ymm13, 4416(%rax) |
522 | vpaddw %ymm12, %ymm13, %ymm0 |
523 | vmovdqa %ymm0, 4512(%rax) |
524 | vmovdqa %ymm14, 4608(%rax) |
525 | vmovdqa %ymm15, 4704(%rax) |
526 | vpaddw %ymm14, %ymm15, %ymm0 |
527 | vmovdqa %ymm0, 4800(%rax) |
528 | vpaddw %ymm12, %ymm14, %ymm0 |
529 | vmovdqa %ymm0, 4896(%rax) |
530 | vpaddw %ymm13, %ymm15, %ymm1 |
531 | vmovdqa %ymm1, 4992(%rax) |
532 | vpaddw %ymm0, %ymm1, %ymm0 |
533 | vmovdqa %ymm0, 5088(%rax) |
534 | vmovdqu 32(%rsi), %ymm0 |
535 | vmovdqu 120(%rsi), %ymm1 |
536 | vmovdqu 208(%rsi), %ymm2 |
537 | vmovdqu 296(%rsi), %ymm12 |
538 | vmovdqu 1088(%rsi), %ymm4 |
539 | vmovdqu 1176(%rsi), %ymm5 |
540 | vmovdqu 1264(%rsi), %ymm6 |
541 | vmovdqu 1352(%rsi), %ymm7 |
542 | vmovdqu 384(%rsi), %ymm8 |
543 | vmovdqu 472(%rsi), %ymm9 |
544 | vmovdqu 560(%rsi), %ymm10 |
545 | vmovdqu 648(%rsi), %ymm11 |
546 | vmovdqa %ymm0, 32(%rax) |
547 | vmovdqa %ymm1, 128(%rax) |
548 | vpaddw %ymm0, %ymm1, %ymm14 |
549 | vmovdqa %ymm14, 224(%rax) |
550 | vmovdqa %ymm2, 320(%rax) |
551 | vmovdqa %ymm12, 416(%rax) |
552 | vpaddw %ymm2, %ymm12, %ymm14 |
553 | vmovdqa %ymm14, 512(%rax) |
554 | vpaddw %ymm0, %ymm2, %ymm14 |
555 | vmovdqa %ymm14, 608(%rax) |
556 | vpaddw %ymm1, %ymm12, %ymm15 |
557 | vmovdqa %ymm15, 704(%rax) |
558 | vpaddw %ymm14, %ymm15, %ymm14 |
559 | vmovdqa %ymm14, 800(%rax) |
560 | vmovdqa %ymm4, 5216(%rax) |
561 | vmovdqa %ymm5, 5312(%rax) |
562 | vpaddw %ymm4, %ymm5, %ymm14 |
563 | vmovdqa %ymm14, 5408(%rax) |
564 | vmovdqa %ymm6, 5504(%rax) |
565 | vmovdqa %ymm7, 5600(%rax) |
566 | vpaddw %ymm6, %ymm7, %ymm14 |
567 | vmovdqa %ymm14, 5696(%rax) |
568 | vpaddw %ymm4, %ymm6, %ymm14 |
569 | vmovdqa %ymm14, 5792(%rax) |
570 | vpaddw %ymm5, %ymm7, %ymm15 |
571 | vmovdqa %ymm15, 5888(%rax) |
572 | vpaddw %ymm14, %ymm15, %ymm14 |
573 | vmovdqa %ymm14, 5984(%rax) |
574 | vmovdqa %ymm0, 0(%rsp) |
575 | vmovdqa %ymm1, 32(%rsp) |
576 | vmovdqa %ymm2, 64(%rsp) |
577 | vmovdqa %ymm12, 96(%rsp) |
578 | vmovdqa %ymm8, 128(%rsp) |
579 | vmovdqa %ymm9, 160(%rsp) |
580 | vmovdqa %ymm10, 192(%rsp) |
581 | vmovdqa %ymm11, 224(%rsp) |
582 | vmovdqu 736(%rsi), %ymm0 |
583 | vpaddw 0(%rsp), %ymm0, %ymm1 |
584 | vpaddw 128(%rsp), %ymm4, %ymm2 |
585 | vpaddw %ymm2, %ymm1, %ymm8 |
586 | vpsubw %ymm2, %ymm1, %ymm12 |
587 | vmovdqa %ymm0, 256(%rsp) |
588 | vmovdqu 824(%rsi), %ymm0 |
589 | vpaddw 32(%rsp), %ymm0, %ymm1 |
590 | vpaddw 160(%rsp), %ymm5, %ymm2 |
591 | vpaddw %ymm2, %ymm1, %ymm9 |
592 | vpsubw %ymm2, %ymm1, %ymm13 |
593 | vmovdqa %ymm0, 288(%rsp) |
594 | vmovdqu 912(%rsi), %ymm0 |
595 | vpaddw 64(%rsp), %ymm0, %ymm1 |
596 | vpaddw 192(%rsp), %ymm6, %ymm2 |
597 | vpaddw %ymm2, %ymm1, %ymm10 |
598 | vpsubw %ymm2, %ymm1, %ymm14 |
599 | vmovdqa %ymm0, 320(%rsp) |
600 | vmovdqu 1000(%rsi), %ymm0 |
601 | vpaddw 96(%rsp), %ymm0, %ymm1 |
602 | vpaddw 224(%rsp), %ymm7, %ymm2 |
603 | vpaddw %ymm2, %ymm1, %ymm11 |
604 | vpsubw %ymm2, %ymm1, %ymm15 |
605 | vmovdqa %ymm0, 352(%rsp) |
606 | vmovdqa %ymm8, 896(%rax) |
607 | vmovdqa %ymm9, 992(%rax) |
608 | vpaddw %ymm8, %ymm9, %ymm0 |
609 | vmovdqa %ymm0, 1088(%rax) |
610 | vmovdqa %ymm10, 1184(%rax) |
611 | vmovdqa %ymm11, 1280(%rax) |
612 | vpaddw %ymm10, %ymm11, %ymm0 |
613 | vmovdqa %ymm0, 1376(%rax) |
614 | vpaddw %ymm8, %ymm10, %ymm0 |
615 | vmovdqa %ymm0, 1472(%rax) |
616 | vpaddw %ymm9, %ymm11, %ymm1 |
617 | vmovdqa %ymm1, 1568(%rax) |
618 | vpaddw %ymm0, %ymm1, %ymm0 |
619 | vmovdqa %ymm0, 1664(%rax) |
620 | vmovdqa %ymm12, 1760(%rax) |
621 | vmovdqa %ymm13, 1856(%rax) |
622 | vpaddw %ymm12, %ymm13, %ymm0 |
623 | vmovdqa %ymm0, 1952(%rax) |
624 | vmovdqa %ymm14, 2048(%rax) |
625 | vmovdqa %ymm15, 2144(%rax) |
626 | vpaddw %ymm14, %ymm15, %ymm0 |
627 | vmovdqa %ymm0, 2240(%rax) |
628 | vpaddw %ymm12, %ymm14, %ymm0 |
629 | vmovdqa %ymm0, 2336(%rax) |
630 | vpaddw %ymm13, %ymm15, %ymm1 |
631 | vmovdqa %ymm1, 2432(%rax) |
632 | vpaddw %ymm0, %ymm1, %ymm0 |
633 | vmovdqa %ymm0, 2528(%rax) |
634 | vmovdqa 256(%rsp), %ymm0 |
635 | vpsllw $2, %ymm0, %ymm0 |
636 | vpaddw 0(%rsp), %ymm0, %ymm0 |
637 | vpsllw $2, %ymm4, %ymm1 |
638 | vpaddw 128(%rsp), %ymm1, %ymm1 |
639 | vpsllw $1, %ymm1, %ymm1 |
640 | vpaddw %ymm1, %ymm0, %ymm8 |
641 | vpsubw %ymm1, %ymm0, %ymm12 |
642 | vmovdqa 288(%rsp), %ymm0 |
643 | vpsllw $2, %ymm0, %ymm0 |
644 | vpaddw 32(%rsp), %ymm0, %ymm0 |
645 | vpsllw $2, %ymm5, %ymm1 |
646 | vpaddw 160(%rsp), %ymm1, %ymm1 |
647 | vpsllw $1, %ymm1, %ymm1 |
648 | vpaddw %ymm1, %ymm0, %ymm9 |
649 | vpsubw %ymm1, %ymm0, %ymm13 |
650 | vmovdqa 320(%rsp), %ymm0 |
651 | vpsllw $2, %ymm0, %ymm0 |
652 | vpaddw 64(%rsp), %ymm0, %ymm0 |
653 | vpsllw $2, %ymm6, %ymm1 |
654 | vpaddw 192(%rsp), %ymm1, %ymm1 |
655 | vpsllw $1, %ymm1, %ymm1 |
656 | vpaddw %ymm1, %ymm0, %ymm10 |
657 | vpsubw %ymm1, %ymm0, %ymm14 |
658 | vmovdqa 352(%rsp), %ymm0 |
659 | vpsllw $2, %ymm0, %ymm0 |
660 | vpaddw 96(%rsp), %ymm0, %ymm0 |
661 | vpsllw $2, %ymm7, %ymm1 |
662 | vpaddw 224(%rsp), %ymm1, %ymm1 |
663 | vpsllw $1, %ymm1, %ymm1 |
664 | vpaddw %ymm1, %ymm0, %ymm11 |
665 | vpsubw %ymm1, %ymm0, %ymm15 |
666 | vmovdqa %ymm8, 2624(%rax) |
667 | vmovdqa %ymm9, 2720(%rax) |
668 | vpaddw %ymm8, %ymm9, %ymm0 |
669 | vmovdqa %ymm0, 2816(%rax) |
670 | vmovdqa %ymm10, 2912(%rax) |
671 | vmovdqa %ymm11, 3008(%rax) |
672 | vpaddw %ymm10, %ymm11, %ymm0 |
673 | vmovdqa %ymm0, 3104(%rax) |
674 | vpaddw %ymm8, %ymm10, %ymm0 |
675 | vmovdqa %ymm0, 3200(%rax) |
676 | vpaddw %ymm9, %ymm11, %ymm1 |
677 | vmovdqa %ymm1, 3296(%rax) |
678 | vpaddw %ymm0, %ymm1, %ymm0 |
679 | vmovdqa %ymm0, 3392(%rax) |
680 | vmovdqa %ymm12, 3488(%rax) |
681 | vmovdqa %ymm13, 3584(%rax) |
682 | vpaddw %ymm12, %ymm13, %ymm0 |
683 | vmovdqa %ymm0, 3680(%rax) |
684 | vmovdqa %ymm14, 3776(%rax) |
685 | vmovdqa %ymm15, 3872(%rax) |
686 | vpaddw %ymm14, %ymm15, %ymm0 |
687 | vmovdqa %ymm0, 3968(%rax) |
688 | vpaddw %ymm12, %ymm14, %ymm0 |
689 | vmovdqa %ymm0, 4064(%rax) |
690 | vpaddw %ymm13, %ymm15, %ymm1 |
691 | vmovdqa %ymm1, 4160(%rax) |
692 | vpaddw %ymm0, %ymm1, %ymm0 |
693 | vmovdqa %ymm0, 4256(%rax) |
694 | vpmullw %ymm3, %ymm4, %ymm0 |
695 | vpaddw 256(%rsp), %ymm0, %ymm0 |
696 | vpmullw %ymm3, %ymm0, %ymm0 |
697 | vpaddw 128(%rsp), %ymm0, %ymm0 |
698 | vpmullw %ymm3, %ymm0, %ymm0 |
699 | vpaddw 0(%rsp), %ymm0, %ymm12 |
700 | vpmullw %ymm3, %ymm5, %ymm0 |
701 | vpaddw 288(%rsp), %ymm0, %ymm0 |
702 | vpmullw %ymm3, %ymm0, %ymm0 |
703 | vpaddw 160(%rsp), %ymm0, %ymm0 |
704 | vpmullw %ymm3, %ymm0, %ymm0 |
705 | vpaddw 32(%rsp), %ymm0, %ymm13 |
706 | vpmullw %ymm3, %ymm6, %ymm0 |
707 | vpaddw 320(%rsp), %ymm0, %ymm0 |
708 | vpmullw %ymm3, %ymm0, %ymm0 |
709 | vpaddw 192(%rsp), %ymm0, %ymm0 |
710 | vpmullw %ymm3, %ymm0, %ymm0 |
711 | vpaddw 64(%rsp), %ymm0, %ymm14 |
712 | vpmullw %ymm3, %ymm7, %ymm0 |
713 | vpaddw 352(%rsp), %ymm0, %ymm0 |
714 | vpmullw %ymm3, %ymm0, %ymm0 |
715 | vpaddw 224(%rsp), %ymm0, %ymm0 |
716 | vpmullw %ymm3, %ymm0, %ymm0 |
717 | vpaddw 96(%rsp), %ymm0, %ymm15 |
718 | vmovdqa %ymm12, 4352(%rax) |
719 | vmovdqa %ymm13, 4448(%rax) |
720 | vpaddw %ymm12, %ymm13, %ymm0 |
721 | vmovdqa %ymm0, 4544(%rax) |
722 | vmovdqa %ymm14, 4640(%rax) |
723 | vmovdqa %ymm15, 4736(%rax) |
724 | vpaddw %ymm14, %ymm15, %ymm0 |
725 | vmovdqa %ymm0, 4832(%rax) |
726 | vpaddw %ymm12, %ymm14, %ymm0 |
727 | vmovdqa %ymm0, 4928(%rax) |
728 | vpaddw %ymm13, %ymm15, %ymm1 |
729 | vmovdqa %ymm1, 5024(%rax) |
730 | vpaddw %ymm0, %ymm1, %ymm0 |
731 | vmovdqa %ymm0, 5120(%rax) |
732 | vmovdqu 64(%rsi), %ymm0 |
733 | vmovdqu 152(%rsi), %ymm1 |
734 | vmovdqu 240(%rsi), %ymm2 |
735 | vmovdqu 328(%rsi), %ymm12 |
736 | vmovdqu 1120(%rsi), %ymm4 |
737 | vmovdqu 1208(%rsi), %ymm5 |
738 | vmovdqu 1296(%rsi), %ymm6 |
739 | vmovdqu 1384(%rsi), %ymm7 |
740 | vpand mask_low9words(%rip), %ymm7, %ymm7 |
741 | vmovdqu 416(%rsi), %ymm8 |
742 | vmovdqu 504(%rsi), %ymm9 |
743 | vmovdqu 592(%rsi), %ymm10 |
744 | vmovdqu 680(%rsi), %ymm11 |
745 | vmovdqa %ymm0, 64(%rax) |
746 | vmovdqa %ymm1, 160(%rax) |
747 | vpaddw %ymm0, %ymm1, %ymm14 |
748 | vmovdqa %ymm14, 256(%rax) |
749 | vmovdqa %ymm2, 352(%rax) |
750 | vmovdqa %ymm12, 448(%rax) |
751 | vpaddw %ymm2, %ymm12, %ymm14 |
752 | vmovdqa %ymm14, 544(%rax) |
753 | vpaddw %ymm0, %ymm2, %ymm14 |
754 | vmovdqa %ymm14, 640(%rax) |
755 | vpaddw %ymm1, %ymm12, %ymm15 |
756 | vmovdqa %ymm15, 736(%rax) |
757 | vpaddw %ymm14, %ymm15, %ymm14 |
758 | vmovdqa %ymm14, 832(%rax) |
759 | vmovdqa %ymm4, 5248(%rax) |
760 | vmovdqa %ymm5, 5344(%rax) |
761 | vpaddw %ymm4, %ymm5, %ymm14 |
762 | vmovdqa %ymm14, 5440(%rax) |
763 | vmovdqa %ymm6, 5536(%rax) |
764 | vmovdqa %ymm7, 5632(%rax) |
765 | vpaddw %ymm6, %ymm7, %ymm14 |
766 | vmovdqa %ymm14, 5728(%rax) |
767 | vpaddw %ymm4, %ymm6, %ymm14 |
768 | vmovdqa %ymm14, 5824(%rax) |
769 | vpaddw %ymm5, %ymm7, %ymm15 |
770 | vmovdqa %ymm15, 5920(%rax) |
771 | vpaddw %ymm14, %ymm15, %ymm14 |
772 | vmovdqa %ymm14, 6016(%rax) |
773 | vmovdqa %ymm0, 0(%rsp) |
774 | vmovdqa %ymm1, 32(%rsp) |
775 | vmovdqa %ymm2, 64(%rsp) |
776 | vmovdqa %ymm12, 96(%rsp) |
777 | vmovdqa %ymm8, 128(%rsp) |
778 | vmovdqa %ymm9, 160(%rsp) |
779 | vmovdqa %ymm10, 192(%rsp) |
780 | vmovdqa %ymm11, 224(%rsp) |
781 | vmovdqu 768(%rsi), %ymm0 |
782 | vpaddw 0(%rsp), %ymm0, %ymm1 |
783 | vpaddw 128(%rsp), %ymm4, %ymm2 |
784 | vpaddw %ymm2, %ymm1, %ymm8 |
785 | vpsubw %ymm2, %ymm1, %ymm12 |
786 | vmovdqa %ymm0, 256(%rsp) |
787 | vmovdqu 856(%rsi), %ymm0 |
788 | vpaddw 32(%rsp), %ymm0, %ymm1 |
789 | vpaddw 160(%rsp), %ymm5, %ymm2 |
790 | vpaddw %ymm2, %ymm1, %ymm9 |
791 | vpsubw %ymm2, %ymm1, %ymm13 |
792 | vmovdqa %ymm0, 288(%rsp) |
793 | vmovdqu 944(%rsi), %ymm0 |
794 | vpaddw 64(%rsp), %ymm0, %ymm1 |
795 | vpaddw 192(%rsp), %ymm6, %ymm2 |
796 | vpaddw %ymm2, %ymm1, %ymm10 |
797 | vpsubw %ymm2, %ymm1, %ymm14 |
798 | vmovdqa %ymm0, 320(%rsp) |
799 | vmovdqu 1032(%rsi), %ymm0 |
800 | vpaddw 96(%rsp), %ymm0, %ymm1 |
801 | vpaddw 224(%rsp), %ymm7, %ymm2 |
802 | vpaddw %ymm2, %ymm1, %ymm11 |
803 | vpsubw %ymm2, %ymm1, %ymm15 |
804 | vmovdqa %ymm0, 352(%rsp) |
805 | vmovdqa %ymm8, 928(%rax) |
806 | vmovdqa %ymm9, 1024(%rax) |
807 | vpaddw %ymm8, %ymm9, %ymm0 |
808 | vmovdqa %ymm0, 1120(%rax) |
809 | vmovdqa %ymm10, 1216(%rax) |
810 | vmovdqa %ymm11, 1312(%rax) |
811 | vpaddw %ymm10, %ymm11, %ymm0 |
812 | vmovdqa %ymm0, 1408(%rax) |
813 | vpaddw %ymm8, %ymm10, %ymm0 |
814 | vmovdqa %ymm0, 1504(%rax) |
815 | vpaddw %ymm9, %ymm11, %ymm1 |
816 | vmovdqa %ymm1, 1600(%rax) |
817 | vpaddw %ymm0, %ymm1, %ymm0 |
818 | vmovdqa %ymm0, 1696(%rax) |
819 | vmovdqa %ymm12, 1792(%rax) |
820 | vmovdqa %ymm13, 1888(%rax) |
821 | vpaddw %ymm12, %ymm13, %ymm0 |
822 | vmovdqa %ymm0, 1984(%rax) |
823 | vmovdqa %ymm14, 2080(%rax) |
824 | vmovdqa %ymm15, 2176(%rax) |
825 | vpaddw %ymm14, %ymm15, %ymm0 |
826 | vmovdqa %ymm0, 2272(%rax) |
827 | vpaddw %ymm12, %ymm14, %ymm0 |
828 | vmovdqa %ymm0, 2368(%rax) |
829 | vpaddw %ymm13, %ymm15, %ymm1 |
830 | vmovdqa %ymm1, 2464(%rax) |
831 | vpaddw %ymm0, %ymm1, %ymm0 |
832 | vmovdqa %ymm0, 2560(%rax) |
833 | vmovdqa 256(%rsp), %ymm0 |
834 | vpsllw $2, %ymm0, %ymm0 |
835 | vpaddw 0(%rsp), %ymm0, %ymm0 |
836 | vpsllw $2, %ymm4, %ymm1 |
837 | vpaddw 128(%rsp), %ymm1, %ymm1 |
838 | vpsllw $1, %ymm1, %ymm1 |
839 | vpaddw %ymm1, %ymm0, %ymm8 |
840 | vpsubw %ymm1, %ymm0, %ymm12 |
841 | vmovdqa 288(%rsp), %ymm0 |
842 | vpsllw $2, %ymm0, %ymm0 |
843 | vpaddw 32(%rsp), %ymm0, %ymm0 |
844 | vpsllw $2, %ymm5, %ymm1 |
845 | vpaddw 160(%rsp), %ymm1, %ymm1 |
846 | vpsllw $1, %ymm1, %ymm1 |
847 | vpaddw %ymm1, %ymm0, %ymm9 |
848 | vpsubw %ymm1, %ymm0, %ymm13 |
849 | vmovdqa 320(%rsp), %ymm0 |
850 | vpsllw $2, %ymm0, %ymm0 |
851 | vpaddw 64(%rsp), %ymm0, %ymm0 |
852 | vpsllw $2, %ymm6, %ymm1 |
853 | vpaddw 192(%rsp), %ymm1, %ymm1 |
854 | vpsllw $1, %ymm1, %ymm1 |
855 | vpaddw %ymm1, %ymm0, %ymm10 |
856 | vpsubw %ymm1, %ymm0, %ymm14 |
857 | vmovdqa 352(%rsp), %ymm0 |
858 | vpsllw $2, %ymm0, %ymm0 |
859 | vpaddw 96(%rsp), %ymm0, %ymm0 |
860 | vpsllw $2, %ymm7, %ymm1 |
861 | vpaddw 224(%rsp), %ymm1, %ymm1 |
862 | vpsllw $1, %ymm1, %ymm1 |
863 | vpaddw %ymm1, %ymm0, %ymm11 |
864 | vpsubw %ymm1, %ymm0, %ymm15 |
865 | vmovdqa %ymm8, 2656(%rax) |
866 | vmovdqa %ymm9, 2752(%rax) |
867 | vpaddw %ymm8, %ymm9, %ymm0 |
868 | vmovdqa %ymm0, 2848(%rax) |
869 | vmovdqa %ymm10, 2944(%rax) |
870 | vmovdqa %ymm11, 3040(%rax) |
871 | vpaddw %ymm10, %ymm11, %ymm0 |
872 | vmovdqa %ymm0, 3136(%rax) |
873 | vpaddw %ymm8, %ymm10, %ymm0 |
874 | vmovdqa %ymm0, 3232(%rax) |
875 | vpaddw %ymm9, %ymm11, %ymm1 |
876 | vmovdqa %ymm1, 3328(%rax) |
877 | vpaddw %ymm0, %ymm1, %ymm0 |
878 | vmovdqa %ymm0, 3424(%rax) |
879 | vmovdqa %ymm12, 3520(%rax) |
880 | vmovdqa %ymm13, 3616(%rax) |
881 | vpaddw %ymm12, %ymm13, %ymm0 |
882 | vmovdqa %ymm0, 3712(%rax) |
883 | vmovdqa %ymm14, 3808(%rax) |
884 | vmovdqa %ymm15, 3904(%rax) |
885 | vpaddw %ymm14, %ymm15, %ymm0 |
886 | vmovdqa %ymm0, 4000(%rax) |
887 | vpaddw %ymm12, %ymm14, %ymm0 |
888 | vmovdqa %ymm0, 4096(%rax) |
889 | vpaddw %ymm13, %ymm15, %ymm1 |
890 | vmovdqa %ymm1, 4192(%rax) |
891 | vpaddw %ymm0, %ymm1, %ymm0 |
892 | vmovdqa %ymm0, 4288(%rax) |
893 | vpmullw %ymm3, %ymm4, %ymm0 |
894 | vpaddw 256(%rsp), %ymm0, %ymm0 |
895 | vpmullw %ymm3, %ymm0, %ymm0 |
896 | vpaddw 128(%rsp), %ymm0, %ymm0 |
897 | vpmullw %ymm3, %ymm0, %ymm0 |
898 | vpaddw 0(%rsp), %ymm0, %ymm12 |
899 | vpmullw %ymm3, %ymm5, %ymm0 |
900 | vpaddw 288(%rsp), %ymm0, %ymm0 |
901 | vpmullw %ymm3, %ymm0, %ymm0 |
902 | vpaddw 160(%rsp), %ymm0, %ymm0 |
903 | vpmullw %ymm3, %ymm0, %ymm0 |
904 | vpaddw 32(%rsp), %ymm0, %ymm13 |
905 | vpmullw %ymm3, %ymm6, %ymm0 |
906 | vpaddw 320(%rsp), %ymm0, %ymm0 |
907 | vpmullw %ymm3, %ymm0, %ymm0 |
908 | vpaddw 192(%rsp), %ymm0, %ymm0 |
909 | vpmullw %ymm3, %ymm0, %ymm0 |
910 | vpaddw 64(%rsp), %ymm0, %ymm14 |
911 | vpmullw %ymm3, %ymm7, %ymm0 |
912 | vpaddw 352(%rsp), %ymm0, %ymm0 |
913 | vpmullw %ymm3, %ymm0, %ymm0 |
914 | vpaddw 224(%rsp), %ymm0, %ymm0 |
915 | vpmullw %ymm3, %ymm0, %ymm0 |
916 | vpaddw 96(%rsp), %ymm0, %ymm15 |
917 | vmovdqa %ymm12, 4384(%rax) |
918 | vmovdqa %ymm13, 4480(%rax) |
919 | vpaddw %ymm12, %ymm13, %ymm0 |
920 | vmovdqa %ymm0, 4576(%rax) |
921 | vmovdqa %ymm14, 4672(%rax) |
922 | vmovdqa %ymm15, 4768(%rax) |
923 | vpaddw %ymm14, %ymm15, %ymm0 |
924 | vmovdqa %ymm0, 4864(%rax) |
925 | vpaddw %ymm12, %ymm14, %ymm0 |
926 | vmovdqa %ymm0, 4960(%rax) |
927 | vpaddw %ymm13, %ymm15, %ymm1 |
928 | vmovdqa %ymm1, 5056(%rax) |
929 | vpaddw %ymm0, %ymm1, %ymm0 |
930 | vmovdqa %ymm0, 5152(%rax) |
931 | vmovdqu 0(%rdx), %ymm0 |
932 | vmovdqu 88(%rdx), %ymm1 |
933 | vmovdqu 176(%rdx), %ymm2 |
934 | vmovdqu 264(%rdx), %ymm12 |
935 | vmovdqu 1056(%rdx), %ymm4 |
936 | vmovdqu 1144(%rdx), %ymm5 |
937 | vmovdqu 1232(%rdx), %ymm6 |
938 | vmovdqu 1320(%rdx), %ymm7 |
939 | vmovdqu 352(%rdx), %ymm8 |
940 | vmovdqu 440(%rdx), %ymm9 |
941 | vmovdqu 528(%rdx), %ymm10 |
942 | vmovdqu 616(%rdx), %ymm11 |
943 | vmovdqa %ymm0, 0(%r11) |
944 | vmovdqa %ymm1, 96(%r11) |
945 | vpaddw %ymm0, %ymm1, %ymm14 |
946 | vmovdqa %ymm14, 192(%r11) |
947 | vmovdqa %ymm2, 288(%r11) |
948 | vmovdqa %ymm12, 384(%r11) |
949 | vpaddw %ymm2, %ymm12, %ymm14 |
950 | vmovdqa %ymm14, 480(%r11) |
951 | vpaddw %ymm0, %ymm2, %ymm14 |
952 | vmovdqa %ymm14, 576(%r11) |
953 | vpaddw %ymm1, %ymm12, %ymm15 |
954 | vmovdqa %ymm15, 672(%r11) |
955 | vpaddw %ymm14, %ymm15, %ymm14 |
956 | vmovdqa %ymm14, 768(%r11) |
957 | vmovdqa %ymm4, 5184(%r11) |
958 | vmovdqa %ymm5, 5280(%r11) |
959 | vpaddw %ymm4, %ymm5, %ymm14 |
960 | vmovdqa %ymm14, 5376(%r11) |
961 | vmovdqa %ymm6, 5472(%r11) |
962 | vmovdqa %ymm7, 5568(%r11) |
963 | vpaddw %ymm6, %ymm7, %ymm14 |
964 | vmovdqa %ymm14, 5664(%r11) |
965 | vpaddw %ymm4, %ymm6, %ymm14 |
966 | vmovdqa %ymm14, 5760(%r11) |
967 | vpaddw %ymm5, %ymm7, %ymm15 |
968 | vmovdqa %ymm15, 5856(%r11) |
969 | vpaddw %ymm14, %ymm15, %ymm14 |
970 | vmovdqa %ymm14, 5952(%r11) |
971 | vmovdqa %ymm0, 0(%rsp) |
972 | vmovdqa %ymm1, 32(%rsp) |
973 | vmovdqa %ymm2, 64(%rsp) |
974 | vmovdqa %ymm12, 96(%rsp) |
975 | vmovdqa %ymm8, 128(%rsp) |
976 | vmovdqa %ymm9, 160(%rsp) |
977 | vmovdqa %ymm10, 192(%rsp) |
978 | vmovdqa %ymm11, 224(%rsp) |
979 | vmovdqu 704(%rdx), %ymm0 |
980 | vpaddw 0(%rsp), %ymm0, %ymm1 |
981 | vpaddw 128(%rsp), %ymm4, %ymm2 |
982 | vpaddw %ymm2, %ymm1, %ymm8 |
983 | vpsubw %ymm2, %ymm1, %ymm12 |
984 | vmovdqa %ymm0, 256(%rsp) |
985 | vmovdqu 792(%rdx), %ymm0 |
986 | vpaddw 32(%rsp), %ymm0, %ymm1 |
987 | vpaddw 160(%rsp), %ymm5, %ymm2 |
988 | vpaddw %ymm2, %ymm1, %ymm9 |
989 | vpsubw %ymm2, %ymm1, %ymm13 |
990 | vmovdqa %ymm0, 288(%rsp) |
991 | vmovdqu 880(%rdx), %ymm0 |
992 | vpaddw 64(%rsp), %ymm0, %ymm1 |
993 | vpaddw 192(%rsp), %ymm6, %ymm2 |
994 | vpaddw %ymm2, %ymm1, %ymm10 |
995 | vpsubw %ymm2, %ymm1, %ymm14 |
996 | vmovdqa %ymm0, 320(%rsp) |
997 | vmovdqu 968(%rdx), %ymm0 |
998 | vpaddw 96(%rsp), %ymm0, %ymm1 |
999 | vpaddw 224(%rsp), %ymm7, %ymm2 |
1000 | vpaddw %ymm2, %ymm1, %ymm11 |
1001 | vpsubw %ymm2, %ymm1, %ymm15 |
1002 | vmovdqa %ymm0, 352(%rsp) |
1003 | vmovdqa %ymm8, 864(%r11) |
1004 | vmovdqa %ymm9, 960(%r11) |
1005 | vpaddw %ymm8, %ymm9, %ymm0 |
1006 | vmovdqa %ymm0, 1056(%r11) |
1007 | vmovdqa %ymm10, 1152(%r11) |
1008 | vmovdqa %ymm11, 1248(%r11) |
1009 | vpaddw %ymm10, %ymm11, %ymm0 |
1010 | vmovdqa %ymm0, 1344(%r11) |
1011 | vpaddw %ymm8, %ymm10, %ymm0 |
1012 | vmovdqa %ymm0, 1440(%r11) |
1013 | vpaddw %ymm9, %ymm11, %ymm1 |
1014 | vmovdqa %ymm1, 1536(%r11) |
1015 | vpaddw %ymm0, %ymm1, %ymm0 |
1016 | vmovdqa %ymm0, 1632(%r11) |
1017 | vmovdqa %ymm12, 1728(%r11) |
1018 | vmovdqa %ymm13, 1824(%r11) |
1019 | vpaddw %ymm12, %ymm13, %ymm0 |
1020 | vmovdqa %ymm0, 1920(%r11) |
1021 | vmovdqa %ymm14, 2016(%r11) |
1022 | vmovdqa %ymm15, 2112(%r11) |
1023 | vpaddw %ymm14, %ymm15, %ymm0 |
1024 | vmovdqa %ymm0, 2208(%r11) |
1025 | vpaddw %ymm12, %ymm14, %ymm0 |
1026 | vmovdqa %ymm0, 2304(%r11) |
1027 | vpaddw %ymm13, %ymm15, %ymm1 |
1028 | vmovdqa %ymm1, 2400(%r11) |
1029 | vpaddw %ymm0, %ymm1, %ymm0 |
1030 | vmovdqa %ymm0, 2496(%r11) |
1031 | vmovdqa 256(%rsp), %ymm0 |
1032 | vpsllw $2, %ymm0, %ymm0 |
1033 | vpaddw 0(%rsp), %ymm0, %ymm0 |
1034 | vpsllw $2, %ymm4, %ymm1 |
1035 | vpaddw 128(%rsp), %ymm1, %ymm1 |
1036 | vpsllw $1, %ymm1, %ymm1 |
1037 | vpaddw %ymm1, %ymm0, %ymm8 |
1038 | vpsubw %ymm1, %ymm0, %ymm12 |
1039 | vmovdqa 288(%rsp), %ymm0 |
1040 | vpsllw $2, %ymm0, %ymm0 |
1041 | vpaddw 32(%rsp), %ymm0, %ymm0 |
1042 | vpsllw $2, %ymm5, %ymm1 |
1043 | vpaddw 160(%rsp), %ymm1, %ymm1 |
1044 | vpsllw $1, %ymm1, %ymm1 |
1045 | vpaddw %ymm1, %ymm0, %ymm9 |
1046 | vpsubw %ymm1, %ymm0, %ymm13 |
1047 | vmovdqa 320(%rsp), %ymm0 |
1048 | vpsllw $2, %ymm0, %ymm0 |
1049 | vpaddw 64(%rsp), %ymm0, %ymm0 |
1050 | vpsllw $2, %ymm6, %ymm1 |
1051 | vpaddw 192(%rsp), %ymm1, %ymm1 |
1052 | vpsllw $1, %ymm1, %ymm1 |
1053 | vpaddw %ymm1, %ymm0, %ymm10 |
1054 | vpsubw %ymm1, %ymm0, %ymm14 |
1055 | vmovdqa 352(%rsp), %ymm0 |
1056 | vpsllw $2, %ymm0, %ymm0 |
1057 | vpaddw 96(%rsp), %ymm0, %ymm0 |
1058 | vpsllw $2, %ymm7, %ymm1 |
1059 | vpaddw 224(%rsp), %ymm1, %ymm1 |
1060 | vpsllw $1, %ymm1, %ymm1 |
1061 | vpaddw %ymm1, %ymm0, %ymm11 |
1062 | vpsubw %ymm1, %ymm0, %ymm15 |
1063 | vmovdqa %ymm8, 2592(%r11) |
1064 | vmovdqa %ymm9, 2688(%r11) |
1065 | vpaddw %ymm8, %ymm9, %ymm0 |
1066 | vmovdqa %ymm0, 2784(%r11) |
1067 | vmovdqa %ymm10, 2880(%r11) |
1068 | vmovdqa %ymm11, 2976(%r11) |
1069 | vpaddw %ymm10, %ymm11, %ymm0 |
1070 | vmovdqa %ymm0, 3072(%r11) |
1071 | vpaddw %ymm8, %ymm10, %ymm0 |
1072 | vmovdqa %ymm0, 3168(%r11) |
1073 | vpaddw %ymm9, %ymm11, %ymm1 |
1074 | vmovdqa %ymm1, 3264(%r11) |
1075 | vpaddw %ymm0, %ymm1, %ymm0 |
1076 | vmovdqa %ymm0, 3360(%r11) |
1077 | vmovdqa %ymm12, 3456(%r11) |
1078 | vmovdqa %ymm13, 3552(%r11) |
1079 | vpaddw %ymm12, %ymm13, %ymm0 |
1080 | vmovdqa %ymm0, 3648(%r11) |
1081 | vmovdqa %ymm14, 3744(%r11) |
1082 | vmovdqa %ymm15, 3840(%r11) |
1083 | vpaddw %ymm14, %ymm15, %ymm0 |
1084 | vmovdqa %ymm0, 3936(%r11) |
1085 | vpaddw %ymm12, %ymm14, %ymm0 |
1086 | vmovdqa %ymm0, 4032(%r11) |
1087 | vpaddw %ymm13, %ymm15, %ymm1 |
1088 | vmovdqa %ymm1, 4128(%r11) |
1089 | vpaddw %ymm0, %ymm1, %ymm0 |
1090 | vmovdqa %ymm0, 4224(%r11) |
1091 | vpmullw %ymm3, %ymm4, %ymm0 |
1092 | vpaddw 256(%rsp), %ymm0, %ymm0 |
1093 | vpmullw %ymm3, %ymm0, %ymm0 |
1094 | vpaddw 128(%rsp), %ymm0, %ymm0 |
1095 | vpmullw %ymm3, %ymm0, %ymm0 |
1096 | vpaddw 0(%rsp), %ymm0, %ymm12 |
1097 | vpmullw %ymm3, %ymm5, %ymm0 |
1098 | vpaddw 288(%rsp), %ymm0, %ymm0 |
1099 | vpmullw %ymm3, %ymm0, %ymm0 |
1100 | vpaddw 160(%rsp), %ymm0, %ymm0 |
1101 | vpmullw %ymm3, %ymm0, %ymm0 |
1102 | vpaddw 32(%rsp), %ymm0, %ymm13 |
1103 | vpmullw %ymm3, %ymm6, %ymm0 |
1104 | vpaddw 320(%rsp), %ymm0, %ymm0 |
1105 | vpmullw %ymm3, %ymm0, %ymm0 |
1106 | vpaddw 192(%rsp), %ymm0, %ymm0 |
1107 | vpmullw %ymm3, %ymm0, %ymm0 |
1108 | vpaddw 64(%rsp), %ymm0, %ymm14 |
1109 | vpmullw %ymm3, %ymm7, %ymm0 |
1110 | vpaddw 352(%rsp), %ymm0, %ymm0 |
1111 | vpmullw %ymm3, %ymm0, %ymm0 |
1112 | vpaddw 224(%rsp), %ymm0, %ymm0 |
1113 | vpmullw %ymm3, %ymm0, %ymm0 |
1114 | vpaddw 96(%rsp), %ymm0, %ymm15 |
1115 | vmovdqa %ymm12, 4320(%r11) |
1116 | vmovdqa %ymm13, 4416(%r11) |
1117 | vpaddw %ymm12, %ymm13, %ymm0 |
1118 | vmovdqa %ymm0, 4512(%r11) |
1119 | vmovdqa %ymm14, 4608(%r11) |
1120 | vmovdqa %ymm15, 4704(%r11) |
1121 | vpaddw %ymm14, %ymm15, %ymm0 |
1122 | vmovdqa %ymm0, 4800(%r11) |
1123 | vpaddw %ymm12, %ymm14, %ymm0 |
1124 | vmovdqa %ymm0, 4896(%r11) |
1125 | vpaddw %ymm13, %ymm15, %ymm1 |
1126 | vmovdqa %ymm1, 4992(%r11) |
1127 | vpaddw %ymm0, %ymm1, %ymm0 |
1128 | vmovdqa %ymm0, 5088(%r11) |
1129 | vmovdqu 32(%rdx), %ymm0 |
1130 | vmovdqu 120(%rdx), %ymm1 |
1131 | vmovdqu 208(%rdx), %ymm2 |
1132 | vmovdqu 296(%rdx), %ymm12 |
1133 | vmovdqu 1088(%rdx), %ymm4 |
1134 | vmovdqu 1176(%rdx), %ymm5 |
1135 | vmovdqu 1264(%rdx), %ymm6 |
1136 | vmovdqu 1352(%rdx), %ymm7 |
1137 | vmovdqu 384(%rdx), %ymm8 |
1138 | vmovdqu 472(%rdx), %ymm9 |
1139 | vmovdqu 560(%rdx), %ymm10 |
1140 | vmovdqu 648(%rdx), %ymm11 |
1141 | vmovdqa %ymm0, 32(%r11) |
1142 | vmovdqa %ymm1, 128(%r11) |
1143 | vpaddw %ymm0, %ymm1, %ymm14 |
1144 | vmovdqa %ymm14, 224(%r11) |
1145 | vmovdqa %ymm2, 320(%r11) |
1146 | vmovdqa %ymm12, 416(%r11) |
1147 | vpaddw %ymm2, %ymm12, %ymm14 |
1148 | vmovdqa %ymm14, 512(%r11) |
1149 | vpaddw %ymm0, %ymm2, %ymm14 |
1150 | vmovdqa %ymm14, 608(%r11) |
1151 | vpaddw %ymm1, %ymm12, %ymm15 |
1152 | vmovdqa %ymm15, 704(%r11) |
1153 | vpaddw %ymm14, %ymm15, %ymm14 |
1154 | vmovdqa %ymm14, 800(%r11) |
1155 | vmovdqa %ymm4, 5216(%r11) |
1156 | vmovdqa %ymm5, 5312(%r11) |
1157 | vpaddw %ymm4, %ymm5, %ymm14 |
1158 | vmovdqa %ymm14, 5408(%r11) |
1159 | vmovdqa %ymm6, 5504(%r11) |
1160 | vmovdqa %ymm7, 5600(%r11) |
1161 | vpaddw %ymm6, %ymm7, %ymm14 |
1162 | vmovdqa %ymm14, 5696(%r11) |
1163 | vpaddw %ymm4, %ymm6, %ymm14 |
1164 | vmovdqa %ymm14, 5792(%r11) |
1165 | vpaddw %ymm5, %ymm7, %ymm15 |
1166 | vmovdqa %ymm15, 5888(%r11) |
1167 | vpaddw %ymm14, %ymm15, %ymm14 |
1168 | vmovdqa %ymm14, 5984(%r11) |
1169 | vmovdqa %ymm0, 0(%rsp) |
1170 | vmovdqa %ymm1, 32(%rsp) |
1171 | vmovdqa %ymm2, 64(%rsp) |
1172 | vmovdqa %ymm12, 96(%rsp) |
1173 | vmovdqa %ymm8, 128(%rsp) |
1174 | vmovdqa %ymm9, 160(%rsp) |
1175 | vmovdqa %ymm10, 192(%rsp) |
1176 | vmovdqa %ymm11, 224(%rsp) |
1177 | vmovdqu 736(%rdx), %ymm0 |
1178 | vpaddw 0(%rsp), %ymm0, %ymm1 |
1179 | vpaddw 128(%rsp), %ymm4, %ymm2 |
1180 | vpaddw %ymm2, %ymm1, %ymm8 |
1181 | vpsubw %ymm2, %ymm1, %ymm12 |
1182 | vmovdqa %ymm0, 256(%rsp) |
1183 | vmovdqu 824(%rdx), %ymm0 |
1184 | vpaddw 32(%rsp), %ymm0, %ymm1 |
1185 | vpaddw 160(%rsp), %ymm5, %ymm2 |
1186 | vpaddw %ymm2, %ymm1, %ymm9 |
1187 | vpsubw %ymm2, %ymm1, %ymm13 |
1188 | vmovdqa %ymm0, 288(%rsp) |
1189 | vmovdqu 912(%rdx), %ymm0 |
1190 | vpaddw 64(%rsp), %ymm0, %ymm1 |
1191 | vpaddw 192(%rsp), %ymm6, %ymm2 |
1192 | vpaddw %ymm2, %ymm1, %ymm10 |
1193 | vpsubw %ymm2, %ymm1, %ymm14 |
1194 | vmovdqa %ymm0, 320(%rsp) |
1195 | vmovdqu 1000(%rdx), %ymm0 |
1196 | vpaddw 96(%rsp), %ymm0, %ymm1 |
1197 | vpaddw 224(%rsp), %ymm7, %ymm2 |
1198 | vpaddw %ymm2, %ymm1, %ymm11 |
1199 | vpsubw %ymm2, %ymm1, %ymm15 |
1200 | vmovdqa %ymm0, 352(%rsp) |
1201 | vmovdqa %ymm8, 896(%r11) |
1202 | vmovdqa %ymm9, 992(%r11) |
1203 | vpaddw %ymm8, %ymm9, %ymm0 |
1204 | vmovdqa %ymm0, 1088(%r11) |
1205 | vmovdqa %ymm10, 1184(%r11) |
1206 | vmovdqa %ymm11, 1280(%r11) |
1207 | vpaddw %ymm10, %ymm11, %ymm0 |
1208 | vmovdqa %ymm0, 1376(%r11) |
1209 | vpaddw %ymm8, %ymm10, %ymm0 |
1210 | vmovdqa %ymm0, 1472(%r11) |
1211 | vpaddw %ymm9, %ymm11, %ymm1 |
1212 | vmovdqa %ymm1, 1568(%r11) |
1213 | vpaddw %ymm0, %ymm1, %ymm0 |
1214 | vmovdqa %ymm0, 1664(%r11) |
1215 | vmovdqa %ymm12, 1760(%r11) |
1216 | vmovdqa %ymm13, 1856(%r11) |
1217 | vpaddw %ymm12, %ymm13, %ymm0 |
1218 | vmovdqa %ymm0, 1952(%r11) |
1219 | vmovdqa %ymm14, 2048(%r11) |
1220 | vmovdqa %ymm15, 2144(%r11) |
1221 | vpaddw %ymm14, %ymm15, %ymm0 |
1222 | vmovdqa %ymm0, 2240(%r11) |
1223 | vpaddw %ymm12, %ymm14, %ymm0 |
1224 | vmovdqa %ymm0, 2336(%r11) |
1225 | vpaddw %ymm13, %ymm15, %ymm1 |
1226 | vmovdqa %ymm1, 2432(%r11) |
1227 | vpaddw %ymm0, %ymm1, %ymm0 |
1228 | vmovdqa %ymm0, 2528(%r11) |
1229 | vmovdqa 256(%rsp), %ymm0 |
1230 | vpsllw $2, %ymm0, %ymm0 |
1231 | vpaddw 0(%rsp), %ymm0, %ymm0 |
1232 | vpsllw $2, %ymm4, %ymm1 |
1233 | vpaddw 128(%rsp), %ymm1, %ymm1 |
1234 | vpsllw $1, %ymm1, %ymm1 |
1235 | vpaddw %ymm1, %ymm0, %ymm8 |
1236 | vpsubw %ymm1, %ymm0, %ymm12 |
1237 | vmovdqa 288(%rsp), %ymm0 |
1238 | vpsllw $2, %ymm0, %ymm0 |
1239 | vpaddw 32(%rsp), %ymm0, %ymm0 |
1240 | vpsllw $2, %ymm5, %ymm1 |
1241 | vpaddw 160(%rsp), %ymm1, %ymm1 |
1242 | vpsllw $1, %ymm1, %ymm1 |
1243 | vpaddw %ymm1, %ymm0, %ymm9 |
1244 | vpsubw %ymm1, %ymm0, %ymm13 |
1245 | vmovdqa 320(%rsp), %ymm0 |
1246 | vpsllw $2, %ymm0, %ymm0 |
1247 | vpaddw 64(%rsp), %ymm0, %ymm0 |
1248 | vpsllw $2, %ymm6, %ymm1 |
1249 | vpaddw 192(%rsp), %ymm1, %ymm1 |
1250 | vpsllw $1, %ymm1, %ymm1 |
1251 | vpaddw %ymm1, %ymm0, %ymm10 |
1252 | vpsubw %ymm1, %ymm0, %ymm14 |
1253 | vmovdqa 352(%rsp), %ymm0 |
1254 | vpsllw $2, %ymm0, %ymm0 |
1255 | vpaddw 96(%rsp), %ymm0, %ymm0 |
1256 | vpsllw $2, %ymm7, %ymm1 |
1257 | vpaddw 224(%rsp), %ymm1, %ymm1 |
1258 | vpsllw $1, %ymm1, %ymm1 |
1259 | vpaddw %ymm1, %ymm0, %ymm11 |
1260 | vpsubw %ymm1, %ymm0, %ymm15 |
1261 | vmovdqa %ymm8, 2624(%r11) |
1262 | vmovdqa %ymm9, 2720(%r11) |
1263 | vpaddw %ymm8, %ymm9, %ymm0 |
1264 | vmovdqa %ymm0, 2816(%r11) |
1265 | vmovdqa %ymm10, 2912(%r11) |
1266 | vmovdqa %ymm11, 3008(%r11) |
1267 | vpaddw %ymm10, %ymm11, %ymm0 |
1268 | vmovdqa %ymm0, 3104(%r11) |
1269 | vpaddw %ymm8, %ymm10, %ymm0 |
1270 | vmovdqa %ymm0, 3200(%r11) |
1271 | vpaddw %ymm9, %ymm11, %ymm1 |
1272 | vmovdqa %ymm1, 3296(%r11) |
1273 | vpaddw %ymm0, %ymm1, %ymm0 |
1274 | vmovdqa %ymm0, 3392(%r11) |
1275 | vmovdqa %ymm12, 3488(%r11) |
1276 | vmovdqa %ymm13, 3584(%r11) |
1277 | vpaddw %ymm12, %ymm13, %ymm0 |
1278 | vmovdqa %ymm0, 3680(%r11) |
1279 | vmovdqa %ymm14, 3776(%r11) |
1280 | vmovdqa %ymm15, 3872(%r11) |
1281 | vpaddw %ymm14, %ymm15, %ymm0 |
1282 | vmovdqa %ymm0, 3968(%r11) |
1283 | vpaddw %ymm12, %ymm14, %ymm0 |
1284 | vmovdqa %ymm0, 4064(%r11) |
1285 | vpaddw %ymm13, %ymm15, %ymm1 |
1286 | vmovdqa %ymm1, 4160(%r11) |
1287 | vpaddw %ymm0, %ymm1, %ymm0 |
1288 | vmovdqa %ymm0, 4256(%r11) |
1289 | vpmullw %ymm3, %ymm4, %ymm0 |
1290 | vpaddw 256(%rsp), %ymm0, %ymm0 |
1291 | vpmullw %ymm3, %ymm0, %ymm0 |
1292 | vpaddw 128(%rsp), %ymm0, %ymm0 |
1293 | vpmullw %ymm3, %ymm0, %ymm0 |
1294 | vpaddw 0(%rsp), %ymm0, %ymm12 |
1295 | vpmullw %ymm3, %ymm5, %ymm0 |
1296 | vpaddw 288(%rsp), %ymm0, %ymm0 |
1297 | vpmullw %ymm3, %ymm0, %ymm0 |
1298 | vpaddw 160(%rsp), %ymm0, %ymm0 |
1299 | vpmullw %ymm3, %ymm0, %ymm0 |
1300 | vpaddw 32(%rsp), %ymm0, %ymm13 |
1301 | vpmullw %ymm3, %ymm6, %ymm0 |
1302 | vpaddw 320(%rsp), %ymm0, %ymm0 |
1303 | vpmullw %ymm3, %ymm0, %ymm0 |
1304 | vpaddw 192(%rsp), %ymm0, %ymm0 |
1305 | vpmullw %ymm3, %ymm0, %ymm0 |
1306 | vpaddw 64(%rsp), %ymm0, %ymm14 |
1307 | vpmullw %ymm3, %ymm7, %ymm0 |
1308 | vpaddw 352(%rsp), %ymm0, %ymm0 |
1309 | vpmullw %ymm3, %ymm0, %ymm0 |
1310 | vpaddw 224(%rsp), %ymm0, %ymm0 |
1311 | vpmullw %ymm3, %ymm0, %ymm0 |
1312 | vpaddw 96(%rsp), %ymm0, %ymm15 |
1313 | vmovdqa %ymm12, 4352(%r11) |
1314 | vmovdqa %ymm13, 4448(%r11) |
1315 | vpaddw %ymm12, %ymm13, %ymm0 |
1316 | vmovdqa %ymm0, 4544(%r11) |
1317 | vmovdqa %ymm14, 4640(%r11) |
1318 | vmovdqa %ymm15, 4736(%r11) |
1319 | vpaddw %ymm14, %ymm15, %ymm0 |
1320 | vmovdqa %ymm0, 4832(%r11) |
1321 | vpaddw %ymm12, %ymm14, %ymm0 |
1322 | vmovdqa %ymm0, 4928(%r11) |
1323 | vpaddw %ymm13, %ymm15, %ymm1 |
1324 | vmovdqa %ymm1, 5024(%r11) |
1325 | vpaddw %ymm0, %ymm1, %ymm0 |
1326 | vmovdqa %ymm0, 5120(%r11) |
1327 | vmovdqu 64(%rdx), %ymm0 |
1328 | vmovdqu 152(%rdx), %ymm1 |
1329 | vmovdqu 240(%rdx), %ymm2 |
1330 | vmovdqu 328(%rdx), %ymm12 |
1331 | vmovdqu 1120(%rdx), %ymm4 |
1332 | vmovdqu 1208(%rdx), %ymm5 |
1333 | vmovdqu 1296(%rdx), %ymm6 |
1334 | vmovdqu 1384(%rdx), %ymm7 |
1335 | vpand mask_low9words(%rip), %ymm7, %ymm7 |
1336 | vmovdqu 416(%rdx), %ymm8 |
1337 | vmovdqu 504(%rdx), %ymm9 |
1338 | vmovdqu 592(%rdx), %ymm10 |
1339 | vmovdqu 680(%rdx), %ymm11 |
1340 | vmovdqa %ymm0, 64(%r11) |
1341 | vmovdqa %ymm1, 160(%r11) |
1342 | vpaddw %ymm0, %ymm1, %ymm14 |
1343 | vmovdqa %ymm14, 256(%r11) |
1344 | vmovdqa %ymm2, 352(%r11) |
1345 | vmovdqa %ymm12, 448(%r11) |
1346 | vpaddw %ymm2, %ymm12, %ymm14 |
1347 | vmovdqa %ymm14, 544(%r11) |
1348 | vpaddw %ymm0, %ymm2, %ymm14 |
1349 | vmovdqa %ymm14, 640(%r11) |
1350 | vpaddw %ymm1, %ymm12, %ymm15 |
1351 | vmovdqa %ymm15, 736(%r11) |
1352 | vpaddw %ymm14, %ymm15, %ymm14 |
1353 | vmovdqa %ymm14, 832(%r11) |
1354 | vmovdqa %ymm4, 5248(%r11) |
1355 | vmovdqa %ymm5, 5344(%r11) |
1356 | vpaddw %ymm4, %ymm5, %ymm14 |
1357 | vmovdqa %ymm14, 5440(%r11) |
1358 | vmovdqa %ymm6, 5536(%r11) |
1359 | vmovdqa %ymm7, 5632(%r11) |
1360 | vpaddw %ymm6, %ymm7, %ymm14 |
1361 | vmovdqa %ymm14, 5728(%r11) |
1362 | vpaddw %ymm4, %ymm6, %ymm14 |
1363 | vmovdqa %ymm14, 5824(%r11) |
1364 | vpaddw %ymm5, %ymm7, %ymm15 |
1365 | vmovdqa %ymm15, 5920(%r11) |
1366 | vpaddw %ymm14, %ymm15, %ymm14 |
1367 | vmovdqa %ymm14, 6016(%r11) |
1368 | vmovdqa %ymm0, 0(%rsp) |
1369 | vmovdqa %ymm1, 32(%rsp) |
1370 | vmovdqa %ymm2, 64(%rsp) |
1371 | vmovdqa %ymm12, 96(%rsp) |
1372 | vmovdqa %ymm8, 128(%rsp) |
1373 | vmovdqa %ymm9, 160(%rsp) |
1374 | vmovdqa %ymm10, 192(%rsp) |
1375 | vmovdqa %ymm11, 224(%rsp) |
1376 | vmovdqu 768(%rdx), %ymm0 |
1377 | vpaddw 0(%rsp), %ymm0, %ymm1 |
1378 | vpaddw 128(%rsp), %ymm4, %ymm2 |
1379 | vpaddw %ymm2, %ymm1, %ymm8 |
1380 | vpsubw %ymm2, %ymm1, %ymm12 |
1381 | vmovdqa %ymm0, 256(%rsp) |
1382 | vmovdqu 856(%rdx), %ymm0 |
1383 | vpaddw 32(%rsp), %ymm0, %ymm1 |
1384 | vpaddw 160(%rsp), %ymm5, %ymm2 |
1385 | vpaddw %ymm2, %ymm1, %ymm9 |
1386 | vpsubw %ymm2, %ymm1, %ymm13 |
1387 | vmovdqa %ymm0, 288(%rsp) |
1388 | vmovdqu 944(%rdx), %ymm0 |
1389 | vpaddw 64(%rsp), %ymm0, %ymm1 |
1390 | vpaddw 192(%rsp), %ymm6, %ymm2 |
1391 | vpaddw %ymm2, %ymm1, %ymm10 |
1392 | vpsubw %ymm2, %ymm1, %ymm14 |
1393 | vmovdqa %ymm0, 320(%rsp) |
1394 | vmovdqu 1032(%rdx), %ymm0 |
1395 | vpaddw 96(%rsp), %ymm0, %ymm1 |
1396 | vpaddw 224(%rsp), %ymm7, %ymm2 |
1397 | vpaddw %ymm2, %ymm1, %ymm11 |
1398 | vpsubw %ymm2, %ymm1, %ymm15 |
1399 | vmovdqa %ymm0, 352(%rsp) |
1400 | vmovdqa %ymm8, 928(%r11) |
1401 | vmovdqa %ymm9, 1024(%r11) |
1402 | vpaddw %ymm8, %ymm9, %ymm0 |
1403 | vmovdqa %ymm0, 1120(%r11) |
1404 | vmovdqa %ymm10, 1216(%r11) |
1405 | vmovdqa %ymm11, 1312(%r11) |
1406 | vpaddw %ymm10, %ymm11, %ymm0 |
1407 | vmovdqa %ymm0, 1408(%r11) |
1408 | vpaddw %ymm8, %ymm10, %ymm0 |
1409 | vmovdqa %ymm0, 1504(%r11) |
1410 | vpaddw %ymm9, %ymm11, %ymm1 |
1411 | vmovdqa %ymm1, 1600(%r11) |
1412 | vpaddw %ymm0, %ymm1, %ymm0 |
1413 | vmovdqa %ymm0, 1696(%r11) |
1414 | vmovdqa %ymm12, 1792(%r11) |
1415 | vmovdqa %ymm13, 1888(%r11) |
1416 | vpaddw %ymm12, %ymm13, %ymm0 |
1417 | vmovdqa %ymm0, 1984(%r11) |
1418 | vmovdqa %ymm14, 2080(%r11) |
1419 | vmovdqa %ymm15, 2176(%r11) |
1420 | vpaddw %ymm14, %ymm15, %ymm0 |
1421 | vmovdqa %ymm0, 2272(%r11) |
1422 | vpaddw %ymm12, %ymm14, %ymm0 |
1423 | vmovdqa %ymm0, 2368(%r11) |
1424 | vpaddw %ymm13, %ymm15, %ymm1 |
1425 | vmovdqa %ymm1, 2464(%r11) |
1426 | vpaddw %ymm0, %ymm1, %ymm0 |
1427 | vmovdqa %ymm0, 2560(%r11) |
1428 | vmovdqa 256(%rsp), %ymm0 |
1429 | vpsllw $2, %ymm0, %ymm0 |
1430 | vpaddw 0(%rsp), %ymm0, %ymm0 |
1431 | vpsllw $2, %ymm4, %ymm1 |
1432 | vpaddw 128(%rsp), %ymm1, %ymm1 |
1433 | vpsllw $1, %ymm1, %ymm1 |
1434 | vpaddw %ymm1, %ymm0, %ymm8 |
1435 | vpsubw %ymm1, %ymm0, %ymm12 |
1436 | vmovdqa 288(%rsp), %ymm0 |
1437 | vpsllw $2, %ymm0, %ymm0 |
1438 | vpaddw 32(%rsp), %ymm0, %ymm0 |
1439 | vpsllw $2, %ymm5, %ymm1 |
1440 | vpaddw 160(%rsp), %ymm1, %ymm1 |
1441 | vpsllw $1, %ymm1, %ymm1 |
1442 | vpaddw %ymm1, %ymm0, %ymm9 |
1443 | vpsubw %ymm1, %ymm0, %ymm13 |
1444 | vmovdqa 320(%rsp), %ymm0 |
1445 | vpsllw $2, %ymm0, %ymm0 |
1446 | vpaddw 64(%rsp), %ymm0, %ymm0 |
1447 | vpsllw $2, %ymm6, %ymm1 |
1448 | vpaddw 192(%rsp), %ymm1, %ymm1 |
1449 | vpsllw $1, %ymm1, %ymm1 |
1450 | vpaddw %ymm1, %ymm0, %ymm10 |
1451 | vpsubw %ymm1, %ymm0, %ymm14 |
1452 | vmovdqa 352(%rsp), %ymm0 |
1453 | vpsllw $2, %ymm0, %ymm0 |
1454 | vpaddw 96(%rsp), %ymm0, %ymm0 |
1455 | vpsllw $2, %ymm7, %ymm1 |
1456 | vpaddw 224(%rsp), %ymm1, %ymm1 |
1457 | vpsllw $1, %ymm1, %ymm1 |
1458 | vpaddw %ymm1, %ymm0, %ymm11 |
1459 | vpsubw %ymm1, %ymm0, %ymm15 |
1460 | vmovdqa %ymm8, 2656(%r11) |
1461 | vmovdqa %ymm9, 2752(%r11) |
1462 | vpaddw %ymm8, %ymm9, %ymm0 |
1463 | vmovdqa %ymm0, 2848(%r11) |
1464 | vmovdqa %ymm10, 2944(%r11) |
1465 | vmovdqa %ymm11, 3040(%r11) |
1466 | vpaddw %ymm10, %ymm11, %ymm0 |
1467 | vmovdqa %ymm0, 3136(%r11) |
1468 | vpaddw %ymm8, %ymm10, %ymm0 |
1469 | vmovdqa %ymm0, 3232(%r11) |
1470 | vpaddw %ymm9, %ymm11, %ymm1 |
1471 | vmovdqa %ymm1, 3328(%r11) |
1472 | vpaddw %ymm0, %ymm1, %ymm0 |
1473 | vmovdqa %ymm0, 3424(%r11) |
1474 | vmovdqa %ymm12, 3520(%r11) |
1475 | vmovdqa %ymm13, 3616(%r11) |
1476 | vpaddw %ymm12, %ymm13, %ymm0 |
1477 | vmovdqa %ymm0, 3712(%r11) |
1478 | vmovdqa %ymm14, 3808(%r11) |
1479 | vmovdqa %ymm15, 3904(%r11) |
1480 | vpaddw %ymm14, %ymm15, %ymm0 |
1481 | vmovdqa %ymm0, 4000(%r11) |
1482 | vpaddw %ymm12, %ymm14, %ymm0 |
1483 | vmovdqa %ymm0, 4096(%r11) |
1484 | vpaddw %ymm13, %ymm15, %ymm1 |
1485 | vmovdqa %ymm1, 4192(%r11) |
1486 | vpaddw %ymm0, %ymm1, %ymm0 |
1487 | vmovdqa %ymm0, 4288(%r11) |
1488 | vpmullw %ymm3, %ymm4, %ymm0 |
1489 | vpaddw 256(%rsp), %ymm0, %ymm0 |
1490 | vpmullw %ymm3, %ymm0, %ymm0 |
1491 | vpaddw 128(%rsp), %ymm0, %ymm0 |
1492 | vpmullw %ymm3, %ymm0, %ymm0 |
1493 | vpaddw 0(%rsp), %ymm0, %ymm12 |
1494 | vpmullw %ymm3, %ymm5, %ymm0 |
1495 | vpaddw 288(%rsp), %ymm0, %ymm0 |
1496 | vpmullw %ymm3, %ymm0, %ymm0 |
1497 | vpaddw 160(%rsp), %ymm0, %ymm0 |
1498 | vpmullw %ymm3, %ymm0, %ymm0 |
1499 | vpaddw 32(%rsp), %ymm0, %ymm13 |
1500 | vpmullw %ymm3, %ymm6, %ymm0 |
1501 | vpaddw 320(%rsp), %ymm0, %ymm0 |
1502 | vpmullw %ymm3, %ymm0, %ymm0 |
1503 | vpaddw 192(%rsp), %ymm0, %ymm0 |
1504 | vpmullw %ymm3, %ymm0, %ymm0 |
1505 | vpaddw 64(%rsp), %ymm0, %ymm14 |
1506 | vpmullw %ymm3, %ymm7, %ymm0 |
1507 | vpaddw 352(%rsp), %ymm0, %ymm0 |
1508 | vpmullw %ymm3, %ymm0, %ymm0 |
1509 | vpaddw 224(%rsp), %ymm0, %ymm0 |
1510 | vpmullw %ymm3, %ymm0, %ymm0 |
1511 | vpaddw 96(%rsp), %ymm0, %ymm15 |
1512 | vmovdqa %ymm12, 4384(%r11) |
1513 | vmovdqa %ymm13, 4480(%r11) |
1514 | vpaddw %ymm12, %ymm13, %ymm0 |
1515 | vmovdqa %ymm0, 4576(%r11) |
1516 | vmovdqa %ymm14, 4672(%r11) |
1517 | vmovdqa %ymm15, 4768(%r11) |
1518 | vpaddw %ymm14, %ymm15, %ymm0 |
1519 | vmovdqa %ymm0, 4864(%r11) |
1520 | vpaddw %ymm12, %ymm14, %ymm0 |
1521 | vmovdqa %ymm0, 4960(%r11) |
1522 | vpaddw %ymm13, %ymm15, %ymm1 |
1523 | vmovdqa %ymm1, 5056(%r11) |
1524 | vpaddw %ymm0, %ymm1, %ymm0 |
1525 | vmovdqa %ymm0, 5152(%r11) |
1526 | subq $9408, %rsp |
1527 | mov $4, %ecx |
1528 | karatsuba_loop_4eced63f144beffcb0247f9c6f67d165: |
1529 | mov %rsp, %r9 |
1530 | mov %rsp, %r10 |
1531 | subq $32, %rsp |
1532 | vmovdqa 0(%rax), %ymm0 |
1533 | vmovdqa 192(%rax), %ymm1 |
1534 | vmovdqa 384(%rax), %ymm2 |
1535 | vmovdqa 576(%rax), %ymm3 |
1536 | vpunpcklwd 96(%rax), %ymm0, %ymm4 |
1537 | vpunpckhwd 96(%rax), %ymm0, %ymm5 |
1538 | vpunpcklwd 288(%rax), %ymm1, %ymm6 |
1539 | vpunpckhwd 288(%rax), %ymm1, %ymm7 |
1540 | vpunpcklwd 480(%rax), %ymm2, %ymm8 |
1541 | vpunpckhwd 480(%rax), %ymm2, %ymm9 |
1542 | vpunpcklwd 672(%rax), %ymm3, %ymm10 |
1543 | vpunpckhwd 672(%rax), %ymm3, %ymm11 |
1544 | vpunpckldq %ymm6, %ymm4, %ymm0 |
1545 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
1546 | vpunpckldq %ymm7, %ymm5, %ymm2 |
1547 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
1548 | vpunpckldq %ymm10, %ymm8, %ymm12 |
1549 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
1550 | vpunpckldq %ymm11, %ymm9, %ymm14 |
1551 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
1552 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
1553 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
1554 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
1555 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
1556 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
1557 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
1558 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
1559 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
1560 | vmovdqa 768(%rax), %ymm0 |
1561 | vmovdqa 960(%rax), %ymm1 |
1562 | vmovdqa 1152(%rax), %ymm2 |
1563 | vmovdqa 1344(%rax), %ymm3 |
1564 | vpunpcklwd 864(%rax), %ymm0, %ymm12 |
1565 | vpunpckhwd 864(%rax), %ymm0, %ymm13 |
1566 | vpunpcklwd 1056(%rax), %ymm1, %ymm14 |
1567 | vpunpckhwd 1056(%rax), %ymm1, %ymm15 |
1568 | vpunpcklwd 1248(%rax), %ymm2, %ymm0 |
1569 | vpunpckhwd 1248(%rax), %ymm2, %ymm1 |
1570 | vpunpcklwd 1440(%rax), %ymm3, %ymm2 |
1571 | vpunpckhwd 1440(%rax), %ymm3, %ymm3 |
1572 | vmovdqa %ymm11, 0(%rsp) |
1573 | vpunpckldq %ymm14, %ymm12, %ymm11 |
1574 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
1575 | vpunpckldq %ymm15, %ymm13, %ymm14 |
1576 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
1577 | vpunpckldq %ymm2, %ymm0, %ymm13 |
1578 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
1579 | vpunpckldq %ymm3, %ymm1, %ymm2 |
1580 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
1581 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
1582 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
1583 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
1584 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
1585 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
1586 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
1587 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
1588 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
1589 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
1590 | vmovdqa %ymm15, 0(%r9) |
1591 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
1592 | vmovdqa %ymm15, 32(%r9) |
1593 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
1594 | vmovdqa %ymm15, 64(%r9) |
1595 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
1596 | vmovdqa %ymm15, 96(%r9) |
1597 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
1598 | vmovdqa %ymm15, 128(%r9) |
1599 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
1600 | vmovdqa %ymm15, 160(%r9) |
1601 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
1602 | vmovdqa %ymm15, 192(%r9) |
1603 | vpermq $78, %ymm4, %ymm4 |
1604 | vpermq $78, %ymm5, %ymm5 |
1605 | vpermq $78, %ymm6, %ymm6 |
1606 | vpermq $78, %ymm7, %ymm7 |
1607 | vpermq $78, %ymm8, %ymm8 |
1608 | vpermq $78, %ymm9, %ymm9 |
1609 | vpermq $78, %ymm10, %ymm10 |
1610 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
1611 | vmovdqa %ymm15, 256(%r9) |
1612 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
1613 | vmovdqa %ymm15, 288(%r9) |
1614 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
1615 | vmovdqa %ymm15, 320(%r9) |
1616 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
1617 | vmovdqa %ymm15, 352(%r9) |
1618 | vinserti128 $0, %xmm8, %ymm12, %ymm15 |
1619 | vmovdqa %ymm15, 384(%r9) |
1620 | vinserti128 $0, %xmm9, %ymm2, %ymm15 |
1621 | vmovdqa %ymm15, 416(%r9) |
1622 | vinserti128 $0, %xmm10, %ymm14, %ymm15 |
1623 | vmovdqa %ymm15, 448(%r9) |
1624 | vmovdqa 0(%rsp), %ymm11 |
1625 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
1626 | vmovdqa %ymm14, 224(%r9) |
1627 | vpermq $78, %ymm11, %ymm11 |
1628 | vinserti128 $0, %xmm11, %ymm1, %ymm1 |
1629 | vmovdqa %ymm1, 480(%r9) |
1630 | vmovdqa 32(%rax), %ymm0 |
1631 | vmovdqa 224(%rax), %ymm1 |
1632 | vmovdqa 416(%rax), %ymm2 |
1633 | vmovdqa 608(%rax), %ymm3 |
1634 | vpunpcklwd 128(%rax), %ymm0, %ymm4 |
1635 | vpunpckhwd 128(%rax), %ymm0, %ymm5 |
1636 | vpunpcklwd 320(%rax), %ymm1, %ymm6 |
1637 | vpunpckhwd 320(%rax), %ymm1, %ymm7 |
1638 | vpunpcklwd 512(%rax), %ymm2, %ymm8 |
1639 | vpunpckhwd 512(%rax), %ymm2, %ymm9 |
1640 | vpunpcklwd 704(%rax), %ymm3, %ymm10 |
1641 | vpunpckhwd 704(%rax), %ymm3, %ymm11 |
1642 | vpunpckldq %ymm6, %ymm4, %ymm0 |
1643 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
1644 | vpunpckldq %ymm7, %ymm5, %ymm2 |
1645 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
1646 | vpunpckldq %ymm10, %ymm8, %ymm12 |
1647 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
1648 | vpunpckldq %ymm11, %ymm9, %ymm14 |
1649 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
1650 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
1651 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
1652 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
1653 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
1654 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
1655 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
1656 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
1657 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
1658 | vmovdqa 800(%rax), %ymm0 |
1659 | vmovdqa 992(%rax), %ymm1 |
1660 | vmovdqa 1184(%rax), %ymm2 |
1661 | vmovdqa 1376(%rax), %ymm3 |
1662 | vpunpcklwd 896(%rax), %ymm0, %ymm12 |
1663 | vpunpckhwd 896(%rax), %ymm0, %ymm13 |
1664 | vpunpcklwd 1088(%rax), %ymm1, %ymm14 |
1665 | vpunpckhwd 1088(%rax), %ymm1, %ymm15 |
1666 | vpunpcklwd 1280(%rax), %ymm2, %ymm0 |
1667 | vpunpckhwd 1280(%rax), %ymm2, %ymm1 |
1668 | vpunpcklwd 1472(%rax), %ymm3, %ymm2 |
1669 | vpunpckhwd 1472(%rax), %ymm3, %ymm3 |
1670 | vmovdqa %ymm11, 0(%rsp) |
1671 | vpunpckldq %ymm14, %ymm12, %ymm11 |
1672 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
1673 | vpunpckldq %ymm15, %ymm13, %ymm14 |
1674 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
1675 | vpunpckldq %ymm2, %ymm0, %ymm13 |
1676 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
1677 | vpunpckldq %ymm3, %ymm1, %ymm2 |
1678 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
1679 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
1680 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
1681 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
1682 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
1683 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
1684 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
1685 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
1686 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
1687 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
1688 | vmovdqa %ymm15, 512(%r9) |
1689 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
1690 | vmovdqa %ymm15, 544(%r9) |
1691 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
1692 | vmovdqa %ymm15, 576(%r9) |
1693 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
1694 | vmovdqa %ymm15, 608(%r9) |
1695 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
1696 | vmovdqa %ymm15, 640(%r9) |
1697 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
1698 | vmovdqa %ymm15, 672(%r9) |
1699 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
1700 | vmovdqa %ymm15, 704(%r9) |
1701 | vpermq $78, %ymm4, %ymm4 |
1702 | vpermq $78, %ymm5, %ymm5 |
1703 | vpermq $78, %ymm6, %ymm6 |
1704 | vpermq $78, %ymm7, %ymm7 |
1705 | vpermq $78, %ymm8, %ymm8 |
1706 | vpermq $78, %ymm9, %ymm9 |
1707 | vpermq $78, %ymm10, %ymm10 |
1708 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
1709 | vmovdqa %ymm15, 768(%r9) |
1710 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
1711 | vmovdqa %ymm15, 800(%r9) |
1712 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
1713 | vmovdqa %ymm15, 832(%r9) |
1714 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
1715 | vmovdqa %ymm15, 864(%r9) |
1716 | vinserti128 $0, %xmm8, %ymm12, %ymm15 |
1717 | vmovdqa %ymm15, 896(%r9) |
1718 | vinserti128 $0, %xmm9, %ymm2, %ymm15 |
1719 | vmovdqa %ymm15, 928(%r9) |
1720 | vinserti128 $0, %xmm10, %ymm14, %ymm15 |
1721 | vmovdqa %ymm15, 960(%r9) |
1722 | vmovdqa 0(%rsp), %ymm11 |
1723 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
1724 | vmovdqa %ymm14, 736(%r9) |
1725 | vpermq $78, %ymm11, %ymm11 |
1726 | vinserti128 $0, %xmm11, %ymm1, %ymm1 |
1727 | vmovdqa %ymm1, 992(%r9) |
1728 | vmovdqa 64(%rax), %ymm0 |
1729 | vmovdqa 256(%rax), %ymm1 |
1730 | vmovdqa 448(%rax), %ymm2 |
1731 | vmovdqa 640(%rax), %ymm3 |
1732 | vpunpcklwd 160(%rax), %ymm0, %ymm4 |
1733 | vpunpckhwd 160(%rax), %ymm0, %ymm5 |
1734 | vpunpcklwd 352(%rax), %ymm1, %ymm6 |
1735 | vpunpckhwd 352(%rax), %ymm1, %ymm7 |
1736 | vpunpcklwd 544(%rax), %ymm2, %ymm8 |
1737 | vpunpckhwd 544(%rax), %ymm2, %ymm9 |
1738 | vpunpcklwd 736(%rax), %ymm3, %ymm10 |
1739 | vpunpckhwd 736(%rax), %ymm3, %ymm11 |
1740 | vpunpckldq %ymm6, %ymm4, %ymm0 |
1741 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
1742 | vpunpckldq %ymm7, %ymm5, %ymm2 |
1743 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
1744 | vpunpckldq %ymm10, %ymm8, %ymm12 |
1745 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
1746 | vpunpckldq %ymm11, %ymm9, %ymm14 |
1747 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
1748 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
1749 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
1750 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
1751 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
1752 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
1753 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
1754 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
1755 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
1756 | vmovdqa 832(%rax), %ymm0 |
1757 | vmovdqa 1024(%rax), %ymm1 |
1758 | vmovdqa 1216(%rax), %ymm2 |
1759 | vmovdqa 1408(%rax), %ymm3 |
1760 | vpunpcklwd 928(%rax), %ymm0, %ymm12 |
1761 | vpunpckhwd 928(%rax), %ymm0, %ymm13 |
1762 | vpunpcklwd 1120(%rax), %ymm1, %ymm14 |
1763 | vpunpckhwd 1120(%rax), %ymm1, %ymm15 |
1764 | vpunpcklwd 1312(%rax), %ymm2, %ymm0 |
1765 | vpunpckhwd 1312(%rax), %ymm2, %ymm1 |
1766 | vpunpcklwd 1504(%rax), %ymm3, %ymm2 |
1767 | vpunpckhwd 1504(%rax), %ymm3, %ymm3 |
1768 | vmovdqa %ymm11, 0(%rsp) |
1769 | vpunpckldq %ymm14, %ymm12, %ymm11 |
1770 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
1771 | vpunpckldq %ymm15, %ymm13, %ymm14 |
1772 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
1773 | vpunpckldq %ymm2, %ymm0, %ymm13 |
1774 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
1775 | vpunpckldq %ymm3, %ymm1, %ymm2 |
1776 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
1777 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
1778 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
1779 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
1780 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
1781 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
1782 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
1783 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
1784 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
1785 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
1786 | vmovdqa %ymm15, 1024(%r9) |
1787 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
1788 | vmovdqa %ymm15, 1056(%r9) |
1789 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
1790 | vmovdqa %ymm15, 1088(%r9) |
1791 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
1792 | vmovdqa %ymm15, 1120(%r9) |
1793 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
1794 | vmovdqa %ymm15, 1152(%r9) |
1795 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
1796 | vmovdqa %ymm15, 1184(%r9) |
1797 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
1798 | vmovdqa %ymm15, 1216(%r9) |
1799 | vpermq $78, %ymm4, %ymm4 |
1800 | vpermq $78, %ymm5, %ymm5 |
1801 | vpermq $78, %ymm6, %ymm6 |
1802 | vpermq $78, %ymm7, %ymm7 |
1803 | vpermq $78, %ymm8, %ymm8 |
1804 | vpermq $78, %ymm9, %ymm9 |
1805 | vpermq $78, %ymm10, %ymm10 |
1806 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
1807 | vmovdqa %ymm15, 1280(%r9) |
1808 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
1809 | vmovdqa %ymm15, 1312(%r9) |
1810 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
1811 | vmovdqa %ymm15, 1344(%r9) |
1812 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
1813 | vmovdqa %ymm15, 1376(%r9) |
1814 | vmovdqa 0(%rsp), %ymm11 |
1815 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
1816 | vmovdqa %ymm14, 1248(%r9) |
1817 | addq $32, %rsp |
1818 | subq $32, %rsp |
1819 | vmovdqa 0(%r11), %ymm0 |
1820 | vmovdqa 192(%r11), %ymm1 |
1821 | vmovdqa 384(%r11), %ymm2 |
1822 | vmovdqa 576(%r11), %ymm3 |
1823 | vpunpcklwd 96(%r11), %ymm0, %ymm4 |
1824 | vpunpckhwd 96(%r11), %ymm0, %ymm5 |
1825 | vpunpcklwd 288(%r11), %ymm1, %ymm6 |
1826 | vpunpckhwd 288(%r11), %ymm1, %ymm7 |
1827 | vpunpcklwd 480(%r11), %ymm2, %ymm8 |
1828 | vpunpckhwd 480(%r11), %ymm2, %ymm9 |
1829 | vpunpcklwd 672(%r11), %ymm3, %ymm10 |
1830 | vpunpckhwd 672(%r11), %ymm3, %ymm11 |
1831 | vpunpckldq %ymm6, %ymm4, %ymm0 |
1832 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
1833 | vpunpckldq %ymm7, %ymm5, %ymm2 |
1834 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
1835 | vpunpckldq %ymm10, %ymm8, %ymm12 |
1836 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
1837 | vpunpckldq %ymm11, %ymm9, %ymm14 |
1838 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
1839 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
1840 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
1841 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
1842 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
1843 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
1844 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
1845 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
1846 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
1847 | vmovdqa 768(%r11), %ymm0 |
1848 | vmovdqa 960(%r11), %ymm1 |
1849 | vmovdqa 1152(%r11), %ymm2 |
1850 | vmovdqa 1344(%r11), %ymm3 |
1851 | vpunpcklwd 864(%r11), %ymm0, %ymm12 |
1852 | vpunpckhwd 864(%r11), %ymm0, %ymm13 |
1853 | vpunpcklwd 1056(%r11), %ymm1, %ymm14 |
1854 | vpunpckhwd 1056(%r11), %ymm1, %ymm15 |
1855 | vpunpcklwd 1248(%r11), %ymm2, %ymm0 |
1856 | vpunpckhwd 1248(%r11), %ymm2, %ymm1 |
1857 | vpunpcklwd 1440(%r11), %ymm3, %ymm2 |
1858 | vpunpckhwd 1440(%r11), %ymm3, %ymm3 |
1859 | vmovdqa %ymm11, 0(%rsp) |
1860 | vpunpckldq %ymm14, %ymm12, %ymm11 |
1861 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
1862 | vpunpckldq %ymm15, %ymm13, %ymm14 |
1863 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
1864 | vpunpckldq %ymm2, %ymm0, %ymm13 |
1865 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
1866 | vpunpckldq %ymm3, %ymm1, %ymm2 |
1867 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
1868 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
1869 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
1870 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
1871 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
1872 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
1873 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
1874 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
1875 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
1876 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
1877 | vmovdqa %ymm15, 1408(%r9) |
1878 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
1879 | vmovdqa %ymm15, 1440(%r9) |
1880 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
1881 | vmovdqa %ymm15, 1472(%r9) |
1882 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
1883 | vmovdqa %ymm15, 1504(%r9) |
1884 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
1885 | vmovdqa %ymm15, 1536(%r9) |
1886 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
1887 | vmovdqa %ymm15, 1568(%r9) |
1888 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
1889 | vmovdqa %ymm15, 1600(%r9) |
1890 | vpermq $78, %ymm4, %ymm4 |
1891 | vpermq $78, %ymm5, %ymm5 |
1892 | vpermq $78, %ymm6, %ymm6 |
1893 | vpermq $78, %ymm7, %ymm7 |
1894 | vpermq $78, %ymm8, %ymm8 |
1895 | vpermq $78, %ymm9, %ymm9 |
1896 | vpermq $78, %ymm10, %ymm10 |
1897 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
1898 | vmovdqa %ymm15, 1664(%r9) |
1899 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
1900 | vmovdqa %ymm15, 1696(%r9) |
1901 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
1902 | vmovdqa %ymm15, 1728(%r9) |
1903 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
1904 | vmovdqa %ymm15, 1760(%r9) |
1905 | vinserti128 $0, %xmm8, %ymm12, %ymm15 |
1906 | vmovdqa %ymm15, 1792(%r9) |
1907 | vinserti128 $0, %xmm9, %ymm2, %ymm15 |
1908 | vmovdqa %ymm15, 1824(%r9) |
1909 | vinserti128 $0, %xmm10, %ymm14, %ymm15 |
1910 | vmovdqa %ymm15, 1856(%r9) |
1911 | vmovdqa 0(%rsp), %ymm11 |
1912 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
1913 | vmovdqa %ymm14, 1632(%r9) |
1914 | vpermq $78, %ymm11, %ymm11 |
1915 | vinserti128 $0, %xmm11, %ymm1, %ymm1 |
1916 | vmovdqa %ymm1, 1888(%r9) |
1917 | vmovdqa 32(%r11), %ymm0 |
1918 | vmovdqa 224(%r11), %ymm1 |
1919 | vmovdqa 416(%r11), %ymm2 |
1920 | vmovdqa 608(%r11), %ymm3 |
1921 | vpunpcklwd 128(%r11), %ymm0, %ymm4 |
1922 | vpunpckhwd 128(%r11), %ymm0, %ymm5 |
1923 | vpunpcklwd 320(%r11), %ymm1, %ymm6 |
1924 | vpunpckhwd 320(%r11), %ymm1, %ymm7 |
1925 | vpunpcklwd 512(%r11), %ymm2, %ymm8 |
1926 | vpunpckhwd 512(%r11), %ymm2, %ymm9 |
1927 | vpunpcklwd 704(%r11), %ymm3, %ymm10 |
1928 | vpunpckhwd 704(%r11), %ymm3, %ymm11 |
1929 | vpunpckldq %ymm6, %ymm4, %ymm0 |
1930 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
1931 | vpunpckldq %ymm7, %ymm5, %ymm2 |
1932 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
1933 | vpunpckldq %ymm10, %ymm8, %ymm12 |
1934 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
1935 | vpunpckldq %ymm11, %ymm9, %ymm14 |
1936 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
1937 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
1938 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
1939 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
1940 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
1941 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
1942 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
1943 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
1944 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
1945 | vmovdqa 800(%r11), %ymm0 |
1946 | vmovdqa 992(%r11), %ymm1 |
1947 | vmovdqa 1184(%r11), %ymm2 |
1948 | vmovdqa 1376(%r11), %ymm3 |
1949 | vpunpcklwd 896(%r11), %ymm0, %ymm12 |
1950 | vpunpckhwd 896(%r11), %ymm0, %ymm13 |
1951 | vpunpcklwd 1088(%r11), %ymm1, %ymm14 |
1952 | vpunpckhwd 1088(%r11), %ymm1, %ymm15 |
1953 | vpunpcklwd 1280(%r11), %ymm2, %ymm0 |
1954 | vpunpckhwd 1280(%r11), %ymm2, %ymm1 |
1955 | vpunpcklwd 1472(%r11), %ymm3, %ymm2 |
1956 | vpunpckhwd 1472(%r11), %ymm3, %ymm3 |
1957 | vmovdqa %ymm11, 0(%rsp) |
1958 | vpunpckldq %ymm14, %ymm12, %ymm11 |
1959 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
1960 | vpunpckldq %ymm15, %ymm13, %ymm14 |
1961 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
1962 | vpunpckldq %ymm2, %ymm0, %ymm13 |
1963 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
1964 | vpunpckldq %ymm3, %ymm1, %ymm2 |
1965 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
1966 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
1967 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
1968 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
1969 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
1970 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
1971 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
1972 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
1973 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
1974 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
1975 | vmovdqa %ymm15, 1920(%r9) |
1976 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
1977 | vmovdqa %ymm15, 1952(%r9) |
1978 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
1979 | vmovdqa %ymm15, 1984(%r9) |
1980 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
1981 | vmovdqa %ymm15, 2016(%r9) |
1982 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
1983 | vmovdqa %ymm15, 2048(%r9) |
1984 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
1985 | vmovdqa %ymm15, 2080(%r9) |
1986 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
1987 | vmovdqa %ymm15, 2112(%r9) |
1988 | vpermq $78, %ymm4, %ymm4 |
1989 | vpermq $78, %ymm5, %ymm5 |
1990 | vpermq $78, %ymm6, %ymm6 |
1991 | vpermq $78, %ymm7, %ymm7 |
1992 | vpermq $78, %ymm8, %ymm8 |
1993 | vpermq $78, %ymm9, %ymm9 |
1994 | vpermq $78, %ymm10, %ymm10 |
1995 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
1996 | vmovdqa %ymm15, 2176(%r9) |
1997 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
1998 | vmovdqa %ymm15, 2208(%r9) |
1999 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
2000 | vmovdqa %ymm15, 2240(%r9) |
2001 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
2002 | vmovdqa %ymm15, 2272(%r9) |
2003 | vinserti128 $0, %xmm8, %ymm12, %ymm15 |
2004 | vmovdqa %ymm15, 2304(%r9) |
2005 | vinserti128 $0, %xmm9, %ymm2, %ymm15 |
2006 | vmovdqa %ymm15, 2336(%r9) |
2007 | vinserti128 $0, %xmm10, %ymm14, %ymm15 |
2008 | vmovdqa %ymm15, 2368(%r9) |
2009 | vmovdqa 0(%rsp), %ymm11 |
2010 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
2011 | vmovdqa %ymm14, 2144(%r9) |
2012 | vpermq $78, %ymm11, %ymm11 |
2013 | vinserti128 $0, %xmm11, %ymm1, %ymm1 |
2014 | vmovdqa %ymm1, 2400(%r9) |
2015 | vmovdqa 64(%r11), %ymm0 |
2016 | vmovdqa 256(%r11), %ymm1 |
2017 | vmovdqa 448(%r11), %ymm2 |
2018 | vmovdqa 640(%r11), %ymm3 |
2019 | vpunpcklwd 160(%r11), %ymm0, %ymm4 |
2020 | vpunpckhwd 160(%r11), %ymm0, %ymm5 |
2021 | vpunpcklwd 352(%r11), %ymm1, %ymm6 |
2022 | vpunpckhwd 352(%r11), %ymm1, %ymm7 |
2023 | vpunpcklwd 544(%r11), %ymm2, %ymm8 |
2024 | vpunpckhwd 544(%r11), %ymm2, %ymm9 |
2025 | vpunpcklwd 736(%r11), %ymm3, %ymm10 |
2026 | vpunpckhwd 736(%r11), %ymm3, %ymm11 |
2027 | vpunpckldq %ymm6, %ymm4, %ymm0 |
2028 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
2029 | vpunpckldq %ymm7, %ymm5, %ymm2 |
2030 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
2031 | vpunpckldq %ymm10, %ymm8, %ymm12 |
2032 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
2033 | vpunpckldq %ymm11, %ymm9, %ymm14 |
2034 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
2035 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
2036 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
2037 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
2038 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
2039 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
2040 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
2041 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
2042 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
2043 | vmovdqa 832(%r11), %ymm0 |
2044 | vmovdqa 1024(%r11), %ymm1 |
2045 | vmovdqa 1216(%r11), %ymm2 |
2046 | vmovdqa 1408(%r11), %ymm3 |
2047 | vpunpcklwd 928(%r11), %ymm0, %ymm12 |
2048 | vpunpckhwd 928(%r11), %ymm0, %ymm13 |
2049 | vpunpcklwd 1120(%r11), %ymm1, %ymm14 |
2050 | vpunpckhwd 1120(%r11), %ymm1, %ymm15 |
2051 | vpunpcklwd 1312(%r11), %ymm2, %ymm0 |
2052 | vpunpckhwd 1312(%r11), %ymm2, %ymm1 |
2053 | vpunpcklwd 1504(%r11), %ymm3, %ymm2 |
2054 | vpunpckhwd 1504(%r11), %ymm3, %ymm3 |
2055 | vmovdqa %ymm11, 0(%rsp) |
2056 | vpunpckldq %ymm14, %ymm12, %ymm11 |
2057 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
2058 | vpunpckldq %ymm15, %ymm13, %ymm14 |
2059 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
2060 | vpunpckldq %ymm2, %ymm0, %ymm13 |
2061 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
2062 | vpunpckldq %ymm3, %ymm1, %ymm2 |
2063 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
2064 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
2065 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
2066 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
2067 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
2068 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
2069 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
2070 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
2071 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
2072 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
2073 | vmovdqa %ymm15, 2432(%r9) |
2074 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
2075 | vmovdqa %ymm15, 2464(%r9) |
2076 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
2077 | vmovdqa %ymm15, 2496(%r9) |
2078 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
2079 | vmovdqa %ymm15, 2528(%r9) |
2080 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
2081 | vmovdqa %ymm15, 2560(%r9) |
2082 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
2083 | vmovdqa %ymm15, 2592(%r9) |
2084 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
2085 | vmovdqa %ymm15, 2624(%r9) |
2086 | vpermq $78, %ymm4, %ymm4 |
2087 | vpermq $78, %ymm5, %ymm5 |
2088 | vpermq $78, %ymm6, %ymm6 |
2089 | vpermq $78, %ymm7, %ymm7 |
2090 | vpermq $78, %ymm8, %ymm8 |
2091 | vpermq $78, %ymm9, %ymm9 |
2092 | vpermq $78, %ymm10, %ymm10 |
2093 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
2094 | vmovdqa %ymm15, 2688(%r9) |
2095 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
2096 | vmovdqa %ymm15, 2720(%r9) |
2097 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
2098 | vmovdqa %ymm15, 2752(%r9) |
2099 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
2100 | vmovdqa %ymm15, 2784(%r9) |
2101 | vmovdqa 0(%rsp), %ymm11 |
2102 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
2103 | vmovdqa %ymm14, 2656(%r9) |
2104 | addq $32, %rsp |
2105 | innerloop_4eced63f144beffcb0247f9c6f67d165: |
2106 | vmovdqa 0(%r9), %ymm0 |
2107 | vmovdqa 1408(%r9), %ymm6 |
2108 | vmovdqa 32(%r9), %ymm1 |
2109 | vmovdqa 1440(%r9), %ymm7 |
2110 | vmovdqa 64(%r9), %ymm2 |
2111 | vmovdqa 1472(%r9), %ymm8 |
2112 | vmovdqa 96(%r9), %ymm3 |
2113 | vmovdqa 1504(%r9), %ymm9 |
2114 | vmovdqa 128(%r9), %ymm4 |
2115 | vmovdqa 1536(%r9), %ymm10 |
2116 | vmovdqa 160(%r9), %ymm5 |
2117 | vmovdqa 1568(%r9), %ymm11 |
2118 | vpmullw %ymm0, %ymm6, %ymm12 |
2119 | vmovdqa %ymm12, 2816(%r10) |
2120 | vpmullw %ymm0, %ymm7, %ymm13 |
2121 | vpmullw %ymm1, %ymm6, %ymm15 |
2122 | vpaddw %ymm13, %ymm15, %ymm13 |
2123 | vmovdqa %ymm13, 2848(%r10) |
2124 | vpmullw %ymm0, %ymm8, %ymm12 |
2125 | vpmullw %ymm1, %ymm7, %ymm15 |
2126 | vpaddw %ymm12, %ymm15, %ymm12 |
2127 | vpmullw %ymm2, %ymm6, %ymm15 |
2128 | vpaddw %ymm12, %ymm15, %ymm12 |
2129 | vmovdqa %ymm12, 2880(%r10) |
2130 | vpmullw %ymm0, %ymm9, %ymm13 |
2131 | vpmullw %ymm1, %ymm8, %ymm15 |
2132 | vpaddw %ymm13, %ymm15, %ymm13 |
2133 | vpmullw %ymm2, %ymm7, %ymm15 |
2134 | vpaddw %ymm13, %ymm15, %ymm13 |
2135 | vpmullw %ymm3, %ymm6, %ymm15 |
2136 | vpaddw %ymm13, %ymm15, %ymm13 |
2137 | vmovdqa %ymm13, 2912(%r10) |
2138 | vpmullw %ymm0, %ymm10, %ymm12 |
2139 | vpmullw %ymm1, %ymm9, %ymm15 |
2140 | vpaddw %ymm12, %ymm15, %ymm12 |
2141 | vpmullw %ymm2, %ymm8, %ymm15 |
2142 | vpaddw %ymm12, %ymm15, %ymm12 |
2143 | vpmullw %ymm3, %ymm7, %ymm15 |
2144 | vpaddw %ymm12, %ymm15, %ymm12 |
2145 | vpmullw %ymm4, %ymm6, %ymm15 |
2146 | vpaddw %ymm12, %ymm15, %ymm12 |
2147 | vmovdqa %ymm12, 2944(%r10) |
2148 | vpmullw %ymm0, %ymm11, %ymm13 |
2149 | vpmullw %ymm1, %ymm10, %ymm15 |
2150 | vpaddw %ymm13, %ymm15, %ymm13 |
2151 | vpmullw %ymm2, %ymm9, %ymm15 |
2152 | vpaddw %ymm13, %ymm15, %ymm13 |
2153 | vpmullw %ymm3, %ymm8, %ymm15 |
2154 | vpaddw %ymm13, %ymm15, %ymm13 |
2155 | vpmullw %ymm4, %ymm7, %ymm15 |
2156 | vpaddw %ymm13, %ymm15, %ymm13 |
2157 | vpmullw %ymm5, %ymm6, %ymm15 |
2158 | vpaddw %ymm13, %ymm15, %ymm13 |
2159 | vmovdqa %ymm13, 2976(%r10) |
2160 | vpmullw %ymm1, %ymm11, %ymm12 |
2161 | vpmullw %ymm2, %ymm10, %ymm15 |
2162 | vpaddw %ymm12, %ymm15, %ymm12 |
2163 | vpmullw %ymm3, %ymm9, %ymm15 |
2164 | vpaddw %ymm12, %ymm15, %ymm12 |
2165 | vpmullw %ymm4, %ymm8, %ymm15 |
2166 | vpaddw %ymm12, %ymm15, %ymm12 |
2167 | vpmullw %ymm5, %ymm7, %ymm15 |
2168 | vpaddw %ymm12, %ymm15, %ymm12 |
2169 | vmovdqa %ymm12, 3008(%r10) |
2170 | vpmullw %ymm2, %ymm11, %ymm13 |
2171 | vpmullw %ymm3, %ymm10, %ymm15 |
2172 | vpaddw %ymm13, %ymm15, %ymm13 |
2173 | vpmullw %ymm4, %ymm9, %ymm15 |
2174 | vpaddw %ymm13, %ymm15, %ymm13 |
2175 | vpmullw %ymm5, %ymm8, %ymm15 |
2176 | vpaddw %ymm13, %ymm15, %ymm13 |
2177 | vmovdqa %ymm13, 3040(%r10) |
2178 | vpmullw %ymm3, %ymm11, %ymm12 |
2179 | vpmullw %ymm4, %ymm10, %ymm15 |
2180 | vpaddw %ymm12, %ymm15, %ymm12 |
2181 | vpmullw %ymm5, %ymm9, %ymm15 |
2182 | vpaddw %ymm12, %ymm15, %ymm12 |
2183 | vmovdqa %ymm12, 3072(%r10) |
2184 | vpmullw %ymm4, %ymm11, %ymm13 |
2185 | vpmullw %ymm5, %ymm10, %ymm15 |
2186 | vpaddw %ymm13, %ymm15, %ymm13 |
2187 | vmovdqa %ymm13, 3104(%r10) |
2188 | vpmullw %ymm5, %ymm11, %ymm12 |
2189 | vmovdqa %ymm12, 3136(%r10) |
2190 | vmovdqa 192(%r9), %ymm0 |
2191 | vmovdqa 1600(%r9), %ymm6 |
2192 | vmovdqa 224(%r9), %ymm1 |
2193 | vmovdqa 1632(%r9), %ymm7 |
2194 | vmovdqa 256(%r9), %ymm2 |
2195 | vmovdqa 1664(%r9), %ymm8 |
2196 | vmovdqa 288(%r9), %ymm3 |
2197 | vmovdqa 1696(%r9), %ymm9 |
2198 | vmovdqa 320(%r9), %ymm4 |
2199 | vmovdqa 1728(%r9), %ymm10 |
2200 | vpmullw %ymm0, %ymm6, %ymm12 |
2201 | vmovdqa %ymm12, 3200(%r10) |
2202 | vpmullw %ymm0, %ymm7, %ymm13 |
2203 | vpmullw %ymm1, %ymm6, %ymm15 |
2204 | vpaddw %ymm13, %ymm15, %ymm13 |
2205 | vmovdqa %ymm13, 3232(%r10) |
2206 | vpmullw %ymm0, %ymm8, %ymm12 |
2207 | vpmullw %ymm1, %ymm7, %ymm15 |
2208 | vpaddw %ymm12, %ymm15, %ymm12 |
2209 | vpmullw %ymm2, %ymm6, %ymm15 |
2210 | vpaddw %ymm12, %ymm15, %ymm12 |
2211 | vmovdqa %ymm12, 3264(%r10) |
2212 | vpmullw %ymm0, %ymm9, %ymm13 |
2213 | vpmullw %ymm1, %ymm8, %ymm15 |
2214 | vpaddw %ymm13, %ymm15, %ymm13 |
2215 | vpmullw %ymm2, %ymm7, %ymm15 |
2216 | vpaddw %ymm13, %ymm15, %ymm13 |
2217 | vpmullw %ymm3, %ymm6, %ymm15 |
2218 | vpaddw %ymm13, %ymm15, %ymm13 |
2219 | vmovdqa %ymm13, 3296(%r10) |
2220 | vpmullw %ymm0, %ymm10, %ymm12 |
2221 | vpmullw %ymm1, %ymm9, %ymm15 |
2222 | vpaddw %ymm12, %ymm15, %ymm12 |
2223 | vpmullw %ymm2, %ymm8, %ymm15 |
2224 | vpaddw %ymm12, %ymm15, %ymm12 |
2225 | vpmullw %ymm3, %ymm7, %ymm15 |
2226 | vpaddw %ymm12, %ymm15, %ymm12 |
2227 | vpmullw %ymm4, %ymm6, %ymm15 |
2228 | vpaddw %ymm12, %ymm15, %ymm12 |
2229 | vmovdqa %ymm12, 3328(%r10) |
2230 | vpmullw %ymm1, %ymm10, %ymm13 |
2231 | vpmullw %ymm2, %ymm9, %ymm15 |
2232 | vpaddw %ymm13, %ymm15, %ymm13 |
2233 | vpmullw %ymm3, %ymm8, %ymm15 |
2234 | vpaddw %ymm13, %ymm15, %ymm13 |
2235 | vpmullw %ymm4, %ymm7, %ymm15 |
2236 | vpaddw %ymm13, %ymm15, %ymm13 |
2237 | vmovdqa %ymm13, 3360(%r10) |
2238 | vpmullw %ymm2, %ymm10, %ymm12 |
2239 | vpmullw %ymm3, %ymm9, %ymm15 |
2240 | vpaddw %ymm12, %ymm15, %ymm12 |
2241 | vpmullw %ymm4, %ymm8, %ymm15 |
2242 | vpaddw %ymm12, %ymm15, %ymm12 |
2243 | vmovdqa %ymm12, 3392(%r10) |
2244 | vpmullw %ymm3, %ymm10, %ymm13 |
2245 | vpmullw %ymm4, %ymm9, %ymm15 |
2246 | vpaddw %ymm13, %ymm15, %ymm13 |
2247 | vmovdqa %ymm13, 3424(%r10) |
2248 | vpmullw %ymm4, %ymm10, %ymm12 |
2249 | vmovdqa %ymm12, 3456(%r10) |
2250 | vpaddw 0(%r9), %ymm0, %ymm0 |
2251 | vpaddw 1408(%r9), %ymm6, %ymm6 |
2252 | vpaddw 32(%r9), %ymm1, %ymm1 |
2253 | vpaddw 1440(%r9), %ymm7, %ymm7 |
2254 | vpaddw 64(%r9), %ymm2, %ymm2 |
2255 | vpaddw 1472(%r9), %ymm8, %ymm8 |
2256 | vpaddw 96(%r9), %ymm3, %ymm3 |
2257 | vpaddw 1504(%r9), %ymm9, %ymm9 |
2258 | vpaddw 128(%r9), %ymm4, %ymm4 |
2259 | vpaddw 1536(%r9), %ymm10, %ymm10 |
2260 | vpmullw %ymm0, %ymm11, %ymm12 |
2261 | vpmullw %ymm1, %ymm10, %ymm15 |
2262 | vpaddw %ymm15, %ymm12, %ymm12 |
2263 | vpmullw %ymm2, %ymm9, %ymm15 |
2264 | vpaddw %ymm15, %ymm12, %ymm12 |
2265 | vpmullw %ymm3, %ymm8, %ymm15 |
2266 | vpaddw %ymm15, %ymm12, %ymm12 |
2267 | vpmullw %ymm4, %ymm7, %ymm15 |
2268 | vpaddw %ymm15, %ymm12, %ymm12 |
2269 | vpmullw %ymm5, %ymm6, %ymm15 |
2270 | vpaddw %ymm15, %ymm12, %ymm12 |
2271 | vpsubw 2976(%r10), %ymm12, %ymm12 |
2272 | vpsubw 3360(%r10), %ymm12, %ymm12 |
2273 | vmovdqa %ymm12, 3168(%r10) |
2274 | vpmullw %ymm5, %ymm7, %ymm12 |
2275 | vpmullw %ymm5, %ymm8, %ymm13 |
2276 | vpmullw %ymm5, %ymm9, %ymm14 |
2277 | vpmullw %ymm5, %ymm10, %ymm15 |
2278 | vpmullw %ymm1, %ymm11, %ymm5 |
2279 | vpaddw %ymm5, %ymm12, %ymm12 |
2280 | vpmullw %ymm2, %ymm10, %ymm5 |
2281 | vpaddw %ymm5, %ymm12, %ymm12 |
2282 | vpmullw %ymm3, %ymm9, %ymm5 |
2283 | vpaddw %ymm5, %ymm12, %ymm12 |
2284 | vpmullw %ymm4, %ymm8, %ymm5 |
2285 | vpaddw %ymm5, %ymm12, %ymm12 |
2286 | vpmullw %ymm2, %ymm11, %ymm5 |
2287 | vpaddw %ymm5, %ymm13, %ymm13 |
2288 | vpmullw %ymm3, %ymm10, %ymm5 |
2289 | vpaddw %ymm5, %ymm13, %ymm13 |
2290 | vpmullw %ymm4, %ymm9, %ymm5 |
2291 | vpaddw %ymm5, %ymm13, %ymm13 |
2292 | vpmullw %ymm3, %ymm11, %ymm5 |
2293 | vpaddw %ymm5, %ymm14, %ymm14 |
2294 | vpmullw %ymm4, %ymm10, %ymm5 |
2295 | vpaddw %ymm5, %ymm14, %ymm14 |
2296 | vpmullw %ymm4, %ymm11, %ymm5 |
2297 | vpaddw %ymm5, %ymm15, %ymm15 |
2298 | vpmullw %ymm0, %ymm10, %ymm11 |
2299 | vpmullw %ymm1, %ymm9, %ymm5 |
2300 | vpaddw %ymm5, %ymm11, %ymm11 |
2301 | vpmullw %ymm2, %ymm8, %ymm5 |
2302 | vpaddw %ymm5, %ymm11, %ymm11 |
2303 | vpmullw %ymm3, %ymm7, %ymm5 |
2304 | vpaddw %ymm5, %ymm11, %ymm11 |
2305 | vpmullw %ymm4, %ymm6, %ymm5 |
2306 | vpaddw %ymm5, %ymm11, %ymm11 |
2307 | vpmullw %ymm0, %ymm9, %ymm10 |
2308 | vpmullw %ymm1, %ymm8, %ymm5 |
2309 | vpaddw %ymm5, %ymm10, %ymm10 |
2310 | vpmullw %ymm2, %ymm7, %ymm5 |
2311 | vpaddw %ymm5, %ymm10, %ymm10 |
2312 | vpmullw %ymm3, %ymm6, %ymm5 |
2313 | vpaddw %ymm5, %ymm10, %ymm10 |
2314 | vpmullw %ymm0, %ymm8, %ymm9 |
2315 | vpmullw %ymm1, %ymm7, %ymm5 |
2316 | vpaddw %ymm5, %ymm9, %ymm9 |
2317 | vpmullw %ymm2, %ymm6, %ymm5 |
2318 | vpaddw %ymm5, %ymm9, %ymm9 |
2319 | vpmullw %ymm0, %ymm7, %ymm8 |
2320 | vpmullw %ymm1, %ymm6, %ymm5 |
2321 | vpaddw %ymm5, %ymm8, %ymm8 |
2322 | vpmullw %ymm0, %ymm6, %ymm7 |
2323 | vmovdqa 3008(%r10), %ymm0 |
2324 | vpsubw 3200(%r10), %ymm0, %ymm0 |
2325 | vpsubw %ymm0, %ymm12, %ymm6 |
2326 | vpsubw 3392(%r10), %ymm6, %ymm6 |
2327 | vmovdqa %ymm6, 3200(%r10) |
2328 | vpaddw %ymm7, %ymm0, %ymm0 |
2329 | vpsubw 2816(%r10), %ymm0, %ymm0 |
2330 | vmovdqa %ymm0, 3008(%r10) |
2331 | vmovdqa 3040(%r10), %ymm1 |
2332 | vpsubw 3232(%r10), %ymm1, %ymm1 |
2333 | vpsubw %ymm1, %ymm13, %ymm7 |
2334 | vpsubw 3424(%r10), %ymm7, %ymm7 |
2335 | vmovdqa %ymm7, 3232(%r10) |
2336 | vpaddw %ymm8, %ymm1, %ymm1 |
2337 | vpsubw 2848(%r10), %ymm1, %ymm1 |
2338 | vmovdqa %ymm1, 3040(%r10) |
2339 | vmovdqa 3072(%r10), %ymm2 |
2340 | vpsubw 3264(%r10), %ymm2, %ymm2 |
2341 | vpsubw %ymm2, %ymm14, %ymm8 |
2342 | vpsubw 3456(%r10), %ymm8, %ymm8 |
2343 | vmovdqa %ymm8, 3264(%r10) |
2344 | vpaddw %ymm9, %ymm2, %ymm2 |
2345 | vpsubw 2880(%r10), %ymm2, %ymm2 |
2346 | vmovdqa %ymm2, 3072(%r10) |
2347 | vmovdqa 3104(%r10), %ymm3 |
2348 | vpsubw 3296(%r10), %ymm3, %ymm3 |
2349 | vpsubw %ymm3, %ymm15, %ymm9 |
2350 | vmovdqa %ymm9, 3296(%r10) |
2351 | vpaddw %ymm10, %ymm3, %ymm3 |
2352 | vpsubw 2912(%r10), %ymm3, %ymm3 |
2353 | vmovdqa %ymm3, 3104(%r10) |
2354 | vmovdqa 3136(%r10), %ymm4 |
2355 | vpsubw 3328(%r10), %ymm4, %ymm4 |
2356 | vpaddw %ymm11, %ymm4, %ymm4 |
2357 | vpsubw 2944(%r10), %ymm4, %ymm4 |
2358 | vmovdqa %ymm4, 3136(%r10) |
2359 | vmovdqa 352(%r9), %ymm0 |
2360 | vmovdqa 1760(%r9), %ymm6 |
2361 | vmovdqa 384(%r9), %ymm1 |
2362 | vmovdqa 1792(%r9), %ymm7 |
2363 | vmovdqa 416(%r9), %ymm2 |
2364 | vmovdqa 1824(%r9), %ymm8 |
2365 | vmovdqa 448(%r9), %ymm3 |
2366 | vmovdqa 1856(%r9), %ymm9 |
2367 | vmovdqa 480(%r9), %ymm4 |
2368 | vmovdqa 1888(%r9), %ymm10 |
2369 | vmovdqa 512(%r9), %ymm5 |
2370 | vmovdqa 1920(%r9), %ymm11 |
2371 | vpmullw %ymm0, %ymm6, %ymm12 |
2372 | vmovdqa %ymm12, 3520(%r10) |
2373 | vpmullw %ymm0, %ymm7, %ymm13 |
2374 | vpmullw %ymm1, %ymm6, %ymm15 |
2375 | vpaddw %ymm13, %ymm15, %ymm13 |
2376 | vmovdqa %ymm13, 3552(%r10) |
2377 | vpmullw %ymm0, %ymm8, %ymm12 |
2378 | vpmullw %ymm1, %ymm7, %ymm15 |
2379 | vpaddw %ymm12, %ymm15, %ymm12 |
2380 | vpmullw %ymm2, %ymm6, %ymm15 |
2381 | vpaddw %ymm12, %ymm15, %ymm12 |
2382 | vmovdqa %ymm12, 3584(%r10) |
2383 | vpmullw %ymm0, %ymm9, %ymm13 |
2384 | vpmullw %ymm1, %ymm8, %ymm15 |
2385 | vpaddw %ymm13, %ymm15, %ymm13 |
2386 | vpmullw %ymm2, %ymm7, %ymm15 |
2387 | vpaddw %ymm13, %ymm15, %ymm13 |
2388 | vpmullw %ymm3, %ymm6, %ymm15 |
2389 | vpaddw %ymm13, %ymm15, %ymm13 |
2390 | vmovdqa %ymm13, 3616(%r10) |
2391 | vpmullw %ymm0, %ymm10, %ymm12 |
2392 | vpmullw %ymm1, %ymm9, %ymm15 |
2393 | vpaddw %ymm12, %ymm15, %ymm12 |
2394 | vpmullw %ymm2, %ymm8, %ymm15 |
2395 | vpaddw %ymm12, %ymm15, %ymm12 |
2396 | vpmullw %ymm3, %ymm7, %ymm15 |
2397 | vpaddw %ymm12, %ymm15, %ymm12 |
2398 | vpmullw %ymm4, %ymm6, %ymm15 |
2399 | vpaddw %ymm12, %ymm15, %ymm12 |
2400 | vmovdqa %ymm12, 3648(%r10) |
2401 | vpmullw %ymm0, %ymm11, %ymm13 |
2402 | vpmullw %ymm1, %ymm10, %ymm15 |
2403 | vpaddw %ymm13, %ymm15, %ymm13 |
2404 | vpmullw %ymm2, %ymm9, %ymm15 |
2405 | vpaddw %ymm13, %ymm15, %ymm13 |
2406 | vpmullw %ymm3, %ymm8, %ymm15 |
2407 | vpaddw %ymm13, %ymm15, %ymm13 |
2408 | vpmullw %ymm4, %ymm7, %ymm15 |
2409 | vpaddw %ymm13, %ymm15, %ymm13 |
2410 | vpmullw %ymm5, %ymm6, %ymm15 |
2411 | vpaddw %ymm13, %ymm15, %ymm13 |
2412 | vmovdqa %ymm13, 3680(%r10) |
2413 | vpmullw %ymm1, %ymm11, %ymm12 |
2414 | vpmullw %ymm2, %ymm10, %ymm15 |
2415 | vpaddw %ymm12, %ymm15, %ymm12 |
2416 | vpmullw %ymm3, %ymm9, %ymm15 |
2417 | vpaddw %ymm12, %ymm15, %ymm12 |
2418 | vpmullw %ymm4, %ymm8, %ymm15 |
2419 | vpaddw %ymm12, %ymm15, %ymm12 |
2420 | vpmullw %ymm5, %ymm7, %ymm15 |
2421 | vpaddw %ymm12, %ymm15, %ymm12 |
2422 | vmovdqa %ymm12, 3712(%r10) |
2423 | vpmullw %ymm2, %ymm11, %ymm13 |
2424 | vpmullw %ymm3, %ymm10, %ymm15 |
2425 | vpaddw %ymm13, %ymm15, %ymm13 |
2426 | vpmullw %ymm4, %ymm9, %ymm15 |
2427 | vpaddw %ymm13, %ymm15, %ymm13 |
2428 | vpmullw %ymm5, %ymm8, %ymm15 |
2429 | vpaddw %ymm13, %ymm15, %ymm13 |
2430 | vmovdqa %ymm13, 3744(%r10) |
2431 | vpmullw %ymm3, %ymm11, %ymm12 |
2432 | vpmullw %ymm4, %ymm10, %ymm15 |
2433 | vpaddw %ymm12, %ymm15, %ymm12 |
2434 | vpmullw %ymm5, %ymm9, %ymm15 |
2435 | vpaddw %ymm12, %ymm15, %ymm12 |
2436 | vmovdqa %ymm12, 3776(%r10) |
2437 | vpmullw %ymm4, %ymm11, %ymm13 |
2438 | vpmullw %ymm5, %ymm10, %ymm15 |
2439 | vpaddw %ymm13, %ymm15, %ymm13 |
2440 | vmovdqa %ymm13, 3808(%r10) |
2441 | vpmullw %ymm5, %ymm11, %ymm12 |
2442 | vmovdqa %ymm12, 3840(%r10) |
2443 | vmovdqa 544(%r9), %ymm0 |
2444 | vmovdqa 1952(%r9), %ymm6 |
2445 | vmovdqa 576(%r9), %ymm1 |
2446 | vmovdqa 1984(%r9), %ymm7 |
2447 | vmovdqa 608(%r9), %ymm2 |
2448 | vmovdqa 2016(%r9), %ymm8 |
2449 | vmovdqa 640(%r9), %ymm3 |
2450 | vmovdqa 2048(%r9), %ymm9 |
2451 | vmovdqa 672(%r9), %ymm4 |
2452 | vmovdqa 2080(%r9), %ymm10 |
2453 | vpmullw %ymm0, %ymm6, %ymm12 |
2454 | vmovdqa %ymm12, 3904(%r10) |
2455 | vpmullw %ymm0, %ymm7, %ymm13 |
2456 | vpmullw %ymm1, %ymm6, %ymm15 |
2457 | vpaddw %ymm13, %ymm15, %ymm13 |
2458 | vmovdqa %ymm13, 3936(%r10) |
2459 | vpmullw %ymm0, %ymm8, %ymm12 |
2460 | vpmullw %ymm1, %ymm7, %ymm15 |
2461 | vpaddw %ymm12, %ymm15, %ymm12 |
2462 | vpmullw %ymm2, %ymm6, %ymm15 |
2463 | vpaddw %ymm12, %ymm15, %ymm12 |
2464 | vmovdqa %ymm12, 3968(%r10) |
2465 | vpmullw %ymm0, %ymm9, %ymm13 |
2466 | vpmullw %ymm1, %ymm8, %ymm15 |
2467 | vpaddw %ymm13, %ymm15, %ymm13 |
2468 | vpmullw %ymm2, %ymm7, %ymm15 |
2469 | vpaddw %ymm13, %ymm15, %ymm13 |
2470 | vpmullw %ymm3, %ymm6, %ymm15 |
2471 | vpaddw %ymm13, %ymm15, %ymm13 |
2472 | vmovdqa %ymm13, 4000(%r10) |
2473 | vpmullw %ymm0, %ymm10, %ymm12 |
2474 | vpmullw %ymm1, %ymm9, %ymm15 |
2475 | vpaddw %ymm12, %ymm15, %ymm12 |
2476 | vpmullw %ymm2, %ymm8, %ymm15 |
2477 | vpaddw %ymm12, %ymm15, %ymm12 |
2478 | vpmullw %ymm3, %ymm7, %ymm15 |
2479 | vpaddw %ymm12, %ymm15, %ymm12 |
2480 | vpmullw %ymm4, %ymm6, %ymm15 |
2481 | vpaddw %ymm12, %ymm15, %ymm12 |
2482 | vmovdqa %ymm12, 4032(%r10) |
2483 | vpmullw %ymm1, %ymm10, %ymm13 |
2484 | vpmullw %ymm2, %ymm9, %ymm15 |
2485 | vpaddw %ymm13, %ymm15, %ymm13 |
2486 | vpmullw %ymm3, %ymm8, %ymm15 |
2487 | vpaddw %ymm13, %ymm15, %ymm13 |
2488 | vpmullw %ymm4, %ymm7, %ymm15 |
2489 | vpaddw %ymm13, %ymm15, %ymm13 |
2490 | vmovdqa %ymm13, 4064(%r10) |
2491 | vpmullw %ymm2, %ymm10, %ymm12 |
2492 | vpmullw %ymm3, %ymm9, %ymm15 |
2493 | vpaddw %ymm12, %ymm15, %ymm12 |
2494 | vpmullw %ymm4, %ymm8, %ymm15 |
2495 | vpaddw %ymm12, %ymm15, %ymm12 |
2496 | vmovdqa %ymm12, 4096(%r10) |
2497 | vpmullw %ymm3, %ymm10, %ymm13 |
2498 | vpmullw %ymm4, %ymm9, %ymm15 |
2499 | vpaddw %ymm13, %ymm15, %ymm13 |
2500 | vmovdqa %ymm13, 4128(%r10) |
2501 | vpmullw %ymm4, %ymm10, %ymm12 |
2502 | vmovdqa %ymm12, 4160(%r10) |
2503 | vpaddw 352(%r9), %ymm0, %ymm0 |
2504 | vpaddw 1760(%r9), %ymm6, %ymm6 |
2505 | vpaddw 384(%r9), %ymm1, %ymm1 |
2506 | vpaddw 1792(%r9), %ymm7, %ymm7 |
2507 | vpaddw 416(%r9), %ymm2, %ymm2 |
2508 | vpaddw 1824(%r9), %ymm8, %ymm8 |
2509 | vpaddw 448(%r9), %ymm3, %ymm3 |
2510 | vpaddw 1856(%r9), %ymm9, %ymm9 |
2511 | vpaddw 480(%r9), %ymm4, %ymm4 |
2512 | vpaddw 1888(%r9), %ymm10, %ymm10 |
2513 | vpmullw %ymm0, %ymm11, %ymm12 |
2514 | vpmullw %ymm1, %ymm10, %ymm15 |
2515 | vpaddw %ymm15, %ymm12, %ymm12 |
2516 | vpmullw %ymm2, %ymm9, %ymm15 |
2517 | vpaddw %ymm15, %ymm12, %ymm12 |
2518 | vpmullw %ymm3, %ymm8, %ymm15 |
2519 | vpaddw %ymm15, %ymm12, %ymm12 |
2520 | vpmullw %ymm4, %ymm7, %ymm15 |
2521 | vpaddw %ymm15, %ymm12, %ymm12 |
2522 | vpmullw %ymm5, %ymm6, %ymm15 |
2523 | vpaddw %ymm15, %ymm12, %ymm12 |
2524 | vpsubw 3680(%r10), %ymm12, %ymm12 |
2525 | vpsubw 4064(%r10), %ymm12, %ymm12 |
2526 | vmovdqa %ymm12, 3872(%r10) |
2527 | vpmullw %ymm5, %ymm7, %ymm12 |
2528 | vpmullw %ymm5, %ymm8, %ymm13 |
2529 | vpmullw %ymm5, %ymm9, %ymm14 |
2530 | vpmullw %ymm5, %ymm10, %ymm15 |
2531 | vpmullw %ymm1, %ymm11, %ymm5 |
2532 | vpaddw %ymm5, %ymm12, %ymm12 |
2533 | vpmullw %ymm2, %ymm10, %ymm5 |
2534 | vpaddw %ymm5, %ymm12, %ymm12 |
2535 | vpmullw %ymm3, %ymm9, %ymm5 |
2536 | vpaddw %ymm5, %ymm12, %ymm12 |
2537 | vpmullw %ymm4, %ymm8, %ymm5 |
2538 | vpaddw %ymm5, %ymm12, %ymm12 |
2539 | vpmullw %ymm2, %ymm11, %ymm5 |
2540 | vpaddw %ymm5, %ymm13, %ymm13 |
2541 | vpmullw %ymm3, %ymm10, %ymm5 |
2542 | vpaddw %ymm5, %ymm13, %ymm13 |
2543 | vpmullw %ymm4, %ymm9, %ymm5 |
2544 | vpaddw %ymm5, %ymm13, %ymm13 |
2545 | vpmullw %ymm3, %ymm11, %ymm5 |
2546 | vpaddw %ymm5, %ymm14, %ymm14 |
2547 | vpmullw %ymm4, %ymm10, %ymm5 |
2548 | vpaddw %ymm5, %ymm14, %ymm14 |
2549 | vpmullw %ymm4, %ymm11, %ymm5 |
2550 | vpaddw %ymm5, %ymm15, %ymm15 |
2551 | vpmullw %ymm0, %ymm10, %ymm11 |
2552 | vpmullw %ymm1, %ymm9, %ymm5 |
2553 | vpaddw %ymm5, %ymm11, %ymm11 |
2554 | vpmullw %ymm2, %ymm8, %ymm5 |
2555 | vpaddw %ymm5, %ymm11, %ymm11 |
2556 | vpmullw %ymm3, %ymm7, %ymm5 |
2557 | vpaddw %ymm5, %ymm11, %ymm11 |
2558 | vpmullw %ymm4, %ymm6, %ymm5 |
2559 | vpaddw %ymm5, %ymm11, %ymm11 |
2560 | vpmullw %ymm0, %ymm9, %ymm10 |
2561 | vpmullw %ymm1, %ymm8, %ymm5 |
2562 | vpaddw %ymm5, %ymm10, %ymm10 |
2563 | vpmullw %ymm2, %ymm7, %ymm5 |
2564 | vpaddw %ymm5, %ymm10, %ymm10 |
2565 | vpmullw %ymm3, %ymm6, %ymm5 |
2566 | vpaddw %ymm5, %ymm10, %ymm10 |
2567 | vpmullw %ymm0, %ymm8, %ymm9 |
2568 | vpmullw %ymm1, %ymm7, %ymm5 |
2569 | vpaddw %ymm5, %ymm9, %ymm9 |
2570 | vpmullw %ymm2, %ymm6, %ymm5 |
2571 | vpaddw %ymm5, %ymm9, %ymm9 |
2572 | vpmullw %ymm0, %ymm7, %ymm8 |
2573 | vpmullw %ymm1, %ymm6, %ymm5 |
2574 | vpaddw %ymm5, %ymm8, %ymm8 |
2575 | vpmullw %ymm0, %ymm6, %ymm7 |
2576 | vmovdqa 3712(%r10), %ymm0 |
2577 | vpsubw 3904(%r10), %ymm0, %ymm0 |
2578 | vpsubw %ymm0, %ymm12, %ymm6 |
2579 | vpsubw 4096(%r10), %ymm6, %ymm6 |
2580 | vmovdqa %ymm6, 3904(%r10) |
2581 | vpaddw %ymm7, %ymm0, %ymm0 |
2582 | vpsubw 3520(%r10), %ymm0, %ymm0 |
2583 | vmovdqa %ymm0, 3712(%r10) |
2584 | vmovdqa 3744(%r10), %ymm1 |
2585 | vpsubw 3936(%r10), %ymm1, %ymm1 |
2586 | vpsubw %ymm1, %ymm13, %ymm7 |
2587 | vpsubw 4128(%r10), %ymm7, %ymm7 |
2588 | vmovdqa %ymm7, 3936(%r10) |
2589 | vpaddw %ymm8, %ymm1, %ymm1 |
2590 | vpsubw 3552(%r10), %ymm1, %ymm1 |
2591 | vmovdqa %ymm1, 3744(%r10) |
2592 | vmovdqa 3776(%r10), %ymm2 |
2593 | vpsubw 3968(%r10), %ymm2, %ymm2 |
2594 | vpsubw %ymm2, %ymm14, %ymm8 |
2595 | vpsubw 4160(%r10), %ymm8, %ymm8 |
2596 | vmovdqa %ymm8, 3968(%r10) |
2597 | vpaddw %ymm9, %ymm2, %ymm2 |
2598 | vpsubw 3584(%r10), %ymm2, %ymm2 |
2599 | vmovdqa %ymm2, 3776(%r10) |
2600 | vmovdqa 3808(%r10), %ymm3 |
2601 | vpsubw 4000(%r10), %ymm3, %ymm3 |
2602 | vpsubw %ymm3, %ymm15, %ymm9 |
2603 | vmovdqa %ymm9, 4000(%r10) |
2604 | vpaddw %ymm10, %ymm3, %ymm3 |
2605 | vpsubw 3616(%r10), %ymm3, %ymm3 |
2606 | vmovdqa %ymm3, 3808(%r10) |
2607 | vmovdqa 3840(%r10), %ymm4 |
2608 | vpsubw 4032(%r10), %ymm4, %ymm4 |
2609 | vpaddw %ymm11, %ymm4, %ymm4 |
2610 | vpsubw 3648(%r10), %ymm4, %ymm4 |
2611 | vmovdqa %ymm4, 3840(%r10) |
2612 | vmovdqa 0(%r9), %ymm0 |
2613 | vmovdqa 1408(%r9), %ymm6 |
2614 | vpaddw 352(%r9), %ymm0, %ymm0 |
2615 | vpaddw 1760(%r9), %ymm6, %ymm6 |
2616 | vmovdqa 32(%r9), %ymm1 |
2617 | vmovdqa 1440(%r9), %ymm7 |
2618 | vpaddw 384(%r9), %ymm1, %ymm1 |
2619 | vpaddw 1792(%r9), %ymm7, %ymm7 |
2620 | vmovdqa 64(%r9), %ymm2 |
2621 | vmovdqa 1472(%r9), %ymm8 |
2622 | vpaddw 416(%r9), %ymm2, %ymm2 |
2623 | vpaddw 1824(%r9), %ymm8, %ymm8 |
2624 | vmovdqa 96(%r9), %ymm3 |
2625 | vmovdqa 1504(%r9), %ymm9 |
2626 | vpaddw 448(%r9), %ymm3, %ymm3 |
2627 | vpaddw 1856(%r9), %ymm9, %ymm9 |
2628 | vmovdqa 128(%r9), %ymm4 |
2629 | vmovdqa 1536(%r9), %ymm10 |
2630 | vpaddw 480(%r9), %ymm4, %ymm4 |
2631 | vpaddw 1888(%r9), %ymm10, %ymm10 |
2632 | vmovdqa 160(%r9), %ymm5 |
2633 | vmovdqa 1568(%r9), %ymm11 |
2634 | vpaddw 512(%r9), %ymm5, %ymm5 |
2635 | vpaddw 1920(%r9), %ymm11, %ymm11 |
2636 | vpmullw %ymm0, %ymm6, %ymm12 |
2637 | vmovdqa %ymm12, 5888(%rsp) |
2638 | vpmullw %ymm0, %ymm7, %ymm13 |
2639 | vpmullw %ymm1, %ymm6, %ymm15 |
2640 | vpaddw %ymm13, %ymm15, %ymm13 |
2641 | vmovdqa %ymm13, 5920(%rsp) |
2642 | vpmullw %ymm0, %ymm8, %ymm12 |
2643 | vpmullw %ymm1, %ymm7, %ymm15 |
2644 | vpaddw %ymm12, %ymm15, %ymm12 |
2645 | vpmullw %ymm2, %ymm6, %ymm15 |
2646 | vpaddw %ymm12, %ymm15, %ymm12 |
2647 | vmovdqa %ymm12, 5952(%rsp) |
2648 | vpmullw %ymm0, %ymm9, %ymm13 |
2649 | vpmullw %ymm1, %ymm8, %ymm15 |
2650 | vpaddw %ymm13, %ymm15, %ymm13 |
2651 | vpmullw %ymm2, %ymm7, %ymm15 |
2652 | vpaddw %ymm13, %ymm15, %ymm13 |
2653 | vpmullw %ymm3, %ymm6, %ymm15 |
2654 | vpaddw %ymm13, %ymm15, %ymm13 |
2655 | vmovdqa %ymm13, 5984(%rsp) |
2656 | vpmullw %ymm0, %ymm10, %ymm12 |
2657 | vpmullw %ymm1, %ymm9, %ymm15 |
2658 | vpaddw %ymm12, %ymm15, %ymm12 |
2659 | vpmullw %ymm2, %ymm8, %ymm15 |
2660 | vpaddw %ymm12, %ymm15, %ymm12 |
2661 | vpmullw %ymm3, %ymm7, %ymm15 |
2662 | vpaddw %ymm12, %ymm15, %ymm12 |
2663 | vpmullw %ymm4, %ymm6, %ymm15 |
2664 | vpaddw %ymm12, %ymm15, %ymm12 |
2665 | vmovdqa %ymm12, 6016(%rsp) |
2666 | vpmullw %ymm0, %ymm11, %ymm13 |
2667 | vpmullw %ymm1, %ymm10, %ymm15 |
2668 | vpaddw %ymm13, %ymm15, %ymm13 |
2669 | vpmullw %ymm2, %ymm9, %ymm15 |
2670 | vpaddw %ymm13, %ymm15, %ymm13 |
2671 | vpmullw %ymm3, %ymm8, %ymm15 |
2672 | vpaddw %ymm13, %ymm15, %ymm13 |
2673 | vpmullw %ymm4, %ymm7, %ymm15 |
2674 | vpaddw %ymm13, %ymm15, %ymm13 |
2675 | vpmullw %ymm5, %ymm6, %ymm15 |
2676 | vpaddw %ymm13, %ymm15, %ymm13 |
2677 | vmovdqa %ymm13, 6048(%rsp) |
2678 | vpmullw %ymm1, %ymm11, %ymm12 |
2679 | vpmullw %ymm2, %ymm10, %ymm15 |
2680 | vpaddw %ymm12, %ymm15, %ymm12 |
2681 | vpmullw %ymm3, %ymm9, %ymm15 |
2682 | vpaddw %ymm12, %ymm15, %ymm12 |
2683 | vpmullw %ymm4, %ymm8, %ymm15 |
2684 | vpaddw %ymm12, %ymm15, %ymm12 |
2685 | vpmullw %ymm5, %ymm7, %ymm15 |
2686 | vpaddw %ymm12, %ymm15, %ymm12 |
2687 | vmovdqa %ymm12, 6080(%rsp) |
2688 | vpmullw %ymm2, %ymm11, %ymm13 |
2689 | vpmullw %ymm3, %ymm10, %ymm15 |
2690 | vpaddw %ymm13, %ymm15, %ymm13 |
2691 | vpmullw %ymm4, %ymm9, %ymm15 |
2692 | vpaddw %ymm13, %ymm15, %ymm13 |
2693 | vpmullw %ymm5, %ymm8, %ymm15 |
2694 | vpaddw %ymm13, %ymm15, %ymm13 |
2695 | vmovdqa %ymm13, 6112(%rsp) |
2696 | vpmullw %ymm3, %ymm11, %ymm12 |
2697 | vpmullw %ymm4, %ymm10, %ymm15 |
2698 | vpaddw %ymm12, %ymm15, %ymm12 |
2699 | vpmullw %ymm5, %ymm9, %ymm15 |
2700 | vpaddw %ymm12, %ymm15, %ymm12 |
2701 | vmovdqa %ymm12, 6144(%rsp) |
2702 | vpmullw %ymm4, %ymm11, %ymm13 |
2703 | vpmullw %ymm5, %ymm10, %ymm15 |
2704 | vpaddw %ymm13, %ymm15, %ymm13 |
2705 | vmovdqa %ymm13, 6176(%rsp) |
2706 | vpmullw %ymm5, %ymm11, %ymm12 |
2707 | vmovdqa %ymm12, 6208(%rsp) |
2708 | vmovdqa 192(%r9), %ymm0 |
2709 | vmovdqa 1600(%r9), %ymm6 |
2710 | vpaddw 544(%r9), %ymm0, %ymm0 |
2711 | vpaddw 1952(%r9), %ymm6, %ymm6 |
2712 | vmovdqa 224(%r9), %ymm1 |
2713 | vmovdqa 1632(%r9), %ymm7 |
2714 | vpaddw 576(%r9), %ymm1, %ymm1 |
2715 | vpaddw 1984(%r9), %ymm7, %ymm7 |
2716 | vmovdqa 256(%r9), %ymm2 |
2717 | vmovdqa 1664(%r9), %ymm8 |
2718 | vpaddw 608(%r9), %ymm2, %ymm2 |
2719 | vpaddw 2016(%r9), %ymm8, %ymm8 |
2720 | vmovdqa 288(%r9), %ymm3 |
2721 | vmovdqa 1696(%r9), %ymm9 |
2722 | vpaddw 640(%r9), %ymm3, %ymm3 |
2723 | vpaddw 2048(%r9), %ymm9, %ymm9 |
2724 | vmovdqa 320(%r9), %ymm4 |
2725 | vmovdqa 1728(%r9), %ymm10 |
2726 | vpaddw 672(%r9), %ymm4, %ymm4 |
2727 | vpaddw 2080(%r9), %ymm10, %ymm10 |
2728 | vpmullw %ymm0, %ymm6, %ymm12 |
2729 | vmovdqa %ymm12, 6272(%rsp) |
2730 | vpmullw %ymm0, %ymm7, %ymm13 |
2731 | vpmullw %ymm1, %ymm6, %ymm15 |
2732 | vpaddw %ymm13, %ymm15, %ymm13 |
2733 | vmovdqa %ymm13, 6304(%rsp) |
2734 | vpmullw %ymm0, %ymm8, %ymm12 |
2735 | vpmullw %ymm1, %ymm7, %ymm15 |
2736 | vpaddw %ymm12, %ymm15, %ymm12 |
2737 | vpmullw %ymm2, %ymm6, %ymm15 |
2738 | vpaddw %ymm12, %ymm15, %ymm12 |
2739 | vmovdqa %ymm12, 6336(%rsp) |
2740 | vpmullw %ymm0, %ymm9, %ymm13 |
2741 | vpmullw %ymm1, %ymm8, %ymm15 |
2742 | vpaddw %ymm13, %ymm15, %ymm13 |
2743 | vpmullw %ymm2, %ymm7, %ymm15 |
2744 | vpaddw %ymm13, %ymm15, %ymm13 |
2745 | vpmullw %ymm3, %ymm6, %ymm15 |
2746 | vpaddw %ymm13, %ymm15, %ymm13 |
2747 | vmovdqa %ymm13, 6368(%rsp) |
2748 | vpmullw %ymm0, %ymm10, %ymm12 |
2749 | vpmullw %ymm1, %ymm9, %ymm15 |
2750 | vpaddw %ymm12, %ymm15, %ymm12 |
2751 | vpmullw %ymm2, %ymm8, %ymm15 |
2752 | vpaddw %ymm12, %ymm15, %ymm12 |
2753 | vpmullw %ymm3, %ymm7, %ymm15 |
2754 | vpaddw %ymm12, %ymm15, %ymm12 |
2755 | vpmullw %ymm4, %ymm6, %ymm15 |
2756 | vpaddw %ymm12, %ymm15, %ymm12 |
2757 | vmovdqa %ymm12, 6400(%rsp) |
2758 | vpmullw %ymm1, %ymm10, %ymm13 |
2759 | vpmullw %ymm2, %ymm9, %ymm15 |
2760 | vpaddw %ymm13, %ymm15, %ymm13 |
2761 | vpmullw %ymm3, %ymm8, %ymm15 |
2762 | vpaddw %ymm13, %ymm15, %ymm13 |
2763 | vpmullw %ymm4, %ymm7, %ymm15 |
2764 | vpaddw %ymm13, %ymm15, %ymm13 |
2765 | vmovdqa %ymm13, 6432(%rsp) |
2766 | vpmullw %ymm2, %ymm10, %ymm12 |
2767 | vpmullw %ymm3, %ymm9, %ymm15 |
2768 | vpaddw %ymm12, %ymm15, %ymm12 |
2769 | vpmullw %ymm4, %ymm8, %ymm15 |
2770 | vpaddw %ymm12, %ymm15, %ymm12 |
2771 | vmovdqa %ymm12, 6464(%rsp) |
2772 | vpmullw %ymm3, %ymm10, %ymm13 |
2773 | vpmullw %ymm4, %ymm9, %ymm15 |
2774 | vpaddw %ymm13, %ymm15, %ymm13 |
2775 | vmovdqa %ymm13, 6496(%rsp) |
2776 | vpmullw %ymm4, %ymm10, %ymm12 |
2777 | vmovdqa %ymm12, 6528(%rsp) |
2778 | vpaddw 0(%r9), %ymm0, %ymm0 |
2779 | vpaddw 1408(%r9), %ymm6, %ymm6 |
2780 | vpaddw 352(%r9), %ymm0, %ymm0 |
2781 | vpaddw 1760(%r9), %ymm6, %ymm6 |
2782 | vpaddw 32(%r9), %ymm1, %ymm1 |
2783 | vpaddw 1440(%r9), %ymm7, %ymm7 |
2784 | vpaddw 384(%r9), %ymm1, %ymm1 |
2785 | vpaddw 1792(%r9), %ymm7, %ymm7 |
2786 | vpaddw 64(%r9), %ymm2, %ymm2 |
2787 | vpaddw 1472(%r9), %ymm8, %ymm8 |
2788 | vpaddw 416(%r9), %ymm2, %ymm2 |
2789 | vpaddw 1824(%r9), %ymm8, %ymm8 |
2790 | vpaddw 96(%r9), %ymm3, %ymm3 |
2791 | vpaddw 1504(%r9), %ymm9, %ymm9 |
2792 | vpaddw 448(%r9), %ymm3, %ymm3 |
2793 | vpaddw 1856(%r9), %ymm9, %ymm9 |
2794 | vpaddw 128(%r9), %ymm4, %ymm4 |
2795 | vpaddw 1536(%r9), %ymm10, %ymm10 |
2796 | vpaddw 480(%r9), %ymm4, %ymm4 |
2797 | vpaddw 1888(%r9), %ymm10, %ymm10 |
2798 | vpmullw %ymm0, %ymm11, %ymm12 |
2799 | vpmullw %ymm1, %ymm10, %ymm15 |
2800 | vpaddw %ymm15, %ymm12, %ymm12 |
2801 | vpmullw %ymm2, %ymm9, %ymm15 |
2802 | vpaddw %ymm15, %ymm12, %ymm12 |
2803 | vpmullw %ymm3, %ymm8, %ymm15 |
2804 | vpaddw %ymm15, %ymm12, %ymm12 |
2805 | vpmullw %ymm4, %ymm7, %ymm15 |
2806 | vpaddw %ymm15, %ymm12, %ymm12 |
2807 | vpmullw %ymm5, %ymm6, %ymm15 |
2808 | vpaddw %ymm15, %ymm12, %ymm12 |
2809 | vpsubw 6048(%rsp), %ymm12, %ymm12 |
2810 | vpsubw 6432(%rsp), %ymm12, %ymm12 |
2811 | vmovdqa %ymm12, 6240(%rsp) |
2812 | vpmullw %ymm5, %ymm7, %ymm12 |
2813 | vpmullw %ymm5, %ymm8, %ymm13 |
2814 | vpmullw %ymm5, %ymm9, %ymm14 |
2815 | vpmullw %ymm5, %ymm10, %ymm15 |
2816 | vpmullw %ymm1, %ymm11, %ymm5 |
2817 | vpaddw %ymm5, %ymm12, %ymm12 |
2818 | vpmullw %ymm2, %ymm10, %ymm5 |
2819 | vpaddw %ymm5, %ymm12, %ymm12 |
2820 | vpmullw %ymm3, %ymm9, %ymm5 |
2821 | vpaddw %ymm5, %ymm12, %ymm12 |
2822 | vpmullw %ymm4, %ymm8, %ymm5 |
2823 | vpaddw %ymm5, %ymm12, %ymm12 |
2824 | vpmullw %ymm2, %ymm11, %ymm5 |
2825 | vpaddw %ymm5, %ymm13, %ymm13 |
2826 | vpmullw %ymm3, %ymm10, %ymm5 |
2827 | vpaddw %ymm5, %ymm13, %ymm13 |
2828 | vpmullw %ymm4, %ymm9, %ymm5 |
2829 | vpaddw %ymm5, %ymm13, %ymm13 |
2830 | vpmullw %ymm3, %ymm11, %ymm5 |
2831 | vpaddw %ymm5, %ymm14, %ymm14 |
2832 | vpmullw %ymm4, %ymm10, %ymm5 |
2833 | vpaddw %ymm5, %ymm14, %ymm14 |
2834 | vpmullw %ymm4, %ymm11, %ymm5 |
2835 | vpaddw %ymm5, %ymm15, %ymm15 |
2836 | vpmullw %ymm0, %ymm10, %ymm11 |
2837 | vpmullw %ymm1, %ymm9, %ymm5 |
2838 | vpaddw %ymm5, %ymm11, %ymm11 |
2839 | vpmullw %ymm2, %ymm8, %ymm5 |
2840 | vpaddw %ymm5, %ymm11, %ymm11 |
2841 | vpmullw %ymm3, %ymm7, %ymm5 |
2842 | vpaddw %ymm5, %ymm11, %ymm11 |
2843 | vpmullw %ymm4, %ymm6, %ymm5 |
2844 | vpaddw %ymm5, %ymm11, %ymm11 |
2845 | vpmullw %ymm0, %ymm9, %ymm10 |
2846 | vpmullw %ymm1, %ymm8, %ymm5 |
2847 | vpaddw %ymm5, %ymm10, %ymm10 |
2848 | vpmullw %ymm2, %ymm7, %ymm5 |
2849 | vpaddw %ymm5, %ymm10, %ymm10 |
2850 | vpmullw %ymm3, %ymm6, %ymm5 |
2851 | vpaddw %ymm5, %ymm10, %ymm10 |
2852 | vpmullw %ymm0, %ymm8, %ymm9 |
2853 | vpmullw %ymm1, %ymm7, %ymm5 |
2854 | vpaddw %ymm5, %ymm9, %ymm9 |
2855 | vpmullw %ymm2, %ymm6, %ymm5 |
2856 | vpaddw %ymm5, %ymm9, %ymm9 |
2857 | vpmullw %ymm0, %ymm7, %ymm8 |
2858 | vpmullw %ymm1, %ymm6, %ymm5 |
2859 | vpaddw %ymm5, %ymm8, %ymm8 |
2860 | vpmullw %ymm0, %ymm6, %ymm7 |
2861 | vmovdqa 6080(%rsp), %ymm0 |
2862 | vpsubw 6272(%rsp), %ymm0, %ymm0 |
2863 | vpsubw %ymm0, %ymm12, %ymm6 |
2864 | vpsubw 6464(%rsp), %ymm6, %ymm6 |
2865 | vmovdqa %ymm6, 6272(%rsp) |
2866 | vpaddw %ymm7, %ymm0, %ymm0 |
2867 | vpsubw 5888(%rsp), %ymm0, %ymm0 |
2868 | vmovdqa %ymm0, 6080(%rsp) |
2869 | vmovdqa 6112(%rsp), %ymm1 |
2870 | vpsubw 6304(%rsp), %ymm1, %ymm1 |
2871 | vpsubw %ymm1, %ymm13, %ymm7 |
2872 | vpsubw 6496(%rsp), %ymm7, %ymm7 |
2873 | vmovdqa %ymm7, 6304(%rsp) |
2874 | vpaddw %ymm8, %ymm1, %ymm1 |
2875 | vpsubw 5920(%rsp), %ymm1, %ymm1 |
2876 | vmovdqa %ymm1, 6112(%rsp) |
2877 | vmovdqa 6144(%rsp), %ymm2 |
2878 | vpsubw 6336(%rsp), %ymm2, %ymm2 |
2879 | vpsubw %ymm2, %ymm14, %ymm8 |
2880 | vpsubw 6528(%rsp), %ymm8, %ymm8 |
2881 | vmovdqa %ymm8, 6336(%rsp) |
2882 | vpaddw %ymm9, %ymm2, %ymm2 |
2883 | vpsubw 5952(%rsp), %ymm2, %ymm2 |
2884 | vmovdqa %ymm2, 6144(%rsp) |
2885 | vmovdqa 6176(%rsp), %ymm3 |
2886 | vpsubw 6368(%rsp), %ymm3, %ymm3 |
2887 | vpsubw %ymm3, %ymm15, %ymm9 |
2888 | vmovdqa %ymm9, 6368(%rsp) |
2889 | vpaddw %ymm10, %ymm3, %ymm3 |
2890 | vpsubw 5984(%rsp), %ymm3, %ymm3 |
2891 | vmovdqa %ymm3, 6176(%rsp) |
2892 | vmovdqa 6208(%rsp), %ymm4 |
2893 | vpsubw 6400(%rsp), %ymm4, %ymm4 |
2894 | vpaddw %ymm11, %ymm4, %ymm4 |
2895 | vpsubw 6016(%rsp), %ymm4, %ymm4 |
2896 | vmovdqa %ymm4, 6208(%rsp) |
2897 | vmovdqa 6208(%rsp), %ymm0 |
2898 | vpsubw 3136(%r10), %ymm0, %ymm0 |
2899 | vpsubw 3840(%r10), %ymm0, %ymm0 |
2900 | vmovdqa %ymm0, 3488(%r10) |
2901 | vmovdqa 3168(%r10), %ymm0 |
2902 | vpsubw 3520(%r10), %ymm0, %ymm0 |
2903 | vmovdqa 6240(%rsp), %ymm1 |
2904 | vpsubw %ymm0, %ymm1, %ymm1 |
2905 | vpsubw 3872(%r10), %ymm1, %ymm1 |
2906 | vpsubw 2816(%r10), %ymm0, %ymm0 |
2907 | vpaddw 5888(%rsp), %ymm0, %ymm0 |
2908 | vmovdqa %ymm0, 3168(%r10) |
2909 | vmovdqa %ymm1, 3520(%r10) |
2910 | vmovdqa 3200(%r10), %ymm0 |
2911 | vpsubw 3552(%r10), %ymm0, %ymm0 |
2912 | vmovdqa 6272(%rsp), %ymm1 |
2913 | vpsubw %ymm0, %ymm1, %ymm1 |
2914 | vpsubw 3904(%r10), %ymm1, %ymm1 |
2915 | vpsubw 2848(%r10), %ymm0, %ymm0 |
2916 | vpaddw 5920(%rsp), %ymm0, %ymm0 |
2917 | vmovdqa %ymm0, 3200(%r10) |
2918 | vmovdqa %ymm1, 3552(%r10) |
2919 | vmovdqa 3232(%r10), %ymm0 |
2920 | vpsubw 3584(%r10), %ymm0, %ymm0 |
2921 | vmovdqa 6304(%rsp), %ymm1 |
2922 | vpsubw %ymm0, %ymm1, %ymm1 |
2923 | vpsubw 3936(%r10), %ymm1, %ymm1 |
2924 | vpsubw 2880(%r10), %ymm0, %ymm0 |
2925 | vpaddw 5952(%rsp), %ymm0, %ymm0 |
2926 | vmovdqa %ymm0, 3232(%r10) |
2927 | vmovdqa %ymm1, 3584(%r10) |
2928 | vmovdqa 3264(%r10), %ymm0 |
2929 | vpsubw 3616(%r10), %ymm0, %ymm0 |
2930 | vmovdqa 6336(%rsp), %ymm1 |
2931 | vpsubw %ymm0, %ymm1, %ymm1 |
2932 | vpsubw 3968(%r10), %ymm1, %ymm1 |
2933 | vpsubw 2912(%r10), %ymm0, %ymm0 |
2934 | vpaddw 5984(%rsp), %ymm0, %ymm0 |
2935 | vmovdqa %ymm0, 3264(%r10) |
2936 | vmovdqa %ymm1, 3616(%r10) |
2937 | vmovdqa 3296(%r10), %ymm0 |
2938 | vpsubw 3648(%r10), %ymm0, %ymm0 |
2939 | vmovdqa 6368(%rsp), %ymm1 |
2940 | vpsubw %ymm0, %ymm1, %ymm1 |
2941 | vpsubw 4000(%r10), %ymm1, %ymm1 |
2942 | vpsubw 2944(%r10), %ymm0, %ymm0 |
2943 | vpaddw 6016(%rsp), %ymm0, %ymm0 |
2944 | vmovdqa %ymm0, 3296(%r10) |
2945 | vmovdqa %ymm1, 3648(%r10) |
2946 | vmovdqa 3328(%r10), %ymm0 |
2947 | vpsubw 3680(%r10), %ymm0, %ymm0 |
2948 | vmovdqa 6400(%rsp), %ymm1 |
2949 | vpsubw %ymm0, %ymm1, %ymm1 |
2950 | vpsubw 4032(%r10), %ymm1, %ymm1 |
2951 | vpsubw 2976(%r10), %ymm0, %ymm0 |
2952 | vpaddw 6048(%rsp), %ymm0, %ymm0 |
2953 | vmovdqa %ymm0, 3328(%r10) |
2954 | vmovdqa %ymm1, 3680(%r10) |
2955 | vmovdqa 3360(%r10), %ymm0 |
2956 | vpsubw 3712(%r10), %ymm0, %ymm0 |
2957 | vmovdqa 6432(%rsp), %ymm1 |
2958 | vpsubw %ymm0, %ymm1, %ymm1 |
2959 | vpsubw 4064(%r10), %ymm1, %ymm1 |
2960 | vpsubw 3008(%r10), %ymm0, %ymm0 |
2961 | vpaddw 6080(%rsp), %ymm0, %ymm0 |
2962 | vmovdqa %ymm0, 3360(%r10) |
2963 | vmovdqa %ymm1, 3712(%r10) |
2964 | vmovdqa 3392(%r10), %ymm0 |
2965 | vpsubw 3744(%r10), %ymm0, %ymm0 |
2966 | vmovdqa 6464(%rsp), %ymm1 |
2967 | vpsubw %ymm0, %ymm1, %ymm1 |
2968 | vpsubw 4096(%r10), %ymm1, %ymm1 |
2969 | vpsubw 3040(%r10), %ymm0, %ymm0 |
2970 | vpaddw 6112(%rsp), %ymm0, %ymm0 |
2971 | vmovdqa %ymm0, 3392(%r10) |
2972 | vmovdqa %ymm1, 3744(%r10) |
2973 | vmovdqa 3424(%r10), %ymm0 |
2974 | vpsubw 3776(%r10), %ymm0, %ymm0 |
2975 | vmovdqa 6496(%rsp), %ymm1 |
2976 | vpsubw %ymm0, %ymm1, %ymm1 |
2977 | vpsubw 4128(%r10), %ymm1, %ymm1 |
2978 | vpsubw 3072(%r10), %ymm0, %ymm0 |
2979 | vpaddw 6144(%rsp), %ymm0, %ymm0 |
2980 | vmovdqa %ymm0, 3424(%r10) |
2981 | vmovdqa %ymm1, 3776(%r10) |
2982 | vmovdqa 3456(%r10), %ymm0 |
2983 | vpsubw 3808(%r10), %ymm0, %ymm0 |
2984 | vmovdqa 6528(%rsp), %ymm1 |
2985 | vpsubw %ymm0, %ymm1, %ymm1 |
2986 | vpsubw 4160(%r10), %ymm1, %ymm1 |
2987 | vpsubw 3104(%r10), %ymm0, %ymm0 |
2988 | vpaddw 6176(%rsp), %ymm0, %ymm0 |
2989 | vmovdqa %ymm0, 3456(%r10) |
2990 | vmovdqa %ymm1, 3808(%r10) |
2991 | neg %ecx |
2992 | jns done_4eced63f144beffcb0247f9c6f67d165 |
2993 | add $704, %r9 |
2994 | add $1408, %r10 |
2995 | jmp innerloop_4eced63f144beffcb0247f9c6f67d165 |
2996 | done_4eced63f144beffcb0247f9c6f67d165: |
2997 | sub $704, %r9 |
2998 | sub $1408, %r10 |
2999 | vmovdqa 0(%r9), %ymm0 |
3000 | vpaddw 704(%r9), %ymm0, %ymm0 |
3001 | vmovdqa %ymm0, 6592(%rsp) |
3002 | vmovdqa 1408(%r9), %ymm0 |
3003 | vpaddw 2112(%r9), %ymm0, %ymm0 |
3004 | vmovdqa %ymm0, 7296(%rsp) |
3005 | vmovdqa 32(%r9), %ymm0 |
3006 | vpaddw 736(%r9), %ymm0, %ymm0 |
3007 | vmovdqa %ymm0, 6624(%rsp) |
3008 | vmovdqa 1440(%r9), %ymm0 |
3009 | vpaddw 2144(%r9), %ymm0, %ymm0 |
3010 | vmovdqa %ymm0, 7328(%rsp) |
3011 | vmovdqa 64(%r9), %ymm0 |
3012 | vpaddw 768(%r9), %ymm0, %ymm0 |
3013 | vmovdqa %ymm0, 6656(%rsp) |
3014 | vmovdqa 1472(%r9), %ymm0 |
3015 | vpaddw 2176(%r9), %ymm0, %ymm0 |
3016 | vmovdqa %ymm0, 7360(%rsp) |
3017 | vmovdqa 96(%r9), %ymm0 |
3018 | vpaddw 800(%r9), %ymm0, %ymm0 |
3019 | vmovdqa %ymm0, 6688(%rsp) |
3020 | vmovdqa 1504(%r9), %ymm0 |
3021 | vpaddw 2208(%r9), %ymm0, %ymm0 |
3022 | vmovdqa %ymm0, 7392(%rsp) |
3023 | vmovdqa 128(%r9), %ymm0 |
3024 | vpaddw 832(%r9), %ymm0, %ymm0 |
3025 | vmovdqa %ymm0, 6720(%rsp) |
3026 | vmovdqa 1536(%r9), %ymm0 |
3027 | vpaddw 2240(%r9), %ymm0, %ymm0 |
3028 | vmovdqa %ymm0, 7424(%rsp) |
3029 | vmovdqa 160(%r9), %ymm0 |
3030 | vpaddw 864(%r9), %ymm0, %ymm0 |
3031 | vmovdqa %ymm0, 6752(%rsp) |
3032 | vmovdqa 1568(%r9), %ymm0 |
3033 | vpaddw 2272(%r9), %ymm0, %ymm0 |
3034 | vmovdqa %ymm0, 7456(%rsp) |
3035 | vmovdqa 192(%r9), %ymm0 |
3036 | vpaddw 896(%r9), %ymm0, %ymm0 |
3037 | vmovdqa %ymm0, 6784(%rsp) |
3038 | vmovdqa 1600(%r9), %ymm0 |
3039 | vpaddw 2304(%r9), %ymm0, %ymm0 |
3040 | vmovdqa %ymm0, 7488(%rsp) |
3041 | vmovdqa 224(%r9), %ymm0 |
3042 | vpaddw 928(%r9), %ymm0, %ymm0 |
3043 | vmovdqa %ymm0, 6816(%rsp) |
3044 | vmovdqa 1632(%r9), %ymm0 |
3045 | vpaddw 2336(%r9), %ymm0, %ymm0 |
3046 | vmovdqa %ymm0, 7520(%rsp) |
3047 | vmovdqa 256(%r9), %ymm0 |
3048 | vpaddw 960(%r9), %ymm0, %ymm0 |
3049 | vmovdqa %ymm0, 6848(%rsp) |
3050 | vmovdqa 1664(%r9), %ymm0 |
3051 | vpaddw 2368(%r9), %ymm0, %ymm0 |
3052 | vmovdqa %ymm0, 7552(%rsp) |
3053 | vmovdqa 288(%r9), %ymm0 |
3054 | vpaddw 992(%r9), %ymm0, %ymm0 |
3055 | vmovdqa %ymm0, 6880(%rsp) |
3056 | vmovdqa 1696(%r9), %ymm0 |
3057 | vpaddw 2400(%r9), %ymm0, %ymm0 |
3058 | vmovdqa %ymm0, 7584(%rsp) |
3059 | vmovdqa 320(%r9), %ymm0 |
3060 | vpaddw 1024(%r9), %ymm0, %ymm0 |
3061 | vmovdqa %ymm0, 6912(%rsp) |
3062 | vmovdqa 1728(%r9), %ymm0 |
3063 | vpaddw 2432(%r9), %ymm0, %ymm0 |
3064 | vmovdqa %ymm0, 7616(%rsp) |
3065 | vmovdqa 352(%r9), %ymm0 |
3066 | vpaddw 1056(%r9), %ymm0, %ymm0 |
3067 | vmovdqa %ymm0, 6944(%rsp) |
3068 | vmovdqa 1760(%r9), %ymm0 |
3069 | vpaddw 2464(%r9), %ymm0, %ymm0 |
3070 | vmovdqa %ymm0, 7648(%rsp) |
3071 | vmovdqa 384(%r9), %ymm0 |
3072 | vpaddw 1088(%r9), %ymm0, %ymm0 |
3073 | vmovdqa %ymm0, 6976(%rsp) |
3074 | vmovdqa 1792(%r9), %ymm0 |
3075 | vpaddw 2496(%r9), %ymm0, %ymm0 |
3076 | vmovdqa %ymm0, 7680(%rsp) |
3077 | vmovdqa 416(%r9), %ymm0 |
3078 | vpaddw 1120(%r9), %ymm0, %ymm0 |
3079 | vmovdqa %ymm0, 7008(%rsp) |
3080 | vmovdqa 1824(%r9), %ymm0 |
3081 | vpaddw 2528(%r9), %ymm0, %ymm0 |
3082 | vmovdqa %ymm0, 7712(%rsp) |
3083 | vmovdqa 448(%r9), %ymm0 |
3084 | vpaddw 1152(%r9), %ymm0, %ymm0 |
3085 | vmovdqa %ymm0, 7040(%rsp) |
3086 | vmovdqa 1856(%r9), %ymm0 |
3087 | vpaddw 2560(%r9), %ymm0, %ymm0 |
3088 | vmovdqa %ymm0, 7744(%rsp) |
3089 | vmovdqa 480(%r9), %ymm0 |
3090 | vpaddw 1184(%r9), %ymm0, %ymm0 |
3091 | vmovdqa %ymm0, 7072(%rsp) |
3092 | vmovdqa 1888(%r9), %ymm0 |
3093 | vpaddw 2592(%r9), %ymm0, %ymm0 |
3094 | vmovdqa %ymm0, 7776(%rsp) |
3095 | vmovdqa 512(%r9), %ymm0 |
3096 | vpaddw 1216(%r9), %ymm0, %ymm0 |
3097 | vmovdqa %ymm0, 7104(%rsp) |
3098 | vmovdqa 1920(%r9), %ymm0 |
3099 | vpaddw 2624(%r9), %ymm0, %ymm0 |
3100 | vmovdqa %ymm0, 7808(%rsp) |
3101 | vmovdqa 544(%r9), %ymm0 |
3102 | vpaddw 1248(%r9), %ymm0, %ymm0 |
3103 | vmovdqa %ymm0, 7136(%rsp) |
3104 | vmovdqa 1952(%r9), %ymm0 |
3105 | vpaddw 2656(%r9), %ymm0, %ymm0 |
3106 | vmovdqa %ymm0, 7840(%rsp) |
3107 | vmovdqa 576(%r9), %ymm0 |
3108 | vpaddw 1280(%r9), %ymm0, %ymm0 |
3109 | vmovdqa %ymm0, 7168(%rsp) |
3110 | vmovdqa 1984(%r9), %ymm0 |
3111 | vpaddw 2688(%r9), %ymm0, %ymm0 |
3112 | vmovdqa %ymm0, 7872(%rsp) |
3113 | vmovdqa 608(%r9), %ymm0 |
3114 | vpaddw 1312(%r9), %ymm0, %ymm0 |
3115 | vmovdqa %ymm0, 7200(%rsp) |
3116 | vmovdqa 2016(%r9), %ymm0 |
3117 | vpaddw 2720(%r9), %ymm0, %ymm0 |
3118 | vmovdqa %ymm0, 7904(%rsp) |
3119 | vmovdqa 640(%r9), %ymm0 |
3120 | vpaddw 1344(%r9), %ymm0, %ymm0 |
3121 | vmovdqa %ymm0, 7232(%rsp) |
3122 | vmovdqa 2048(%r9), %ymm0 |
3123 | vpaddw 2752(%r9), %ymm0, %ymm0 |
3124 | vmovdqa %ymm0, 7936(%rsp) |
3125 | vmovdqa 672(%r9), %ymm0 |
3126 | vpaddw 1376(%r9), %ymm0, %ymm0 |
3127 | vmovdqa %ymm0, 7264(%rsp) |
3128 | vmovdqa 2080(%r9), %ymm0 |
3129 | vpaddw 2784(%r9), %ymm0, %ymm0 |
3130 | vmovdqa %ymm0, 7968(%rsp) |
3131 | vmovdqa 6592(%rsp), %ymm0 |
3132 | vmovdqa 7296(%rsp), %ymm6 |
3133 | vmovdqa 6624(%rsp), %ymm1 |
3134 | vmovdqa 7328(%rsp), %ymm7 |
3135 | vmovdqa 6656(%rsp), %ymm2 |
3136 | vmovdqa 7360(%rsp), %ymm8 |
3137 | vmovdqa 6688(%rsp), %ymm3 |
3138 | vmovdqa 7392(%rsp), %ymm9 |
3139 | vmovdqa 6720(%rsp), %ymm4 |
3140 | vmovdqa 7424(%rsp), %ymm10 |
3141 | vmovdqa 6752(%rsp), %ymm5 |
3142 | vmovdqa 7456(%rsp), %ymm11 |
3143 | vpmullw %ymm0, %ymm6, %ymm12 |
3144 | vmovdqa %ymm12, 8000(%rsp) |
3145 | vpmullw %ymm0, %ymm7, %ymm13 |
3146 | vpmullw %ymm1, %ymm6, %ymm15 |
3147 | vpaddw %ymm13, %ymm15, %ymm13 |
3148 | vmovdqa %ymm13, 8032(%rsp) |
3149 | vpmullw %ymm0, %ymm8, %ymm12 |
3150 | vpmullw %ymm1, %ymm7, %ymm15 |
3151 | vpaddw %ymm12, %ymm15, %ymm12 |
3152 | vpmullw %ymm2, %ymm6, %ymm15 |
3153 | vpaddw %ymm12, %ymm15, %ymm12 |
3154 | vmovdqa %ymm12, 8064(%rsp) |
3155 | vpmullw %ymm0, %ymm9, %ymm13 |
3156 | vpmullw %ymm1, %ymm8, %ymm15 |
3157 | vpaddw %ymm13, %ymm15, %ymm13 |
3158 | vpmullw %ymm2, %ymm7, %ymm15 |
3159 | vpaddw %ymm13, %ymm15, %ymm13 |
3160 | vpmullw %ymm3, %ymm6, %ymm15 |
3161 | vpaddw %ymm13, %ymm15, %ymm13 |
3162 | vmovdqa %ymm13, 8096(%rsp) |
3163 | vpmullw %ymm0, %ymm10, %ymm12 |
3164 | vpmullw %ymm1, %ymm9, %ymm15 |
3165 | vpaddw %ymm12, %ymm15, %ymm12 |
3166 | vpmullw %ymm2, %ymm8, %ymm15 |
3167 | vpaddw %ymm12, %ymm15, %ymm12 |
3168 | vpmullw %ymm3, %ymm7, %ymm15 |
3169 | vpaddw %ymm12, %ymm15, %ymm12 |
3170 | vpmullw %ymm4, %ymm6, %ymm15 |
3171 | vpaddw %ymm12, %ymm15, %ymm12 |
3172 | vmovdqa %ymm12, 8128(%rsp) |
3173 | vpmullw %ymm0, %ymm11, %ymm13 |
3174 | vpmullw %ymm1, %ymm10, %ymm15 |
3175 | vpaddw %ymm13, %ymm15, %ymm13 |
3176 | vpmullw %ymm2, %ymm9, %ymm15 |
3177 | vpaddw %ymm13, %ymm15, %ymm13 |
3178 | vpmullw %ymm3, %ymm8, %ymm15 |
3179 | vpaddw %ymm13, %ymm15, %ymm13 |
3180 | vpmullw %ymm4, %ymm7, %ymm15 |
3181 | vpaddw %ymm13, %ymm15, %ymm13 |
3182 | vpmullw %ymm5, %ymm6, %ymm15 |
3183 | vpaddw %ymm13, %ymm15, %ymm13 |
3184 | vmovdqa %ymm13, 8160(%rsp) |
3185 | vpmullw %ymm1, %ymm11, %ymm12 |
3186 | vpmullw %ymm2, %ymm10, %ymm15 |
3187 | vpaddw %ymm12, %ymm15, %ymm12 |
3188 | vpmullw %ymm3, %ymm9, %ymm15 |
3189 | vpaddw %ymm12, %ymm15, %ymm12 |
3190 | vpmullw %ymm4, %ymm8, %ymm15 |
3191 | vpaddw %ymm12, %ymm15, %ymm12 |
3192 | vpmullw %ymm5, %ymm7, %ymm15 |
3193 | vpaddw %ymm12, %ymm15, %ymm12 |
3194 | vmovdqa %ymm12, 8192(%rsp) |
3195 | vpmullw %ymm2, %ymm11, %ymm13 |
3196 | vpmullw %ymm3, %ymm10, %ymm15 |
3197 | vpaddw %ymm13, %ymm15, %ymm13 |
3198 | vpmullw %ymm4, %ymm9, %ymm15 |
3199 | vpaddw %ymm13, %ymm15, %ymm13 |
3200 | vpmullw %ymm5, %ymm8, %ymm15 |
3201 | vpaddw %ymm13, %ymm15, %ymm13 |
3202 | vmovdqa %ymm13, 8224(%rsp) |
3203 | vpmullw %ymm3, %ymm11, %ymm12 |
3204 | vpmullw %ymm4, %ymm10, %ymm15 |
3205 | vpaddw %ymm12, %ymm15, %ymm12 |
3206 | vpmullw %ymm5, %ymm9, %ymm15 |
3207 | vpaddw %ymm12, %ymm15, %ymm12 |
3208 | vmovdqa %ymm12, 8256(%rsp) |
3209 | vpmullw %ymm4, %ymm11, %ymm13 |
3210 | vpmullw %ymm5, %ymm10, %ymm15 |
3211 | vpaddw %ymm13, %ymm15, %ymm13 |
3212 | vmovdqa %ymm13, 8288(%rsp) |
3213 | vpmullw %ymm5, %ymm11, %ymm12 |
3214 | vmovdqa %ymm12, 8320(%rsp) |
3215 | vmovdqa 6784(%rsp), %ymm0 |
3216 | vmovdqa 7488(%rsp), %ymm6 |
3217 | vmovdqa 6816(%rsp), %ymm1 |
3218 | vmovdqa 7520(%rsp), %ymm7 |
3219 | vmovdqa 6848(%rsp), %ymm2 |
3220 | vmovdqa 7552(%rsp), %ymm8 |
3221 | vmovdqa 6880(%rsp), %ymm3 |
3222 | vmovdqa 7584(%rsp), %ymm9 |
3223 | vmovdqa 6912(%rsp), %ymm4 |
3224 | vmovdqa 7616(%rsp), %ymm10 |
3225 | vpmullw %ymm0, %ymm6, %ymm12 |
3226 | vmovdqa %ymm12, 8384(%rsp) |
3227 | vpmullw %ymm0, %ymm7, %ymm13 |
3228 | vpmullw %ymm1, %ymm6, %ymm15 |
3229 | vpaddw %ymm13, %ymm15, %ymm13 |
3230 | vmovdqa %ymm13, 8416(%rsp) |
3231 | vpmullw %ymm0, %ymm8, %ymm12 |
3232 | vpmullw %ymm1, %ymm7, %ymm15 |
3233 | vpaddw %ymm12, %ymm15, %ymm12 |
3234 | vpmullw %ymm2, %ymm6, %ymm15 |
3235 | vpaddw %ymm12, %ymm15, %ymm12 |
3236 | vmovdqa %ymm12, 8448(%rsp) |
3237 | vpmullw %ymm0, %ymm9, %ymm13 |
3238 | vpmullw %ymm1, %ymm8, %ymm15 |
3239 | vpaddw %ymm13, %ymm15, %ymm13 |
3240 | vpmullw %ymm2, %ymm7, %ymm15 |
3241 | vpaddw %ymm13, %ymm15, %ymm13 |
3242 | vpmullw %ymm3, %ymm6, %ymm15 |
3243 | vpaddw %ymm13, %ymm15, %ymm13 |
3244 | vmovdqa %ymm13, 8480(%rsp) |
3245 | vpmullw %ymm0, %ymm10, %ymm12 |
3246 | vpmullw %ymm1, %ymm9, %ymm15 |
3247 | vpaddw %ymm12, %ymm15, %ymm12 |
3248 | vpmullw %ymm2, %ymm8, %ymm15 |
3249 | vpaddw %ymm12, %ymm15, %ymm12 |
3250 | vpmullw %ymm3, %ymm7, %ymm15 |
3251 | vpaddw %ymm12, %ymm15, %ymm12 |
3252 | vpmullw %ymm4, %ymm6, %ymm15 |
3253 | vpaddw %ymm12, %ymm15, %ymm12 |
3254 | vmovdqa %ymm12, 8512(%rsp) |
3255 | vpmullw %ymm1, %ymm10, %ymm13 |
3256 | vpmullw %ymm2, %ymm9, %ymm15 |
3257 | vpaddw %ymm13, %ymm15, %ymm13 |
3258 | vpmullw %ymm3, %ymm8, %ymm15 |
3259 | vpaddw %ymm13, %ymm15, %ymm13 |
3260 | vpmullw %ymm4, %ymm7, %ymm15 |
3261 | vpaddw %ymm13, %ymm15, %ymm13 |
3262 | vmovdqa %ymm13, 8544(%rsp) |
3263 | vpmullw %ymm2, %ymm10, %ymm12 |
3264 | vpmullw %ymm3, %ymm9, %ymm15 |
3265 | vpaddw %ymm12, %ymm15, %ymm12 |
3266 | vpmullw %ymm4, %ymm8, %ymm15 |
3267 | vpaddw %ymm12, %ymm15, %ymm12 |
3268 | vmovdqa %ymm12, 8576(%rsp) |
3269 | vpmullw %ymm3, %ymm10, %ymm13 |
3270 | vpmullw %ymm4, %ymm9, %ymm15 |
3271 | vpaddw %ymm13, %ymm15, %ymm13 |
3272 | vmovdqa %ymm13, 8608(%rsp) |
3273 | vpmullw %ymm4, %ymm10, %ymm12 |
3274 | vmovdqa %ymm12, 8640(%rsp) |
3275 | vpaddw 6592(%rsp), %ymm0, %ymm0 |
3276 | vpaddw 7296(%rsp), %ymm6, %ymm6 |
3277 | vpaddw 6624(%rsp), %ymm1, %ymm1 |
3278 | vpaddw 7328(%rsp), %ymm7, %ymm7 |
3279 | vpaddw 6656(%rsp), %ymm2, %ymm2 |
3280 | vpaddw 7360(%rsp), %ymm8, %ymm8 |
3281 | vpaddw 6688(%rsp), %ymm3, %ymm3 |
3282 | vpaddw 7392(%rsp), %ymm9, %ymm9 |
3283 | vpaddw 6720(%rsp), %ymm4, %ymm4 |
3284 | vpaddw 7424(%rsp), %ymm10, %ymm10 |
3285 | vpmullw %ymm0, %ymm11, %ymm12 |
3286 | vpmullw %ymm1, %ymm10, %ymm15 |
3287 | vpaddw %ymm15, %ymm12, %ymm12 |
3288 | vpmullw %ymm2, %ymm9, %ymm15 |
3289 | vpaddw %ymm15, %ymm12, %ymm12 |
3290 | vpmullw %ymm3, %ymm8, %ymm15 |
3291 | vpaddw %ymm15, %ymm12, %ymm12 |
3292 | vpmullw %ymm4, %ymm7, %ymm15 |
3293 | vpaddw %ymm15, %ymm12, %ymm12 |
3294 | vpmullw %ymm5, %ymm6, %ymm15 |
3295 | vpaddw %ymm15, %ymm12, %ymm12 |
3296 | vpsubw 8160(%rsp), %ymm12, %ymm12 |
3297 | vpsubw 8544(%rsp), %ymm12, %ymm12 |
3298 | vmovdqa %ymm12, 8352(%rsp) |
3299 | vpmullw %ymm5, %ymm7, %ymm12 |
3300 | vpmullw %ymm5, %ymm8, %ymm13 |
3301 | vpmullw %ymm5, %ymm9, %ymm14 |
3302 | vpmullw %ymm5, %ymm10, %ymm15 |
3303 | vpmullw %ymm1, %ymm11, %ymm5 |
3304 | vpaddw %ymm5, %ymm12, %ymm12 |
3305 | vpmullw %ymm2, %ymm10, %ymm5 |
3306 | vpaddw %ymm5, %ymm12, %ymm12 |
3307 | vpmullw %ymm3, %ymm9, %ymm5 |
3308 | vpaddw %ymm5, %ymm12, %ymm12 |
3309 | vpmullw %ymm4, %ymm8, %ymm5 |
3310 | vpaddw %ymm5, %ymm12, %ymm12 |
3311 | vpmullw %ymm2, %ymm11, %ymm5 |
3312 | vpaddw %ymm5, %ymm13, %ymm13 |
3313 | vpmullw %ymm3, %ymm10, %ymm5 |
3314 | vpaddw %ymm5, %ymm13, %ymm13 |
3315 | vpmullw %ymm4, %ymm9, %ymm5 |
3316 | vpaddw %ymm5, %ymm13, %ymm13 |
3317 | vpmullw %ymm3, %ymm11, %ymm5 |
3318 | vpaddw %ymm5, %ymm14, %ymm14 |
3319 | vpmullw %ymm4, %ymm10, %ymm5 |
3320 | vpaddw %ymm5, %ymm14, %ymm14 |
3321 | vpmullw %ymm4, %ymm11, %ymm5 |
3322 | vpaddw %ymm5, %ymm15, %ymm15 |
3323 | vpmullw %ymm0, %ymm10, %ymm11 |
3324 | vpmullw %ymm1, %ymm9, %ymm5 |
3325 | vpaddw %ymm5, %ymm11, %ymm11 |
3326 | vpmullw %ymm2, %ymm8, %ymm5 |
3327 | vpaddw %ymm5, %ymm11, %ymm11 |
3328 | vpmullw %ymm3, %ymm7, %ymm5 |
3329 | vpaddw %ymm5, %ymm11, %ymm11 |
3330 | vpmullw %ymm4, %ymm6, %ymm5 |
3331 | vpaddw %ymm5, %ymm11, %ymm11 |
3332 | vpmullw %ymm0, %ymm9, %ymm10 |
3333 | vpmullw %ymm1, %ymm8, %ymm5 |
3334 | vpaddw %ymm5, %ymm10, %ymm10 |
3335 | vpmullw %ymm2, %ymm7, %ymm5 |
3336 | vpaddw %ymm5, %ymm10, %ymm10 |
3337 | vpmullw %ymm3, %ymm6, %ymm5 |
3338 | vpaddw %ymm5, %ymm10, %ymm10 |
3339 | vpmullw %ymm0, %ymm8, %ymm9 |
3340 | vpmullw %ymm1, %ymm7, %ymm5 |
3341 | vpaddw %ymm5, %ymm9, %ymm9 |
3342 | vpmullw %ymm2, %ymm6, %ymm5 |
3343 | vpaddw %ymm5, %ymm9, %ymm9 |
3344 | vpmullw %ymm0, %ymm7, %ymm8 |
3345 | vpmullw %ymm1, %ymm6, %ymm5 |
3346 | vpaddw %ymm5, %ymm8, %ymm8 |
3347 | vpmullw %ymm0, %ymm6, %ymm7 |
3348 | vmovdqa 8192(%rsp), %ymm0 |
3349 | vpsubw 8384(%rsp), %ymm0, %ymm0 |
3350 | vpsubw %ymm0, %ymm12, %ymm6 |
3351 | vpsubw 8576(%rsp), %ymm6, %ymm6 |
3352 | vmovdqa %ymm6, 8384(%rsp) |
3353 | vpaddw %ymm7, %ymm0, %ymm0 |
3354 | vpsubw 8000(%rsp), %ymm0, %ymm0 |
3355 | vmovdqa %ymm0, 8192(%rsp) |
3356 | vmovdqa 8224(%rsp), %ymm1 |
3357 | vpsubw 8416(%rsp), %ymm1, %ymm1 |
3358 | vpsubw %ymm1, %ymm13, %ymm7 |
3359 | vpsubw 8608(%rsp), %ymm7, %ymm7 |
3360 | vmovdqa %ymm7, 8416(%rsp) |
3361 | vpaddw %ymm8, %ymm1, %ymm1 |
3362 | vpsubw 8032(%rsp), %ymm1, %ymm1 |
3363 | vmovdqa %ymm1, 8224(%rsp) |
3364 | vmovdqa 8256(%rsp), %ymm2 |
3365 | vpsubw 8448(%rsp), %ymm2, %ymm2 |
3366 | vpsubw %ymm2, %ymm14, %ymm8 |
3367 | vpsubw 8640(%rsp), %ymm8, %ymm8 |
3368 | vmovdqa %ymm8, 8448(%rsp) |
3369 | vpaddw %ymm9, %ymm2, %ymm2 |
3370 | vpsubw 8064(%rsp), %ymm2, %ymm2 |
3371 | vmovdqa %ymm2, 8256(%rsp) |
3372 | vmovdqa 8288(%rsp), %ymm3 |
3373 | vpsubw 8480(%rsp), %ymm3, %ymm3 |
3374 | vpsubw %ymm3, %ymm15, %ymm9 |
3375 | vmovdqa %ymm9, 8480(%rsp) |
3376 | vpaddw %ymm10, %ymm3, %ymm3 |
3377 | vpsubw 8096(%rsp), %ymm3, %ymm3 |
3378 | vmovdqa %ymm3, 8288(%rsp) |
3379 | vmovdqa 8320(%rsp), %ymm4 |
3380 | vpsubw 8512(%rsp), %ymm4, %ymm4 |
3381 | vpaddw %ymm11, %ymm4, %ymm4 |
3382 | vpsubw 8128(%rsp), %ymm4, %ymm4 |
3383 | vmovdqa %ymm4, 8320(%rsp) |
3384 | vmovdqa 6944(%rsp), %ymm0 |
3385 | vmovdqa 7648(%rsp), %ymm6 |
3386 | vmovdqa 6976(%rsp), %ymm1 |
3387 | vmovdqa 7680(%rsp), %ymm7 |
3388 | vmovdqa 7008(%rsp), %ymm2 |
3389 | vmovdqa 7712(%rsp), %ymm8 |
3390 | vmovdqa 7040(%rsp), %ymm3 |
3391 | vmovdqa 7744(%rsp), %ymm9 |
3392 | vmovdqa 7072(%rsp), %ymm4 |
3393 | vmovdqa 7776(%rsp), %ymm10 |
3394 | vmovdqa 7104(%rsp), %ymm5 |
3395 | vmovdqa 7808(%rsp), %ymm11 |
3396 | vpmullw %ymm0, %ymm6, %ymm12 |
3397 | vmovdqa %ymm12, 8704(%rsp) |
3398 | vpmullw %ymm0, %ymm7, %ymm13 |
3399 | vpmullw %ymm1, %ymm6, %ymm15 |
3400 | vpaddw %ymm13, %ymm15, %ymm13 |
3401 | vmovdqa %ymm13, 8736(%rsp) |
3402 | vpmullw %ymm0, %ymm8, %ymm12 |
3403 | vpmullw %ymm1, %ymm7, %ymm15 |
3404 | vpaddw %ymm12, %ymm15, %ymm12 |
3405 | vpmullw %ymm2, %ymm6, %ymm15 |
3406 | vpaddw %ymm12, %ymm15, %ymm12 |
3407 | vmovdqa %ymm12, 8768(%rsp) |
3408 | vpmullw %ymm0, %ymm9, %ymm13 |
3409 | vpmullw %ymm1, %ymm8, %ymm15 |
3410 | vpaddw %ymm13, %ymm15, %ymm13 |
3411 | vpmullw %ymm2, %ymm7, %ymm15 |
3412 | vpaddw %ymm13, %ymm15, %ymm13 |
3413 | vpmullw %ymm3, %ymm6, %ymm15 |
3414 | vpaddw %ymm13, %ymm15, %ymm13 |
3415 | vmovdqa %ymm13, 8800(%rsp) |
3416 | vpmullw %ymm0, %ymm10, %ymm12 |
3417 | vpmullw %ymm1, %ymm9, %ymm15 |
3418 | vpaddw %ymm12, %ymm15, %ymm12 |
3419 | vpmullw %ymm2, %ymm8, %ymm15 |
3420 | vpaddw %ymm12, %ymm15, %ymm12 |
3421 | vpmullw %ymm3, %ymm7, %ymm15 |
3422 | vpaddw %ymm12, %ymm15, %ymm12 |
3423 | vpmullw %ymm4, %ymm6, %ymm15 |
3424 | vpaddw %ymm12, %ymm15, %ymm12 |
3425 | vmovdqa %ymm12, 8832(%rsp) |
3426 | vpmullw %ymm0, %ymm11, %ymm13 |
3427 | vpmullw %ymm1, %ymm10, %ymm15 |
3428 | vpaddw %ymm13, %ymm15, %ymm13 |
3429 | vpmullw %ymm2, %ymm9, %ymm15 |
3430 | vpaddw %ymm13, %ymm15, %ymm13 |
3431 | vpmullw %ymm3, %ymm8, %ymm15 |
3432 | vpaddw %ymm13, %ymm15, %ymm13 |
3433 | vpmullw %ymm4, %ymm7, %ymm15 |
3434 | vpaddw %ymm13, %ymm15, %ymm13 |
3435 | vpmullw %ymm5, %ymm6, %ymm15 |
3436 | vpaddw %ymm13, %ymm15, %ymm13 |
3437 | vmovdqa %ymm13, 8864(%rsp) |
3438 | vpmullw %ymm1, %ymm11, %ymm12 |
3439 | vpmullw %ymm2, %ymm10, %ymm15 |
3440 | vpaddw %ymm12, %ymm15, %ymm12 |
3441 | vpmullw %ymm3, %ymm9, %ymm15 |
3442 | vpaddw %ymm12, %ymm15, %ymm12 |
3443 | vpmullw %ymm4, %ymm8, %ymm15 |
3444 | vpaddw %ymm12, %ymm15, %ymm12 |
3445 | vpmullw %ymm5, %ymm7, %ymm15 |
3446 | vpaddw %ymm12, %ymm15, %ymm12 |
3447 | vmovdqa %ymm12, 8896(%rsp) |
3448 | vpmullw %ymm2, %ymm11, %ymm13 |
3449 | vpmullw %ymm3, %ymm10, %ymm15 |
3450 | vpaddw %ymm13, %ymm15, %ymm13 |
3451 | vpmullw %ymm4, %ymm9, %ymm15 |
3452 | vpaddw %ymm13, %ymm15, %ymm13 |
3453 | vpmullw %ymm5, %ymm8, %ymm15 |
3454 | vpaddw %ymm13, %ymm15, %ymm13 |
3455 | vmovdqa %ymm13, 8928(%rsp) |
3456 | vpmullw %ymm3, %ymm11, %ymm12 |
3457 | vpmullw %ymm4, %ymm10, %ymm15 |
3458 | vpaddw %ymm12, %ymm15, %ymm12 |
3459 | vpmullw %ymm5, %ymm9, %ymm15 |
3460 | vpaddw %ymm12, %ymm15, %ymm12 |
3461 | vmovdqa %ymm12, 8960(%rsp) |
3462 | vpmullw %ymm4, %ymm11, %ymm13 |
3463 | vpmullw %ymm5, %ymm10, %ymm15 |
3464 | vpaddw %ymm13, %ymm15, %ymm13 |
3465 | vmovdqa %ymm13, 8992(%rsp) |
3466 | vpmullw %ymm5, %ymm11, %ymm12 |
3467 | vmovdqa %ymm12, 9024(%rsp) |
3468 | vmovdqa 7136(%rsp), %ymm0 |
3469 | vmovdqa 7840(%rsp), %ymm6 |
3470 | vmovdqa 7168(%rsp), %ymm1 |
3471 | vmovdqa 7872(%rsp), %ymm7 |
3472 | vmovdqa 7200(%rsp), %ymm2 |
3473 | vmovdqa 7904(%rsp), %ymm8 |
3474 | vmovdqa 7232(%rsp), %ymm3 |
3475 | vmovdqa 7936(%rsp), %ymm9 |
3476 | vmovdqa 7264(%rsp), %ymm4 |
3477 | vmovdqa 7968(%rsp), %ymm10 |
3478 | vpmullw %ymm0, %ymm6, %ymm12 |
3479 | vmovdqa %ymm12, 9088(%rsp) |
3480 | vpmullw %ymm0, %ymm7, %ymm13 |
3481 | vpmullw %ymm1, %ymm6, %ymm15 |
3482 | vpaddw %ymm13, %ymm15, %ymm13 |
3483 | vmovdqa %ymm13, 9120(%rsp) |
3484 | vpmullw %ymm0, %ymm8, %ymm12 |
3485 | vpmullw %ymm1, %ymm7, %ymm15 |
3486 | vpaddw %ymm12, %ymm15, %ymm12 |
3487 | vpmullw %ymm2, %ymm6, %ymm15 |
3488 | vpaddw %ymm12, %ymm15, %ymm12 |
3489 | vmovdqa %ymm12, 9152(%rsp) |
3490 | vpmullw %ymm0, %ymm9, %ymm13 |
3491 | vpmullw %ymm1, %ymm8, %ymm15 |
3492 | vpaddw %ymm13, %ymm15, %ymm13 |
3493 | vpmullw %ymm2, %ymm7, %ymm15 |
3494 | vpaddw %ymm13, %ymm15, %ymm13 |
3495 | vpmullw %ymm3, %ymm6, %ymm15 |
3496 | vpaddw %ymm13, %ymm15, %ymm13 |
3497 | vmovdqa %ymm13, 9184(%rsp) |
3498 | vpmullw %ymm0, %ymm10, %ymm12 |
3499 | vpmullw %ymm1, %ymm9, %ymm15 |
3500 | vpaddw %ymm12, %ymm15, %ymm12 |
3501 | vpmullw %ymm2, %ymm8, %ymm15 |
3502 | vpaddw %ymm12, %ymm15, %ymm12 |
3503 | vpmullw %ymm3, %ymm7, %ymm15 |
3504 | vpaddw %ymm12, %ymm15, %ymm12 |
3505 | vpmullw %ymm4, %ymm6, %ymm15 |
3506 | vpaddw %ymm12, %ymm15, %ymm12 |
3507 | vmovdqa %ymm12, 9216(%rsp) |
3508 | vpmullw %ymm1, %ymm10, %ymm13 |
3509 | vpmullw %ymm2, %ymm9, %ymm15 |
3510 | vpaddw %ymm13, %ymm15, %ymm13 |
3511 | vpmullw %ymm3, %ymm8, %ymm15 |
3512 | vpaddw %ymm13, %ymm15, %ymm13 |
3513 | vpmullw %ymm4, %ymm7, %ymm15 |
3514 | vpaddw %ymm13, %ymm15, %ymm13 |
3515 | vmovdqa %ymm13, 9248(%rsp) |
3516 | vpmullw %ymm2, %ymm10, %ymm12 |
3517 | vpmullw %ymm3, %ymm9, %ymm15 |
3518 | vpaddw %ymm12, %ymm15, %ymm12 |
3519 | vpmullw %ymm4, %ymm8, %ymm15 |
3520 | vpaddw %ymm12, %ymm15, %ymm12 |
3521 | vmovdqa %ymm12, 9280(%rsp) |
3522 | vpmullw %ymm3, %ymm10, %ymm13 |
3523 | vpmullw %ymm4, %ymm9, %ymm15 |
3524 | vpaddw %ymm13, %ymm15, %ymm13 |
3525 | vmovdqa %ymm13, 9312(%rsp) |
3526 | vpmullw %ymm4, %ymm10, %ymm12 |
3527 | vmovdqa %ymm12, 9344(%rsp) |
3528 | vpaddw 6944(%rsp), %ymm0, %ymm0 |
3529 | vpaddw 7648(%rsp), %ymm6, %ymm6 |
3530 | vpaddw 6976(%rsp), %ymm1, %ymm1 |
3531 | vpaddw 7680(%rsp), %ymm7, %ymm7 |
3532 | vpaddw 7008(%rsp), %ymm2, %ymm2 |
3533 | vpaddw 7712(%rsp), %ymm8, %ymm8 |
3534 | vpaddw 7040(%rsp), %ymm3, %ymm3 |
3535 | vpaddw 7744(%rsp), %ymm9, %ymm9 |
3536 | vpaddw 7072(%rsp), %ymm4, %ymm4 |
3537 | vpaddw 7776(%rsp), %ymm10, %ymm10 |
3538 | vpmullw %ymm0, %ymm11, %ymm12 |
3539 | vpmullw %ymm1, %ymm10, %ymm15 |
3540 | vpaddw %ymm15, %ymm12, %ymm12 |
3541 | vpmullw %ymm2, %ymm9, %ymm15 |
3542 | vpaddw %ymm15, %ymm12, %ymm12 |
3543 | vpmullw %ymm3, %ymm8, %ymm15 |
3544 | vpaddw %ymm15, %ymm12, %ymm12 |
3545 | vpmullw %ymm4, %ymm7, %ymm15 |
3546 | vpaddw %ymm15, %ymm12, %ymm12 |
3547 | vpmullw %ymm5, %ymm6, %ymm15 |
3548 | vpaddw %ymm15, %ymm12, %ymm12 |
3549 | vpsubw 8864(%rsp), %ymm12, %ymm12 |
3550 | vpsubw 9248(%rsp), %ymm12, %ymm12 |
3551 | vmovdqa %ymm12, 9056(%rsp) |
3552 | vpmullw %ymm5, %ymm7, %ymm12 |
3553 | vpmullw %ymm5, %ymm8, %ymm13 |
3554 | vpmullw %ymm5, %ymm9, %ymm14 |
3555 | vpmullw %ymm5, %ymm10, %ymm15 |
3556 | vpmullw %ymm1, %ymm11, %ymm5 |
3557 | vpaddw %ymm5, %ymm12, %ymm12 |
3558 | vpmullw %ymm2, %ymm10, %ymm5 |
3559 | vpaddw %ymm5, %ymm12, %ymm12 |
3560 | vpmullw %ymm3, %ymm9, %ymm5 |
3561 | vpaddw %ymm5, %ymm12, %ymm12 |
3562 | vpmullw %ymm4, %ymm8, %ymm5 |
3563 | vpaddw %ymm5, %ymm12, %ymm12 |
3564 | vpmullw %ymm2, %ymm11, %ymm5 |
3565 | vpaddw %ymm5, %ymm13, %ymm13 |
3566 | vpmullw %ymm3, %ymm10, %ymm5 |
3567 | vpaddw %ymm5, %ymm13, %ymm13 |
3568 | vpmullw %ymm4, %ymm9, %ymm5 |
3569 | vpaddw %ymm5, %ymm13, %ymm13 |
3570 | vpmullw %ymm3, %ymm11, %ymm5 |
3571 | vpaddw %ymm5, %ymm14, %ymm14 |
3572 | vpmullw %ymm4, %ymm10, %ymm5 |
3573 | vpaddw %ymm5, %ymm14, %ymm14 |
3574 | vpmullw %ymm4, %ymm11, %ymm5 |
3575 | vpaddw %ymm5, %ymm15, %ymm15 |
3576 | vpmullw %ymm0, %ymm10, %ymm11 |
3577 | vpmullw %ymm1, %ymm9, %ymm5 |
3578 | vpaddw %ymm5, %ymm11, %ymm11 |
3579 | vpmullw %ymm2, %ymm8, %ymm5 |
3580 | vpaddw %ymm5, %ymm11, %ymm11 |
3581 | vpmullw %ymm3, %ymm7, %ymm5 |
3582 | vpaddw %ymm5, %ymm11, %ymm11 |
3583 | vpmullw %ymm4, %ymm6, %ymm5 |
3584 | vpaddw %ymm5, %ymm11, %ymm11 |
3585 | vpmullw %ymm0, %ymm9, %ymm10 |
3586 | vpmullw %ymm1, %ymm8, %ymm5 |
3587 | vpaddw %ymm5, %ymm10, %ymm10 |
3588 | vpmullw %ymm2, %ymm7, %ymm5 |
3589 | vpaddw %ymm5, %ymm10, %ymm10 |
3590 | vpmullw %ymm3, %ymm6, %ymm5 |
3591 | vpaddw %ymm5, %ymm10, %ymm10 |
3592 | vpmullw %ymm0, %ymm8, %ymm9 |
3593 | vpmullw %ymm1, %ymm7, %ymm5 |
3594 | vpaddw %ymm5, %ymm9, %ymm9 |
3595 | vpmullw %ymm2, %ymm6, %ymm5 |
3596 | vpaddw %ymm5, %ymm9, %ymm9 |
3597 | vpmullw %ymm0, %ymm7, %ymm8 |
3598 | vpmullw %ymm1, %ymm6, %ymm5 |
3599 | vpaddw %ymm5, %ymm8, %ymm8 |
3600 | vpmullw %ymm0, %ymm6, %ymm7 |
3601 | vmovdqa 8896(%rsp), %ymm0 |
3602 | vpsubw 9088(%rsp), %ymm0, %ymm0 |
3603 | vpsubw %ymm0, %ymm12, %ymm6 |
3604 | vpsubw 9280(%rsp), %ymm6, %ymm6 |
3605 | vmovdqa %ymm6, 9088(%rsp) |
3606 | vpaddw %ymm7, %ymm0, %ymm0 |
3607 | vpsubw 8704(%rsp), %ymm0, %ymm0 |
3608 | vmovdqa %ymm0, 8896(%rsp) |
3609 | vmovdqa 8928(%rsp), %ymm1 |
3610 | vpsubw 9120(%rsp), %ymm1, %ymm1 |
3611 | vpsubw %ymm1, %ymm13, %ymm7 |
3612 | vpsubw 9312(%rsp), %ymm7, %ymm7 |
3613 | vmovdqa %ymm7, 9120(%rsp) |
3614 | vpaddw %ymm8, %ymm1, %ymm1 |
3615 | vpsubw 8736(%rsp), %ymm1, %ymm1 |
3616 | vmovdqa %ymm1, 8928(%rsp) |
3617 | vmovdqa 8960(%rsp), %ymm2 |
3618 | vpsubw 9152(%rsp), %ymm2, %ymm2 |
3619 | vpsubw %ymm2, %ymm14, %ymm8 |
3620 | vpsubw 9344(%rsp), %ymm8, %ymm8 |
3621 | vmovdqa %ymm8, 9152(%rsp) |
3622 | vpaddw %ymm9, %ymm2, %ymm2 |
3623 | vpsubw 8768(%rsp), %ymm2, %ymm2 |
3624 | vmovdqa %ymm2, 8960(%rsp) |
3625 | vmovdqa 8992(%rsp), %ymm3 |
3626 | vpsubw 9184(%rsp), %ymm3, %ymm3 |
3627 | vpsubw %ymm3, %ymm15, %ymm9 |
3628 | vmovdqa %ymm9, 9184(%rsp) |
3629 | vpaddw %ymm10, %ymm3, %ymm3 |
3630 | vpsubw 8800(%rsp), %ymm3, %ymm3 |
3631 | vmovdqa %ymm3, 8992(%rsp) |
3632 | vmovdqa 9024(%rsp), %ymm4 |
3633 | vpsubw 9216(%rsp), %ymm4, %ymm4 |
3634 | vpaddw %ymm11, %ymm4, %ymm4 |
3635 | vpsubw 8832(%rsp), %ymm4, %ymm4 |
3636 | vmovdqa %ymm4, 9024(%rsp) |
3637 | vmovdqa 6592(%rsp), %ymm0 |
3638 | vmovdqa 7296(%rsp), %ymm6 |
3639 | vpaddw 6944(%rsp), %ymm0, %ymm0 |
3640 | vpaddw 7648(%rsp), %ymm6, %ymm6 |
3641 | vmovdqa 6624(%rsp), %ymm1 |
3642 | vmovdqa 7328(%rsp), %ymm7 |
3643 | vpaddw 6976(%rsp), %ymm1, %ymm1 |
3644 | vpaddw 7680(%rsp), %ymm7, %ymm7 |
3645 | vmovdqa 6656(%rsp), %ymm2 |
3646 | vmovdqa 7360(%rsp), %ymm8 |
3647 | vpaddw 7008(%rsp), %ymm2, %ymm2 |
3648 | vpaddw 7712(%rsp), %ymm8, %ymm8 |
3649 | vmovdqa 6688(%rsp), %ymm3 |
3650 | vmovdqa 7392(%rsp), %ymm9 |
3651 | vpaddw 7040(%rsp), %ymm3, %ymm3 |
3652 | vpaddw 7744(%rsp), %ymm9, %ymm9 |
3653 | vmovdqa 6720(%rsp), %ymm4 |
3654 | vmovdqa 7424(%rsp), %ymm10 |
3655 | vpaddw 7072(%rsp), %ymm4, %ymm4 |
3656 | vpaddw 7776(%rsp), %ymm10, %ymm10 |
3657 | vmovdqa 6752(%rsp), %ymm5 |
3658 | vmovdqa 7456(%rsp), %ymm11 |
3659 | vpaddw 7104(%rsp), %ymm5, %ymm5 |
3660 | vpaddw 7808(%rsp), %ymm11, %ymm11 |
3661 | vpmullw %ymm0, %ymm6, %ymm12 |
3662 | vmovdqa %ymm12, 5888(%rsp) |
3663 | vpmullw %ymm0, %ymm7, %ymm13 |
3664 | vpmullw %ymm1, %ymm6, %ymm15 |
3665 | vpaddw %ymm13, %ymm15, %ymm13 |
3666 | vmovdqa %ymm13, 5920(%rsp) |
3667 | vpmullw %ymm0, %ymm8, %ymm12 |
3668 | vpmullw %ymm1, %ymm7, %ymm15 |
3669 | vpaddw %ymm12, %ymm15, %ymm12 |
3670 | vpmullw %ymm2, %ymm6, %ymm15 |
3671 | vpaddw %ymm12, %ymm15, %ymm12 |
3672 | vmovdqa %ymm12, 5952(%rsp) |
3673 | vpmullw %ymm0, %ymm9, %ymm13 |
3674 | vpmullw %ymm1, %ymm8, %ymm15 |
3675 | vpaddw %ymm13, %ymm15, %ymm13 |
3676 | vpmullw %ymm2, %ymm7, %ymm15 |
3677 | vpaddw %ymm13, %ymm15, %ymm13 |
3678 | vpmullw %ymm3, %ymm6, %ymm15 |
3679 | vpaddw %ymm13, %ymm15, %ymm13 |
3680 | vmovdqa %ymm13, 5984(%rsp) |
3681 | vpmullw %ymm0, %ymm10, %ymm12 |
3682 | vpmullw %ymm1, %ymm9, %ymm15 |
3683 | vpaddw %ymm12, %ymm15, %ymm12 |
3684 | vpmullw %ymm2, %ymm8, %ymm15 |
3685 | vpaddw %ymm12, %ymm15, %ymm12 |
3686 | vpmullw %ymm3, %ymm7, %ymm15 |
3687 | vpaddw %ymm12, %ymm15, %ymm12 |
3688 | vpmullw %ymm4, %ymm6, %ymm15 |
3689 | vpaddw %ymm12, %ymm15, %ymm12 |
3690 | vmovdqa %ymm12, 6016(%rsp) |
3691 | vpmullw %ymm0, %ymm11, %ymm13 |
3692 | vpmullw %ymm1, %ymm10, %ymm15 |
3693 | vpaddw %ymm13, %ymm15, %ymm13 |
3694 | vpmullw %ymm2, %ymm9, %ymm15 |
3695 | vpaddw %ymm13, %ymm15, %ymm13 |
3696 | vpmullw %ymm3, %ymm8, %ymm15 |
3697 | vpaddw %ymm13, %ymm15, %ymm13 |
3698 | vpmullw %ymm4, %ymm7, %ymm15 |
3699 | vpaddw %ymm13, %ymm15, %ymm13 |
3700 | vpmullw %ymm5, %ymm6, %ymm15 |
3701 | vpaddw %ymm13, %ymm15, %ymm13 |
3702 | vmovdqa %ymm13, 6048(%rsp) |
3703 | vpmullw %ymm1, %ymm11, %ymm12 |
3704 | vpmullw %ymm2, %ymm10, %ymm15 |
3705 | vpaddw %ymm12, %ymm15, %ymm12 |
3706 | vpmullw %ymm3, %ymm9, %ymm15 |
3707 | vpaddw %ymm12, %ymm15, %ymm12 |
3708 | vpmullw %ymm4, %ymm8, %ymm15 |
3709 | vpaddw %ymm12, %ymm15, %ymm12 |
3710 | vpmullw %ymm5, %ymm7, %ymm15 |
3711 | vpaddw %ymm12, %ymm15, %ymm12 |
3712 | vmovdqa %ymm12, 6080(%rsp) |
3713 | vpmullw %ymm2, %ymm11, %ymm13 |
3714 | vpmullw %ymm3, %ymm10, %ymm15 |
3715 | vpaddw %ymm13, %ymm15, %ymm13 |
3716 | vpmullw %ymm4, %ymm9, %ymm15 |
3717 | vpaddw %ymm13, %ymm15, %ymm13 |
3718 | vpmullw %ymm5, %ymm8, %ymm15 |
3719 | vpaddw %ymm13, %ymm15, %ymm13 |
3720 | vmovdqa %ymm13, 6112(%rsp) |
3721 | vpmullw %ymm3, %ymm11, %ymm12 |
3722 | vpmullw %ymm4, %ymm10, %ymm15 |
3723 | vpaddw %ymm12, %ymm15, %ymm12 |
3724 | vpmullw %ymm5, %ymm9, %ymm15 |
3725 | vpaddw %ymm12, %ymm15, %ymm12 |
3726 | vmovdqa %ymm12, 6144(%rsp) |
3727 | vpmullw %ymm4, %ymm11, %ymm13 |
3728 | vpmullw %ymm5, %ymm10, %ymm15 |
3729 | vpaddw %ymm13, %ymm15, %ymm13 |
3730 | vmovdqa %ymm13, 6176(%rsp) |
3731 | vpmullw %ymm5, %ymm11, %ymm12 |
3732 | vmovdqa %ymm12, 6208(%rsp) |
3733 | vmovdqa 6784(%rsp), %ymm0 |
3734 | vmovdqa 7488(%rsp), %ymm6 |
3735 | vpaddw 7136(%rsp), %ymm0, %ymm0 |
3736 | vpaddw 7840(%rsp), %ymm6, %ymm6 |
3737 | vmovdqa 6816(%rsp), %ymm1 |
3738 | vmovdqa 7520(%rsp), %ymm7 |
3739 | vpaddw 7168(%rsp), %ymm1, %ymm1 |
3740 | vpaddw 7872(%rsp), %ymm7, %ymm7 |
3741 | vmovdqa 6848(%rsp), %ymm2 |
3742 | vmovdqa 7552(%rsp), %ymm8 |
3743 | vpaddw 7200(%rsp), %ymm2, %ymm2 |
3744 | vpaddw 7904(%rsp), %ymm8, %ymm8 |
3745 | vmovdqa 6880(%rsp), %ymm3 |
3746 | vmovdqa 7584(%rsp), %ymm9 |
3747 | vpaddw 7232(%rsp), %ymm3, %ymm3 |
3748 | vpaddw 7936(%rsp), %ymm9, %ymm9 |
3749 | vmovdqa 6912(%rsp), %ymm4 |
3750 | vmovdqa 7616(%rsp), %ymm10 |
3751 | vpaddw 7264(%rsp), %ymm4, %ymm4 |
3752 | vpaddw 7968(%rsp), %ymm10, %ymm10 |
3753 | vpmullw %ymm0, %ymm6, %ymm12 |
3754 | vmovdqa %ymm12, 6272(%rsp) |
3755 | vpmullw %ymm0, %ymm7, %ymm13 |
3756 | vpmullw %ymm1, %ymm6, %ymm15 |
3757 | vpaddw %ymm13, %ymm15, %ymm13 |
3758 | vmovdqa %ymm13, 6304(%rsp) |
3759 | vpmullw %ymm0, %ymm8, %ymm12 |
3760 | vpmullw %ymm1, %ymm7, %ymm15 |
3761 | vpaddw %ymm12, %ymm15, %ymm12 |
3762 | vpmullw %ymm2, %ymm6, %ymm15 |
3763 | vpaddw %ymm12, %ymm15, %ymm12 |
3764 | vmovdqa %ymm12, 6336(%rsp) |
3765 | vpmullw %ymm0, %ymm9, %ymm13 |
3766 | vpmullw %ymm1, %ymm8, %ymm15 |
3767 | vpaddw %ymm13, %ymm15, %ymm13 |
3768 | vpmullw %ymm2, %ymm7, %ymm15 |
3769 | vpaddw %ymm13, %ymm15, %ymm13 |
3770 | vpmullw %ymm3, %ymm6, %ymm15 |
3771 | vpaddw %ymm13, %ymm15, %ymm13 |
3772 | vmovdqa %ymm13, 6368(%rsp) |
3773 | vpmullw %ymm0, %ymm10, %ymm12 |
3774 | vpmullw %ymm1, %ymm9, %ymm15 |
3775 | vpaddw %ymm12, %ymm15, %ymm12 |
3776 | vpmullw %ymm2, %ymm8, %ymm15 |
3777 | vpaddw %ymm12, %ymm15, %ymm12 |
3778 | vpmullw %ymm3, %ymm7, %ymm15 |
3779 | vpaddw %ymm12, %ymm15, %ymm12 |
3780 | vpmullw %ymm4, %ymm6, %ymm15 |
3781 | vpaddw %ymm12, %ymm15, %ymm12 |
3782 | vmovdqa %ymm12, 6400(%rsp) |
3783 | vpmullw %ymm1, %ymm10, %ymm13 |
3784 | vpmullw %ymm2, %ymm9, %ymm15 |
3785 | vpaddw %ymm13, %ymm15, %ymm13 |
3786 | vpmullw %ymm3, %ymm8, %ymm15 |
3787 | vpaddw %ymm13, %ymm15, %ymm13 |
3788 | vpmullw %ymm4, %ymm7, %ymm15 |
3789 | vpaddw %ymm13, %ymm15, %ymm13 |
3790 | vmovdqa %ymm13, 6432(%rsp) |
3791 | vpmullw %ymm2, %ymm10, %ymm12 |
3792 | vpmullw %ymm3, %ymm9, %ymm15 |
3793 | vpaddw %ymm12, %ymm15, %ymm12 |
3794 | vpmullw %ymm4, %ymm8, %ymm15 |
3795 | vpaddw %ymm12, %ymm15, %ymm12 |
3796 | vmovdqa %ymm12, 6464(%rsp) |
3797 | vpmullw %ymm3, %ymm10, %ymm13 |
3798 | vpmullw %ymm4, %ymm9, %ymm15 |
3799 | vpaddw %ymm13, %ymm15, %ymm13 |
3800 | vmovdqa %ymm13, 6496(%rsp) |
3801 | vpmullw %ymm4, %ymm10, %ymm12 |
3802 | vmovdqa %ymm12, 6528(%rsp) |
3803 | vpaddw 6592(%rsp), %ymm0, %ymm0 |
3804 | vpaddw 7296(%rsp), %ymm6, %ymm6 |
3805 | vpaddw 6944(%rsp), %ymm0, %ymm0 |
3806 | vpaddw 7648(%rsp), %ymm6, %ymm6 |
3807 | vpaddw 6624(%rsp), %ymm1, %ymm1 |
3808 | vpaddw 7328(%rsp), %ymm7, %ymm7 |
3809 | vpaddw 6976(%rsp), %ymm1, %ymm1 |
3810 | vpaddw 7680(%rsp), %ymm7, %ymm7 |
3811 | vpaddw 6656(%rsp), %ymm2, %ymm2 |
3812 | vpaddw 7360(%rsp), %ymm8, %ymm8 |
3813 | vpaddw 7008(%rsp), %ymm2, %ymm2 |
3814 | vpaddw 7712(%rsp), %ymm8, %ymm8 |
3815 | vpaddw 6688(%rsp), %ymm3, %ymm3 |
3816 | vpaddw 7392(%rsp), %ymm9, %ymm9 |
3817 | vpaddw 7040(%rsp), %ymm3, %ymm3 |
3818 | vpaddw 7744(%rsp), %ymm9, %ymm9 |
3819 | vpaddw 6720(%rsp), %ymm4, %ymm4 |
3820 | vpaddw 7424(%rsp), %ymm10, %ymm10 |
3821 | vpaddw 7072(%rsp), %ymm4, %ymm4 |
3822 | vpaddw 7776(%rsp), %ymm10, %ymm10 |
3823 | vpmullw %ymm0, %ymm11, %ymm12 |
3824 | vpmullw %ymm1, %ymm10, %ymm15 |
3825 | vpaddw %ymm15, %ymm12, %ymm12 |
3826 | vpmullw %ymm2, %ymm9, %ymm15 |
3827 | vpaddw %ymm15, %ymm12, %ymm12 |
3828 | vpmullw %ymm3, %ymm8, %ymm15 |
3829 | vpaddw %ymm15, %ymm12, %ymm12 |
3830 | vpmullw %ymm4, %ymm7, %ymm15 |
3831 | vpaddw %ymm15, %ymm12, %ymm12 |
3832 | vpmullw %ymm5, %ymm6, %ymm15 |
3833 | vpaddw %ymm15, %ymm12, %ymm12 |
3834 | vpsubw 6048(%rsp), %ymm12, %ymm12 |
3835 | vpsubw 6432(%rsp), %ymm12, %ymm12 |
3836 | vmovdqa %ymm12, 6240(%rsp) |
3837 | vpmullw %ymm5, %ymm7, %ymm12 |
3838 | vpmullw %ymm5, %ymm8, %ymm13 |
3839 | vpmullw %ymm5, %ymm9, %ymm14 |
3840 | vpmullw %ymm5, %ymm10, %ymm15 |
3841 | vpmullw %ymm1, %ymm11, %ymm5 |
3842 | vpaddw %ymm5, %ymm12, %ymm12 |
3843 | vpmullw %ymm2, %ymm10, %ymm5 |
3844 | vpaddw %ymm5, %ymm12, %ymm12 |
3845 | vpmullw %ymm3, %ymm9, %ymm5 |
3846 | vpaddw %ymm5, %ymm12, %ymm12 |
3847 | vpmullw %ymm4, %ymm8, %ymm5 |
3848 | vpaddw %ymm5, %ymm12, %ymm12 |
3849 | vpmullw %ymm2, %ymm11, %ymm5 |
3850 | vpaddw %ymm5, %ymm13, %ymm13 |
3851 | vpmullw %ymm3, %ymm10, %ymm5 |
3852 | vpaddw %ymm5, %ymm13, %ymm13 |
3853 | vpmullw %ymm4, %ymm9, %ymm5 |
3854 | vpaddw %ymm5, %ymm13, %ymm13 |
3855 | vpmullw %ymm3, %ymm11, %ymm5 |
3856 | vpaddw %ymm5, %ymm14, %ymm14 |
3857 | vpmullw %ymm4, %ymm10, %ymm5 |
3858 | vpaddw %ymm5, %ymm14, %ymm14 |
3859 | vpmullw %ymm4, %ymm11, %ymm5 |
3860 | vpaddw %ymm5, %ymm15, %ymm15 |
3861 | vpmullw %ymm0, %ymm10, %ymm11 |
3862 | vpmullw %ymm1, %ymm9, %ymm5 |
3863 | vpaddw %ymm5, %ymm11, %ymm11 |
3864 | vpmullw %ymm2, %ymm8, %ymm5 |
3865 | vpaddw %ymm5, %ymm11, %ymm11 |
3866 | vpmullw %ymm3, %ymm7, %ymm5 |
3867 | vpaddw %ymm5, %ymm11, %ymm11 |
3868 | vpmullw %ymm4, %ymm6, %ymm5 |
3869 | vpaddw %ymm5, %ymm11, %ymm11 |
3870 | vpmullw %ymm0, %ymm9, %ymm10 |
3871 | vpmullw %ymm1, %ymm8, %ymm5 |
3872 | vpaddw %ymm5, %ymm10, %ymm10 |
3873 | vpmullw %ymm2, %ymm7, %ymm5 |
3874 | vpaddw %ymm5, %ymm10, %ymm10 |
3875 | vpmullw %ymm3, %ymm6, %ymm5 |
3876 | vpaddw %ymm5, %ymm10, %ymm10 |
3877 | vpmullw %ymm0, %ymm8, %ymm9 |
3878 | vpmullw %ymm1, %ymm7, %ymm5 |
3879 | vpaddw %ymm5, %ymm9, %ymm9 |
3880 | vpmullw %ymm2, %ymm6, %ymm5 |
3881 | vpaddw %ymm5, %ymm9, %ymm9 |
3882 | vpmullw %ymm0, %ymm7, %ymm8 |
3883 | vpmullw %ymm1, %ymm6, %ymm5 |
3884 | vpaddw %ymm5, %ymm8, %ymm8 |
3885 | vpmullw %ymm0, %ymm6, %ymm7 |
3886 | vmovdqa 6080(%rsp), %ymm0 |
3887 | vpsubw 6272(%rsp), %ymm0, %ymm0 |
3888 | vpsubw %ymm0, %ymm12, %ymm6 |
3889 | vpsubw 6464(%rsp), %ymm6, %ymm6 |
3890 | vmovdqa %ymm6, 6272(%rsp) |
3891 | vpaddw %ymm7, %ymm0, %ymm0 |
3892 | vpsubw 5888(%rsp), %ymm0, %ymm0 |
3893 | vmovdqa %ymm0, 6080(%rsp) |
3894 | vmovdqa 6112(%rsp), %ymm1 |
3895 | vpsubw 6304(%rsp), %ymm1, %ymm1 |
3896 | vpsubw %ymm1, %ymm13, %ymm7 |
3897 | vpsubw 6496(%rsp), %ymm7, %ymm7 |
3898 | vmovdqa %ymm7, 6304(%rsp) |
3899 | vpaddw %ymm8, %ymm1, %ymm1 |
3900 | vpsubw 5920(%rsp), %ymm1, %ymm1 |
3901 | vmovdqa %ymm1, 6112(%rsp) |
3902 | vmovdqa 6144(%rsp), %ymm2 |
3903 | vpsubw 6336(%rsp), %ymm2, %ymm2 |
3904 | vpsubw %ymm2, %ymm14, %ymm8 |
3905 | vpsubw 6528(%rsp), %ymm8, %ymm8 |
3906 | vmovdqa %ymm8, 6336(%rsp) |
3907 | vpaddw %ymm9, %ymm2, %ymm2 |
3908 | vpsubw 5952(%rsp), %ymm2, %ymm2 |
3909 | vmovdqa %ymm2, 6144(%rsp) |
3910 | vmovdqa 6176(%rsp), %ymm3 |
3911 | vpsubw 6368(%rsp), %ymm3, %ymm3 |
3912 | vpsubw %ymm3, %ymm15, %ymm9 |
3913 | vmovdqa %ymm9, 6368(%rsp) |
3914 | vpaddw %ymm10, %ymm3, %ymm3 |
3915 | vpsubw 5984(%rsp), %ymm3, %ymm3 |
3916 | vmovdqa %ymm3, 6176(%rsp) |
3917 | vmovdqa 6208(%rsp), %ymm4 |
3918 | vpsubw 6400(%rsp), %ymm4, %ymm4 |
3919 | vpaddw %ymm11, %ymm4, %ymm4 |
3920 | vpsubw 6016(%rsp), %ymm4, %ymm4 |
3921 | vmovdqa %ymm4, 6208(%rsp) |
3922 | vmovdqa 8352(%rsp), %ymm0 |
3923 | vpsubw 8704(%rsp), %ymm0, %ymm0 |
3924 | vmovdqa 6240(%rsp), %ymm1 |
3925 | vpsubw %ymm0, %ymm1, %ymm1 |
3926 | vpsubw 9056(%rsp), %ymm1, %ymm6 |
3927 | vpsubw 8000(%rsp), %ymm0, %ymm0 |
3928 | vpaddw 5888(%rsp), %ymm0, %ymm0 |
3929 | vmovdqa %ymm0, 8352(%rsp) |
3930 | vmovdqa 8384(%rsp), %ymm0 |
3931 | vpsubw 8736(%rsp), %ymm0, %ymm0 |
3932 | vmovdqa 6272(%rsp), %ymm1 |
3933 | vpsubw %ymm0, %ymm1, %ymm1 |
3934 | vpsubw 9088(%rsp), %ymm1, %ymm7 |
3935 | vpsubw 8032(%rsp), %ymm0, %ymm0 |
3936 | vpaddw 5920(%rsp), %ymm0, %ymm0 |
3937 | vmovdqa %ymm0, 8384(%rsp) |
3938 | vmovdqa 8416(%rsp), %ymm0 |
3939 | vpsubw 8768(%rsp), %ymm0, %ymm0 |
3940 | vmovdqa 6304(%rsp), %ymm1 |
3941 | vpsubw %ymm0, %ymm1, %ymm1 |
3942 | vpsubw 9120(%rsp), %ymm1, %ymm8 |
3943 | vpsubw 8064(%rsp), %ymm0, %ymm0 |
3944 | vpaddw 5952(%rsp), %ymm0, %ymm0 |
3945 | vmovdqa %ymm0, 8416(%rsp) |
3946 | vmovdqa 8448(%rsp), %ymm0 |
3947 | vpsubw 8800(%rsp), %ymm0, %ymm0 |
3948 | vmovdqa 6336(%rsp), %ymm1 |
3949 | vpsubw %ymm0, %ymm1, %ymm1 |
3950 | vpsubw 9152(%rsp), %ymm1, %ymm9 |
3951 | vpsubw 8096(%rsp), %ymm0, %ymm0 |
3952 | vpaddw 5984(%rsp), %ymm0, %ymm0 |
3953 | vmovdqa %ymm0, 8448(%rsp) |
3954 | vmovdqa 8480(%rsp), %ymm0 |
3955 | vpsubw 8832(%rsp), %ymm0, %ymm0 |
3956 | vmovdqa 6368(%rsp), %ymm1 |
3957 | vpsubw %ymm0, %ymm1, %ymm1 |
3958 | vpsubw 9184(%rsp), %ymm1, %ymm10 |
3959 | vpsubw 8128(%rsp), %ymm0, %ymm0 |
3960 | vpaddw 6016(%rsp), %ymm0, %ymm0 |
3961 | vmovdqa %ymm0, 8480(%rsp) |
3962 | vmovdqa 8512(%rsp), %ymm0 |
3963 | vpsubw 8864(%rsp), %ymm0, %ymm0 |
3964 | vmovdqa 6400(%rsp), %ymm1 |
3965 | vpsubw %ymm0, %ymm1, %ymm1 |
3966 | vpsubw 9216(%rsp), %ymm1, %ymm11 |
3967 | vpsubw 8160(%rsp), %ymm0, %ymm0 |
3968 | vpaddw 6048(%rsp), %ymm0, %ymm0 |
3969 | vmovdqa %ymm0, 8512(%rsp) |
3970 | vmovdqa 8544(%rsp), %ymm0 |
3971 | vpsubw 8896(%rsp), %ymm0, %ymm0 |
3972 | vmovdqa 6432(%rsp), %ymm1 |
3973 | vpsubw %ymm0, %ymm1, %ymm1 |
3974 | vpsubw 9248(%rsp), %ymm1, %ymm12 |
3975 | vpsubw 8192(%rsp), %ymm0, %ymm0 |
3976 | vpaddw 6080(%rsp), %ymm0, %ymm0 |
3977 | vmovdqa %ymm0, 8544(%rsp) |
3978 | vmovdqa 8576(%rsp), %ymm0 |
3979 | vpsubw 8928(%rsp), %ymm0, %ymm0 |
3980 | vmovdqa 6464(%rsp), %ymm1 |
3981 | vpsubw %ymm0, %ymm1, %ymm1 |
3982 | vpsubw 9280(%rsp), %ymm1, %ymm13 |
3983 | vpsubw 8224(%rsp), %ymm0, %ymm0 |
3984 | vpaddw 6112(%rsp), %ymm0, %ymm0 |
3985 | vmovdqa %ymm0, 8576(%rsp) |
3986 | vmovdqa 8608(%rsp), %ymm0 |
3987 | vpsubw 8960(%rsp), %ymm0, %ymm0 |
3988 | vmovdqa 6496(%rsp), %ymm1 |
3989 | vpsubw %ymm0, %ymm1, %ymm1 |
3990 | vpsubw 9312(%rsp), %ymm1, %ymm14 |
3991 | vpsubw 8256(%rsp), %ymm0, %ymm0 |
3992 | vpaddw 6144(%rsp), %ymm0, %ymm0 |
3993 | vmovdqa %ymm0, 8608(%rsp) |
3994 | vmovdqa 8640(%rsp), %ymm0 |
3995 | vpsubw 8992(%rsp), %ymm0, %ymm0 |
3996 | vmovdqa 6528(%rsp), %ymm1 |
3997 | vpsubw %ymm0, %ymm1, %ymm1 |
3998 | vpsubw 9344(%rsp), %ymm1, %ymm15 |
3999 | vpsubw 8288(%rsp), %ymm0, %ymm0 |
4000 | vpaddw 6176(%rsp), %ymm0, %ymm0 |
4001 | vmovdqa %ymm0, 8640(%rsp) |
4002 | vmovdqa 6208(%rsp), %ymm0 |
4003 | vpsubw 8320(%rsp), %ymm0, %ymm0 |
4004 | vpsubw 9024(%rsp), %ymm0, %ymm0 |
4005 | vpsubw 3488(%r10), %ymm0, %ymm0 |
4006 | vpsubw 4896(%r10), %ymm0, %ymm0 |
4007 | vmovdqa %ymm0, 4192(%r10) |
4008 | vmovdqa 3520(%r10), %ymm0 |
4009 | vpsubw 4224(%r10), %ymm0, %ymm0 |
4010 | vpsubw %ymm0, %ymm6, %ymm6 |
4011 | vpsubw 4928(%r10), %ymm6, %ymm6 |
4012 | vpsubw 2816(%r10), %ymm0, %ymm0 |
4013 | vpaddw 8000(%rsp), %ymm0, %ymm0 |
4014 | vmovdqa %ymm0, 3520(%r10) |
4015 | vmovdqa %ymm6, 4224(%r10) |
4016 | vmovdqa 3552(%r10), %ymm0 |
4017 | vpsubw 4256(%r10), %ymm0, %ymm0 |
4018 | vpsubw %ymm0, %ymm7, %ymm7 |
4019 | vpsubw 4960(%r10), %ymm7, %ymm7 |
4020 | vpsubw 2848(%r10), %ymm0, %ymm0 |
4021 | vpaddw 8032(%rsp), %ymm0, %ymm0 |
4022 | vmovdqa %ymm0, 3552(%r10) |
4023 | vmovdqa %ymm7, 4256(%r10) |
4024 | vmovdqa 3584(%r10), %ymm0 |
4025 | vpsubw 4288(%r10), %ymm0, %ymm0 |
4026 | vpsubw %ymm0, %ymm8, %ymm8 |
4027 | vpsubw 4992(%r10), %ymm8, %ymm8 |
4028 | vpsubw 2880(%r10), %ymm0, %ymm0 |
4029 | vpaddw 8064(%rsp), %ymm0, %ymm0 |
4030 | vmovdqa %ymm0, 3584(%r10) |
4031 | vmovdqa %ymm8, 4288(%r10) |
4032 | vmovdqa 3616(%r10), %ymm0 |
4033 | vpsubw 4320(%r10), %ymm0, %ymm0 |
4034 | vpsubw %ymm0, %ymm9, %ymm9 |
4035 | vpsubw 5024(%r10), %ymm9, %ymm9 |
4036 | vpsubw 2912(%r10), %ymm0, %ymm0 |
4037 | vpaddw 8096(%rsp), %ymm0, %ymm0 |
4038 | vmovdqa %ymm0, 3616(%r10) |
4039 | vmovdqa %ymm9, 4320(%r10) |
4040 | vmovdqa 3648(%r10), %ymm0 |
4041 | vpsubw 4352(%r10), %ymm0, %ymm0 |
4042 | vpsubw %ymm0, %ymm10, %ymm10 |
4043 | vpsubw 5056(%r10), %ymm10, %ymm10 |
4044 | vpsubw 2944(%r10), %ymm0, %ymm0 |
4045 | vpaddw 8128(%rsp), %ymm0, %ymm0 |
4046 | vmovdqa %ymm0, 3648(%r10) |
4047 | vmovdqa %ymm10, 4352(%r10) |
4048 | vmovdqa 3680(%r10), %ymm0 |
4049 | vpsubw 4384(%r10), %ymm0, %ymm0 |
4050 | vpsubw %ymm0, %ymm11, %ymm11 |
4051 | vpsubw 5088(%r10), %ymm11, %ymm11 |
4052 | vpsubw 2976(%r10), %ymm0, %ymm0 |
4053 | vpaddw 8160(%rsp), %ymm0, %ymm0 |
4054 | vmovdqa %ymm0, 3680(%r10) |
4055 | vmovdqa %ymm11, 4384(%r10) |
4056 | vmovdqa 3712(%r10), %ymm0 |
4057 | vpsubw 4416(%r10), %ymm0, %ymm0 |
4058 | vpsubw %ymm0, %ymm12, %ymm12 |
4059 | vpsubw 5120(%r10), %ymm12, %ymm12 |
4060 | vpsubw 3008(%r10), %ymm0, %ymm0 |
4061 | vpaddw 8192(%rsp), %ymm0, %ymm0 |
4062 | vmovdqa %ymm0, 3712(%r10) |
4063 | vmovdqa %ymm12, 4416(%r10) |
4064 | vmovdqa 3744(%r10), %ymm0 |
4065 | vpsubw 4448(%r10), %ymm0, %ymm0 |
4066 | vpsubw %ymm0, %ymm13, %ymm13 |
4067 | vpsubw 5152(%r10), %ymm13, %ymm13 |
4068 | vpsubw 3040(%r10), %ymm0, %ymm0 |
4069 | vpaddw 8224(%rsp), %ymm0, %ymm0 |
4070 | vmovdqa %ymm0, 3744(%r10) |
4071 | vmovdqa %ymm13, 4448(%r10) |
4072 | vmovdqa 3776(%r10), %ymm0 |
4073 | vpsubw 4480(%r10), %ymm0, %ymm0 |
4074 | vpsubw %ymm0, %ymm14, %ymm14 |
4075 | vpsubw 5184(%r10), %ymm14, %ymm14 |
4076 | vpsubw 3072(%r10), %ymm0, %ymm0 |
4077 | vpaddw 8256(%rsp), %ymm0, %ymm0 |
4078 | vmovdqa %ymm0, 3776(%r10) |
4079 | vmovdqa %ymm14, 4480(%r10) |
4080 | vmovdqa 3808(%r10), %ymm0 |
4081 | vpsubw 4512(%r10), %ymm0, %ymm0 |
4082 | vpsubw %ymm0, %ymm15, %ymm15 |
4083 | vpsubw 5216(%r10), %ymm15, %ymm15 |
4084 | vpsubw 3104(%r10), %ymm0, %ymm0 |
4085 | vpaddw 8288(%rsp), %ymm0, %ymm0 |
4086 | vmovdqa %ymm0, 3808(%r10) |
4087 | vmovdqa %ymm15, 4512(%r10) |
4088 | vmovdqa 3840(%r10), %ymm0 |
4089 | vpsubw 4544(%r10), %ymm0, %ymm0 |
4090 | vmovdqa 9024(%rsp), %ymm1 |
4091 | vpsubw %ymm0, %ymm1, %ymm1 |
4092 | vpsubw 5248(%r10), %ymm1, %ymm1 |
4093 | vpsubw 3136(%r10), %ymm0, %ymm0 |
4094 | vpaddw 8320(%rsp), %ymm0, %ymm0 |
4095 | vmovdqa %ymm0, 3840(%r10) |
4096 | vmovdqa %ymm1, 4544(%r10) |
4097 | vmovdqa 3872(%r10), %ymm0 |
4098 | vpsubw 4576(%r10), %ymm0, %ymm0 |
4099 | vmovdqa 9056(%rsp), %ymm1 |
4100 | vpsubw %ymm0, %ymm1, %ymm1 |
4101 | vpsubw 5280(%r10), %ymm1, %ymm1 |
4102 | vpsubw 3168(%r10), %ymm0, %ymm0 |
4103 | vpaddw 8352(%rsp), %ymm0, %ymm0 |
4104 | vmovdqa %ymm0, 3872(%r10) |
4105 | vmovdqa %ymm1, 4576(%r10) |
4106 | vmovdqa 3904(%r10), %ymm0 |
4107 | vpsubw 4608(%r10), %ymm0, %ymm0 |
4108 | vmovdqa 9088(%rsp), %ymm1 |
4109 | vpsubw %ymm0, %ymm1, %ymm1 |
4110 | vpsubw 5312(%r10), %ymm1, %ymm1 |
4111 | vpsubw 3200(%r10), %ymm0, %ymm0 |
4112 | vpaddw 8384(%rsp), %ymm0, %ymm0 |
4113 | vmovdqa %ymm0, 3904(%r10) |
4114 | vmovdqa %ymm1, 4608(%r10) |
4115 | vmovdqa 3936(%r10), %ymm0 |
4116 | vpsubw 4640(%r10), %ymm0, %ymm0 |
4117 | vmovdqa 9120(%rsp), %ymm1 |
4118 | vpsubw %ymm0, %ymm1, %ymm1 |
4119 | vpsubw 5344(%r10), %ymm1, %ymm1 |
4120 | vpsubw 3232(%r10), %ymm0, %ymm0 |
4121 | vpaddw 8416(%rsp), %ymm0, %ymm0 |
4122 | vmovdqa %ymm0, 3936(%r10) |
4123 | vmovdqa %ymm1, 4640(%r10) |
4124 | vmovdqa 3968(%r10), %ymm0 |
4125 | vpsubw 4672(%r10), %ymm0, %ymm0 |
4126 | vmovdqa 9152(%rsp), %ymm1 |
4127 | vpsubw %ymm0, %ymm1, %ymm1 |
4128 | vpsubw 5376(%r10), %ymm1, %ymm1 |
4129 | vpsubw 3264(%r10), %ymm0, %ymm0 |
4130 | vpaddw 8448(%rsp), %ymm0, %ymm0 |
4131 | vmovdqa %ymm0, 3968(%r10) |
4132 | vmovdqa %ymm1, 4672(%r10) |
4133 | vmovdqa 4000(%r10), %ymm0 |
4134 | vpsubw 4704(%r10), %ymm0, %ymm0 |
4135 | vmovdqa 9184(%rsp), %ymm1 |
4136 | vpsubw %ymm0, %ymm1, %ymm1 |
4137 | vpsubw 5408(%r10), %ymm1, %ymm1 |
4138 | vpsubw 3296(%r10), %ymm0, %ymm0 |
4139 | vpaddw 8480(%rsp), %ymm0, %ymm0 |
4140 | vmovdqa %ymm0, 4000(%r10) |
4141 | vmovdqa %ymm1, 4704(%r10) |
4142 | vmovdqa 4032(%r10), %ymm0 |
4143 | vpsubw 4736(%r10), %ymm0, %ymm0 |
4144 | vmovdqa 9216(%rsp), %ymm1 |
4145 | vpsubw %ymm0, %ymm1, %ymm1 |
4146 | vpsubw 5440(%r10), %ymm1, %ymm1 |
4147 | vpsubw 3328(%r10), %ymm0, %ymm0 |
4148 | vpaddw 8512(%rsp), %ymm0, %ymm0 |
4149 | vmovdqa %ymm0, 4032(%r10) |
4150 | vmovdqa %ymm1, 4736(%r10) |
4151 | vmovdqa 4064(%r10), %ymm0 |
4152 | vpsubw 4768(%r10), %ymm0, %ymm0 |
4153 | vmovdqa 9248(%rsp), %ymm1 |
4154 | vpsubw %ymm0, %ymm1, %ymm1 |
4155 | vpsubw 5472(%r10), %ymm1, %ymm1 |
4156 | vpsubw 3360(%r10), %ymm0, %ymm0 |
4157 | vpaddw 8544(%rsp), %ymm0, %ymm0 |
4158 | vmovdqa %ymm0, 4064(%r10) |
4159 | vmovdqa %ymm1, 4768(%r10) |
4160 | vmovdqa 4096(%r10), %ymm0 |
4161 | vpsubw 4800(%r10), %ymm0, %ymm0 |
4162 | vmovdqa 9280(%rsp), %ymm1 |
4163 | vpsubw %ymm0, %ymm1, %ymm1 |
4164 | vpsubw 5504(%r10), %ymm1, %ymm1 |
4165 | vpsubw 3392(%r10), %ymm0, %ymm0 |
4166 | vpaddw 8576(%rsp), %ymm0, %ymm0 |
4167 | vmovdqa %ymm0, 4096(%r10) |
4168 | vmovdqa %ymm1, 4800(%r10) |
4169 | vmovdqa 4128(%r10), %ymm0 |
4170 | vpsubw 4832(%r10), %ymm0, %ymm0 |
4171 | vmovdqa 9312(%rsp), %ymm1 |
4172 | vpsubw %ymm0, %ymm1, %ymm1 |
4173 | vpsubw 5536(%r10), %ymm1, %ymm1 |
4174 | vpsubw 3424(%r10), %ymm0, %ymm0 |
4175 | vpaddw 8608(%rsp), %ymm0, %ymm0 |
4176 | vmovdqa %ymm0, 4128(%r10) |
4177 | vmovdqa %ymm1, 4832(%r10) |
4178 | vmovdqa 4160(%r10), %ymm0 |
4179 | vpsubw 4864(%r10), %ymm0, %ymm0 |
4180 | vmovdqa 9344(%rsp), %ymm1 |
4181 | vpsubw %ymm0, %ymm1, %ymm1 |
4182 | vpsubw 5568(%r10), %ymm1, %ymm1 |
4183 | vpsubw 3456(%r10), %ymm0, %ymm0 |
4184 | vpaddw 8640(%rsp), %ymm0, %ymm0 |
4185 | vmovdqa %ymm0, 4160(%r10) |
4186 | vmovdqa %ymm1, 4864(%r10) |
4187 | vpxor %ymm1, %ymm1, %ymm1 |
4188 | vmovdqa %ymm1, 5600(%r10) |
4189 | subq $32, %rsp |
4190 | vmovdqa 2816(%r10), %ymm0 |
4191 | vmovdqa 2880(%r10), %ymm1 |
4192 | vmovdqa 2944(%r10), %ymm2 |
4193 | vmovdqa 3008(%r10), %ymm3 |
4194 | vpunpcklwd 2848(%r10), %ymm0, %ymm4 |
4195 | vpunpckhwd 2848(%r10), %ymm0, %ymm5 |
4196 | vpunpcklwd 2912(%r10), %ymm1, %ymm6 |
4197 | vpunpckhwd 2912(%r10), %ymm1, %ymm7 |
4198 | vpunpcklwd 2976(%r10), %ymm2, %ymm8 |
4199 | vpunpckhwd 2976(%r10), %ymm2, %ymm9 |
4200 | vpunpcklwd 3040(%r10), %ymm3, %ymm10 |
4201 | vpunpckhwd 3040(%r10), %ymm3, %ymm11 |
4202 | vpunpckldq %ymm6, %ymm4, %ymm0 |
4203 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
4204 | vpunpckldq %ymm7, %ymm5, %ymm2 |
4205 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
4206 | vpunpckldq %ymm10, %ymm8, %ymm12 |
4207 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
4208 | vpunpckldq %ymm11, %ymm9, %ymm14 |
4209 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
4210 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
4211 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
4212 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
4213 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
4214 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
4215 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
4216 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
4217 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
4218 | vmovdqa 3072(%r10), %ymm0 |
4219 | vmovdqa 3136(%r10), %ymm1 |
4220 | vmovdqa 3200(%r10), %ymm2 |
4221 | vmovdqa 3264(%r10), %ymm3 |
4222 | vpunpcklwd 3104(%r10), %ymm0, %ymm12 |
4223 | vpunpckhwd 3104(%r10), %ymm0, %ymm13 |
4224 | vpunpcklwd 3168(%r10), %ymm1, %ymm14 |
4225 | vpunpckhwd 3168(%r10), %ymm1, %ymm15 |
4226 | vpunpcklwd 3232(%r10), %ymm2, %ymm0 |
4227 | vpunpckhwd 3232(%r10), %ymm2, %ymm1 |
4228 | vpunpcklwd 3296(%r10), %ymm3, %ymm2 |
4229 | vpunpckhwd 3296(%r10), %ymm3, %ymm3 |
4230 | vmovdqa %ymm11, 0(%rsp) |
4231 | vpunpckldq %ymm14, %ymm12, %ymm11 |
4232 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
4233 | vpunpckldq %ymm15, %ymm13, %ymm14 |
4234 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
4235 | vpunpckldq %ymm2, %ymm0, %ymm13 |
4236 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
4237 | vpunpckldq %ymm3, %ymm1, %ymm2 |
4238 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
4239 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
4240 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
4241 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
4242 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
4243 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
4244 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
4245 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
4246 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
4247 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
4248 | vmovdqa %ymm15, 0(%r12) |
4249 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
4250 | vmovdqa %ymm15, 192(%r12) |
4251 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
4252 | vmovdqa %ymm15, 384(%r12) |
4253 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
4254 | vmovdqa %ymm15, 576(%r12) |
4255 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
4256 | vmovdqa %ymm15, 768(%r12) |
4257 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
4258 | vmovdqa %ymm15, 960(%r12) |
4259 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
4260 | vmovdqa %ymm15, 1152(%r12) |
4261 | vpermq $78, %ymm4, %ymm4 |
4262 | vpermq $78, %ymm5, %ymm5 |
4263 | vpermq $78, %ymm6, %ymm6 |
4264 | vpermq $78, %ymm7, %ymm7 |
4265 | vpermq $78, %ymm8, %ymm8 |
4266 | vpermq $78, %ymm9, %ymm9 |
4267 | vpermq $78, %ymm10, %ymm10 |
4268 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
4269 | vmovdqa %ymm15, 1536(%r12) |
4270 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
4271 | vmovdqa %ymm15, 1728(%r12) |
4272 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
4273 | vmovdqa %ymm15, 1920(%r12) |
4274 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
4275 | vmovdqa %ymm15, 2112(%r12) |
4276 | vinserti128 $0, %xmm8, %ymm12, %ymm15 |
4277 | vmovdqa %ymm15, 2304(%r12) |
4278 | vinserti128 $0, %xmm9, %ymm2, %ymm15 |
4279 | vmovdqa %ymm15, 2496(%r12) |
4280 | vinserti128 $0, %xmm10, %ymm14, %ymm15 |
4281 | vmovdqa %ymm15, 2688(%r12) |
4282 | vmovdqa 0(%rsp), %ymm11 |
4283 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
4284 | vmovdqa %ymm14, 1344(%r12) |
4285 | vpermq $78, %ymm11, %ymm11 |
4286 | vinserti128 $0, %xmm11, %ymm1, %ymm1 |
4287 | vmovdqa %ymm1, 2880(%r12) |
4288 | vmovdqa 3328(%r10), %ymm0 |
4289 | vmovdqa 3392(%r10), %ymm1 |
4290 | vmovdqa 3456(%r10), %ymm2 |
4291 | vmovdqa 3520(%r10), %ymm3 |
4292 | vpunpcklwd 3360(%r10), %ymm0, %ymm4 |
4293 | vpunpckhwd 3360(%r10), %ymm0, %ymm5 |
4294 | vpunpcklwd 3424(%r10), %ymm1, %ymm6 |
4295 | vpunpckhwd 3424(%r10), %ymm1, %ymm7 |
4296 | vpunpcklwd 3488(%r10), %ymm2, %ymm8 |
4297 | vpunpckhwd 3488(%r10), %ymm2, %ymm9 |
4298 | vpunpcklwd 3552(%r10), %ymm3, %ymm10 |
4299 | vpunpckhwd 3552(%r10), %ymm3, %ymm11 |
4300 | vpunpckldq %ymm6, %ymm4, %ymm0 |
4301 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
4302 | vpunpckldq %ymm7, %ymm5, %ymm2 |
4303 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
4304 | vpunpckldq %ymm10, %ymm8, %ymm12 |
4305 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
4306 | vpunpckldq %ymm11, %ymm9, %ymm14 |
4307 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
4308 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
4309 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
4310 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
4311 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
4312 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
4313 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
4314 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
4315 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
4316 | vmovdqa 3584(%r10), %ymm0 |
4317 | vmovdqa 3648(%r10), %ymm1 |
4318 | vmovdqa 3712(%r10), %ymm2 |
4319 | vmovdqa 3776(%r10), %ymm3 |
4320 | vpunpcklwd 3616(%r10), %ymm0, %ymm12 |
4321 | vpunpckhwd 3616(%r10), %ymm0, %ymm13 |
4322 | vpunpcklwd 3680(%r10), %ymm1, %ymm14 |
4323 | vpunpckhwd 3680(%r10), %ymm1, %ymm15 |
4324 | vpunpcklwd 3744(%r10), %ymm2, %ymm0 |
4325 | vpunpckhwd 3744(%r10), %ymm2, %ymm1 |
4326 | vpunpcklwd 3808(%r10), %ymm3, %ymm2 |
4327 | vpunpckhwd 3808(%r10), %ymm3, %ymm3 |
4328 | vmovdqa %ymm11, 0(%rsp) |
4329 | vpunpckldq %ymm14, %ymm12, %ymm11 |
4330 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
4331 | vpunpckldq %ymm15, %ymm13, %ymm14 |
4332 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
4333 | vpunpckldq %ymm2, %ymm0, %ymm13 |
4334 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
4335 | vpunpckldq %ymm3, %ymm1, %ymm2 |
4336 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
4337 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
4338 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
4339 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
4340 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
4341 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
4342 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
4343 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
4344 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
4345 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
4346 | vmovdqa %ymm15, 32(%r12) |
4347 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
4348 | vmovdqa %ymm15, 224(%r12) |
4349 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
4350 | vmovdqa %ymm15, 416(%r12) |
4351 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
4352 | vmovdqa %ymm15, 608(%r12) |
4353 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
4354 | vmovdqa %ymm15, 800(%r12) |
4355 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
4356 | vmovdqa %ymm15, 992(%r12) |
4357 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
4358 | vmovdqa %ymm15, 1184(%r12) |
4359 | vpermq $78, %ymm4, %ymm4 |
4360 | vpermq $78, %ymm5, %ymm5 |
4361 | vpermq $78, %ymm6, %ymm6 |
4362 | vpermq $78, %ymm7, %ymm7 |
4363 | vpermq $78, %ymm8, %ymm8 |
4364 | vpermq $78, %ymm9, %ymm9 |
4365 | vpermq $78, %ymm10, %ymm10 |
4366 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
4367 | vmovdqa %ymm15, 1568(%r12) |
4368 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
4369 | vmovdqa %ymm15, 1760(%r12) |
4370 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
4371 | vmovdqa %ymm15, 1952(%r12) |
4372 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
4373 | vmovdqa %ymm15, 2144(%r12) |
4374 | vinserti128 $0, %xmm8, %ymm12, %ymm15 |
4375 | vmovdqa %ymm15, 2336(%r12) |
4376 | vinserti128 $0, %xmm9, %ymm2, %ymm15 |
4377 | vmovdqa %ymm15, 2528(%r12) |
4378 | vinserti128 $0, %xmm10, %ymm14, %ymm15 |
4379 | vmovdqa %ymm15, 2720(%r12) |
4380 | vmovdqa 0(%rsp), %ymm11 |
4381 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
4382 | vmovdqa %ymm14, 1376(%r12) |
4383 | vpermq $78, %ymm11, %ymm11 |
4384 | vinserti128 $0, %xmm11, %ymm1, %ymm1 |
4385 | vmovdqa %ymm1, 2912(%r12) |
4386 | vmovdqa 3840(%r10), %ymm0 |
4387 | vmovdqa 3904(%r10), %ymm1 |
4388 | vmovdqa 3968(%r10), %ymm2 |
4389 | vmovdqa 4032(%r10), %ymm3 |
4390 | vpunpcklwd 3872(%r10), %ymm0, %ymm4 |
4391 | vpunpckhwd 3872(%r10), %ymm0, %ymm5 |
4392 | vpunpcklwd 3936(%r10), %ymm1, %ymm6 |
4393 | vpunpckhwd 3936(%r10), %ymm1, %ymm7 |
4394 | vpunpcklwd 4000(%r10), %ymm2, %ymm8 |
4395 | vpunpckhwd 4000(%r10), %ymm2, %ymm9 |
4396 | vpunpcklwd 4064(%r10), %ymm3, %ymm10 |
4397 | vpunpckhwd 4064(%r10), %ymm3, %ymm11 |
4398 | vpunpckldq %ymm6, %ymm4, %ymm0 |
4399 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
4400 | vpunpckldq %ymm7, %ymm5, %ymm2 |
4401 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
4402 | vpunpckldq %ymm10, %ymm8, %ymm12 |
4403 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
4404 | vpunpckldq %ymm11, %ymm9, %ymm14 |
4405 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
4406 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
4407 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
4408 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
4409 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
4410 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
4411 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
4412 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
4413 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
4414 | vmovdqa 4096(%r10), %ymm0 |
4415 | vmovdqa 4160(%r10), %ymm1 |
4416 | vmovdqa 4224(%r10), %ymm2 |
4417 | vmovdqa 4288(%r10), %ymm3 |
4418 | vpunpcklwd 4128(%r10), %ymm0, %ymm12 |
4419 | vpunpckhwd 4128(%r10), %ymm0, %ymm13 |
4420 | vpunpcklwd 4192(%r10), %ymm1, %ymm14 |
4421 | vpunpckhwd 4192(%r10), %ymm1, %ymm15 |
4422 | vpunpcklwd 4256(%r10), %ymm2, %ymm0 |
4423 | vpunpckhwd 4256(%r10), %ymm2, %ymm1 |
4424 | vpunpcklwd 4320(%r10), %ymm3, %ymm2 |
4425 | vpunpckhwd 4320(%r10), %ymm3, %ymm3 |
4426 | vmovdqa %ymm11, 0(%rsp) |
4427 | vpunpckldq %ymm14, %ymm12, %ymm11 |
4428 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
4429 | vpunpckldq %ymm15, %ymm13, %ymm14 |
4430 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
4431 | vpunpckldq %ymm2, %ymm0, %ymm13 |
4432 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
4433 | vpunpckldq %ymm3, %ymm1, %ymm2 |
4434 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
4435 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
4436 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
4437 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
4438 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
4439 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
4440 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
4441 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
4442 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
4443 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
4444 | vmovdqa %ymm15, 64(%r12) |
4445 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
4446 | vmovdqa %ymm15, 256(%r12) |
4447 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
4448 | vmovdqa %ymm15, 448(%r12) |
4449 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
4450 | vmovdqa %ymm15, 640(%r12) |
4451 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
4452 | vmovdqa %ymm15, 832(%r12) |
4453 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
4454 | vmovdqa %ymm15, 1024(%r12) |
4455 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
4456 | vmovdqa %ymm15, 1216(%r12) |
4457 | vpermq $78, %ymm4, %ymm4 |
4458 | vpermq $78, %ymm5, %ymm5 |
4459 | vpermq $78, %ymm6, %ymm6 |
4460 | vpermq $78, %ymm7, %ymm7 |
4461 | vpermq $78, %ymm8, %ymm8 |
4462 | vpermq $78, %ymm9, %ymm9 |
4463 | vpermq $78, %ymm10, %ymm10 |
4464 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
4465 | vmovdqa %ymm15, 1600(%r12) |
4466 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
4467 | vmovdqa %ymm15, 1792(%r12) |
4468 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
4469 | vmovdqa %ymm15, 1984(%r12) |
4470 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
4471 | vmovdqa %ymm15, 2176(%r12) |
4472 | vinserti128 $0, %xmm8, %ymm12, %ymm15 |
4473 | vmovdqa %ymm15, 2368(%r12) |
4474 | vinserti128 $0, %xmm9, %ymm2, %ymm15 |
4475 | vmovdqa %ymm15, 2560(%r12) |
4476 | vinserti128 $0, %xmm10, %ymm14, %ymm15 |
4477 | vmovdqa %ymm15, 2752(%r12) |
4478 | vmovdqa 0(%rsp), %ymm11 |
4479 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
4480 | vmovdqa %ymm14, 1408(%r12) |
4481 | vpermq $78, %ymm11, %ymm11 |
4482 | vinserti128 $0, %xmm11, %ymm1, %ymm1 |
4483 | vmovdqa %ymm1, 2944(%r12) |
4484 | vmovdqa 4224(%r10), %ymm0 |
4485 | vmovdqa 4288(%r10), %ymm1 |
4486 | vmovdqa 4352(%r10), %ymm2 |
4487 | vmovdqa 4416(%r10), %ymm3 |
4488 | vpunpcklwd 4256(%r10), %ymm0, %ymm4 |
4489 | vpunpckhwd 4256(%r10), %ymm0, %ymm5 |
4490 | vpunpcklwd 4320(%r10), %ymm1, %ymm6 |
4491 | vpunpckhwd 4320(%r10), %ymm1, %ymm7 |
4492 | vpunpcklwd 4384(%r10), %ymm2, %ymm8 |
4493 | vpunpckhwd 4384(%r10), %ymm2, %ymm9 |
4494 | vpunpcklwd 4448(%r10), %ymm3, %ymm10 |
4495 | vpunpckhwd 4448(%r10), %ymm3, %ymm11 |
4496 | vpunpckldq %ymm6, %ymm4, %ymm0 |
4497 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
4498 | vpunpckldq %ymm7, %ymm5, %ymm2 |
4499 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
4500 | vpunpckldq %ymm10, %ymm8, %ymm12 |
4501 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
4502 | vpunpckldq %ymm11, %ymm9, %ymm14 |
4503 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
4504 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
4505 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
4506 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
4507 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
4508 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
4509 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
4510 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
4511 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
4512 | vmovdqa 4480(%r10), %ymm0 |
4513 | vmovdqa 4544(%r10), %ymm1 |
4514 | vmovdqa 4608(%r10), %ymm2 |
4515 | vmovdqa 4672(%r10), %ymm3 |
4516 | vpunpcklwd 4512(%r10), %ymm0, %ymm12 |
4517 | vpunpckhwd 4512(%r10), %ymm0, %ymm13 |
4518 | vpunpcklwd 4576(%r10), %ymm1, %ymm14 |
4519 | vpunpckhwd 4576(%r10), %ymm1, %ymm15 |
4520 | vpunpcklwd 4640(%r10), %ymm2, %ymm0 |
4521 | vpunpckhwd 4640(%r10), %ymm2, %ymm1 |
4522 | vpunpcklwd 4704(%r10), %ymm3, %ymm2 |
4523 | vpunpckhwd 4704(%r10), %ymm3, %ymm3 |
4524 | vmovdqa %ymm11, 0(%rsp) |
4525 | vpunpckldq %ymm14, %ymm12, %ymm11 |
4526 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
4527 | vpunpckldq %ymm15, %ymm13, %ymm14 |
4528 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
4529 | vpunpckldq %ymm2, %ymm0, %ymm13 |
4530 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
4531 | vpunpckldq %ymm3, %ymm1, %ymm2 |
4532 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
4533 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
4534 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
4535 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
4536 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
4537 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
4538 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
4539 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
4540 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
4541 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
4542 | vmovdqa %ymm15, 96(%r12) |
4543 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
4544 | vmovdqa %ymm15, 288(%r12) |
4545 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
4546 | vmovdqa %ymm15, 480(%r12) |
4547 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
4548 | vmovdqa %ymm15, 672(%r12) |
4549 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
4550 | vmovdqa %ymm15, 864(%r12) |
4551 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
4552 | vmovdqa %ymm15, 1056(%r12) |
4553 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
4554 | vmovdqa %ymm15, 1248(%r12) |
4555 | vpermq $78, %ymm4, %ymm4 |
4556 | vpermq $78, %ymm5, %ymm5 |
4557 | vpermq $78, %ymm6, %ymm6 |
4558 | vpermq $78, %ymm7, %ymm7 |
4559 | vpermq $78, %ymm8, %ymm8 |
4560 | vpermq $78, %ymm9, %ymm9 |
4561 | vpermq $78, %ymm10, %ymm10 |
4562 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
4563 | vmovdqa %ymm15, 1632(%r12) |
4564 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
4565 | vmovdqa %ymm15, 1824(%r12) |
4566 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
4567 | vmovdqa %ymm15, 2016(%r12) |
4568 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
4569 | vmovdqa %ymm15, 2208(%r12) |
4570 | vinserti128 $0, %xmm8, %ymm12, %ymm15 |
4571 | vmovdqa %ymm15, 2400(%r12) |
4572 | vinserti128 $0, %xmm9, %ymm2, %ymm15 |
4573 | vmovdqa %ymm15, 2592(%r12) |
4574 | vinserti128 $0, %xmm10, %ymm14, %ymm15 |
4575 | vmovdqa %ymm15, 2784(%r12) |
4576 | vmovdqa 0(%rsp), %ymm11 |
4577 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
4578 | vmovdqa %ymm14, 1440(%r12) |
4579 | vpermq $78, %ymm11, %ymm11 |
4580 | vinserti128 $0, %xmm11, %ymm1, %ymm1 |
4581 | vmovdqa %ymm1, 2976(%r12) |
4582 | vmovdqa 4736(%r10), %ymm0 |
4583 | vmovdqa 4800(%r10), %ymm1 |
4584 | vmovdqa 4864(%r10), %ymm2 |
4585 | vmovdqa 4928(%r10), %ymm3 |
4586 | vpunpcklwd 4768(%r10), %ymm0, %ymm4 |
4587 | vpunpckhwd 4768(%r10), %ymm0, %ymm5 |
4588 | vpunpcklwd 4832(%r10), %ymm1, %ymm6 |
4589 | vpunpckhwd 4832(%r10), %ymm1, %ymm7 |
4590 | vpunpcklwd 4896(%r10), %ymm2, %ymm8 |
4591 | vpunpckhwd 4896(%r10), %ymm2, %ymm9 |
4592 | vpunpcklwd 4960(%r10), %ymm3, %ymm10 |
4593 | vpunpckhwd 4960(%r10), %ymm3, %ymm11 |
4594 | vpunpckldq %ymm6, %ymm4, %ymm0 |
4595 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
4596 | vpunpckldq %ymm7, %ymm5, %ymm2 |
4597 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
4598 | vpunpckldq %ymm10, %ymm8, %ymm12 |
4599 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
4600 | vpunpckldq %ymm11, %ymm9, %ymm14 |
4601 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
4602 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
4603 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
4604 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
4605 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
4606 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
4607 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
4608 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
4609 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
4610 | vmovdqa 4992(%r10), %ymm0 |
4611 | vmovdqa 5056(%r10), %ymm1 |
4612 | vmovdqa 5120(%r10), %ymm2 |
4613 | vmovdqa 5184(%r10), %ymm3 |
4614 | vpunpcklwd 5024(%r10), %ymm0, %ymm12 |
4615 | vpunpckhwd 5024(%r10), %ymm0, %ymm13 |
4616 | vpunpcklwd 5088(%r10), %ymm1, %ymm14 |
4617 | vpunpckhwd 5088(%r10), %ymm1, %ymm15 |
4618 | vpunpcklwd 5152(%r10), %ymm2, %ymm0 |
4619 | vpunpckhwd 5152(%r10), %ymm2, %ymm1 |
4620 | vpunpcklwd 5216(%r10), %ymm3, %ymm2 |
4621 | vpunpckhwd 5216(%r10), %ymm3, %ymm3 |
4622 | vmovdqa %ymm11, 0(%rsp) |
4623 | vpunpckldq %ymm14, %ymm12, %ymm11 |
4624 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
4625 | vpunpckldq %ymm15, %ymm13, %ymm14 |
4626 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
4627 | vpunpckldq %ymm2, %ymm0, %ymm13 |
4628 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
4629 | vpunpckldq %ymm3, %ymm1, %ymm2 |
4630 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
4631 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
4632 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
4633 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
4634 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
4635 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
4636 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
4637 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
4638 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
4639 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
4640 | vmovdqa %ymm15, 128(%r12) |
4641 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
4642 | vmovdqa %ymm15, 320(%r12) |
4643 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
4644 | vmovdqa %ymm15, 512(%r12) |
4645 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
4646 | vmovdqa %ymm15, 704(%r12) |
4647 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
4648 | vmovdqa %ymm15, 896(%r12) |
4649 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
4650 | vmovdqa %ymm15, 1088(%r12) |
4651 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
4652 | vmovdqa %ymm15, 1280(%r12) |
4653 | vpermq $78, %ymm4, %ymm4 |
4654 | vpermq $78, %ymm5, %ymm5 |
4655 | vpermq $78, %ymm6, %ymm6 |
4656 | vpermq $78, %ymm7, %ymm7 |
4657 | vpermq $78, %ymm8, %ymm8 |
4658 | vpermq $78, %ymm9, %ymm9 |
4659 | vpermq $78, %ymm10, %ymm10 |
4660 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
4661 | vmovdqa %ymm15, 1664(%r12) |
4662 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
4663 | vmovdqa %ymm15, 1856(%r12) |
4664 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
4665 | vmovdqa %ymm15, 2048(%r12) |
4666 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
4667 | vmovdqa %ymm15, 2240(%r12) |
4668 | vinserti128 $0, %xmm8, %ymm12, %ymm15 |
4669 | vmovdqa %ymm15, 2432(%r12) |
4670 | vinserti128 $0, %xmm9, %ymm2, %ymm15 |
4671 | vmovdqa %ymm15, 2624(%r12) |
4672 | vinserti128 $0, %xmm10, %ymm14, %ymm15 |
4673 | vmovdqa %ymm15, 2816(%r12) |
4674 | vmovdqa 0(%rsp), %ymm11 |
4675 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
4676 | vmovdqa %ymm14, 1472(%r12) |
4677 | vpermq $78, %ymm11, %ymm11 |
4678 | vinserti128 $0, %xmm11, %ymm1, %ymm1 |
4679 | vmovdqa %ymm1, 3008(%r12) |
4680 | vmovdqa 5248(%r10), %ymm0 |
4681 | vmovdqa 5312(%r10), %ymm1 |
4682 | vmovdqa 5376(%r10), %ymm2 |
4683 | vmovdqa 5440(%r10), %ymm3 |
4684 | vpunpcklwd 5280(%r10), %ymm0, %ymm4 |
4685 | vpunpckhwd 5280(%r10), %ymm0, %ymm5 |
4686 | vpunpcklwd 5344(%r10), %ymm1, %ymm6 |
4687 | vpunpckhwd 5344(%r10), %ymm1, %ymm7 |
4688 | vpunpcklwd 5408(%r10), %ymm2, %ymm8 |
4689 | vpunpckhwd 5408(%r10), %ymm2, %ymm9 |
4690 | vpunpcklwd 5472(%r10), %ymm3, %ymm10 |
4691 | vpunpckhwd 5472(%r10), %ymm3, %ymm11 |
4692 | vpunpckldq %ymm6, %ymm4, %ymm0 |
4693 | vpunpckhdq %ymm6, %ymm4, %ymm1 |
4694 | vpunpckldq %ymm7, %ymm5, %ymm2 |
4695 | vpunpckhdq %ymm7, %ymm5, %ymm3 |
4696 | vpunpckldq %ymm10, %ymm8, %ymm12 |
4697 | vpunpckhdq %ymm10, %ymm8, %ymm13 |
4698 | vpunpckldq %ymm11, %ymm9, %ymm14 |
4699 | vpunpckhdq %ymm11, %ymm9, %ymm15 |
4700 | vpunpcklqdq %ymm12, %ymm0, %ymm4 |
4701 | vpunpckhqdq %ymm12, %ymm0, %ymm5 |
4702 | vpunpcklqdq %ymm13, %ymm1, %ymm6 |
4703 | vpunpckhqdq %ymm13, %ymm1, %ymm7 |
4704 | vpunpcklqdq %ymm14, %ymm2, %ymm8 |
4705 | vpunpckhqdq %ymm14, %ymm2, %ymm9 |
4706 | vpunpcklqdq %ymm15, %ymm3, %ymm10 |
4707 | vpunpckhqdq %ymm15, %ymm3, %ymm11 |
4708 | vmovdqa 5504(%r10), %ymm0 |
4709 | vmovdqa 5568(%r10), %ymm1 |
4710 | vmovdqa 5632(%r10), %ymm2 |
4711 | vmovdqa 5696(%r10), %ymm3 |
4712 | vpunpcklwd 5536(%r10), %ymm0, %ymm12 |
4713 | vpunpckhwd 5536(%r10), %ymm0, %ymm13 |
4714 | vpunpcklwd 5600(%r10), %ymm1, %ymm14 |
4715 | vpunpckhwd 5600(%r10), %ymm1, %ymm15 |
4716 | vpunpcklwd 5664(%r10), %ymm2, %ymm0 |
4717 | vpunpckhwd 5664(%r10), %ymm2, %ymm1 |
4718 | vpunpcklwd 5728(%r10), %ymm3, %ymm2 |
4719 | vpunpckhwd 5728(%r10), %ymm3, %ymm3 |
4720 | vmovdqa %ymm11, 0(%rsp) |
4721 | vpunpckldq %ymm14, %ymm12, %ymm11 |
4722 | vpunpckhdq %ymm14, %ymm12, %ymm12 |
4723 | vpunpckldq %ymm15, %ymm13, %ymm14 |
4724 | vpunpckhdq %ymm15, %ymm13, %ymm15 |
4725 | vpunpckldq %ymm2, %ymm0, %ymm13 |
4726 | vpunpckhdq %ymm2, %ymm0, %ymm0 |
4727 | vpunpckldq %ymm3, %ymm1, %ymm2 |
4728 | vpunpckhdq %ymm3, %ymm1, %ymm1 |
4729 | vpunpcklqdq %ymm13, %ymm11, %ymm3 |
4730 | vpunpckhqdq %ymm13, %ymm11, %ymm13 |
4731 | vpunpcklqdq %ymm0, %ymm12, %ymm11 |
4732 | vpunpckhqdq %ymm0, %ymm12, %ymm0 |
4733 | vpunpcklqdq %ymm2, %ymm14, %ymm12 |
4734 | vpunpckhqdq %ymm2, %ymm14, %ymm2 |
4735 | vpunpcklqdq %ymm1, %ymm15, %ymm14 |
4736 | vpunpckhqdq %ymm1, %ymm15, %ymm1 |
4737 | vinserti128 $1, %xmm3, %ymm4, %ymm15 |
4738 | vmovdqa %ymm15, 160(%r12) |
4739 | vinserti128 $1, %xmm13, %ymm5, %ymm15 |
4740 | vmovdqa %ymm15, 352(%r12) |
4741 | vinserti128 $1, %xmm11, %ymm6, %ymm15 |
4742 | vmovdqa %ymm15, 544(%r12) |
4743 | vinserti128 $1, %xmm0, %ymm7, %ymm15 |
4744 | vmovdqa %ymm15, 736(%r12) |
4745 | vinserti128 $1, %xmm12, %ymm8, %ymm15 |
4746 | vmovdqa %ymm15, 928(%r12) |
4747 | vinserti128 $1, %xmm2, %ymm9, %ymm15 |
4748 | vmovdqa %ymm15, 1120(%r12) |
4749 | vinserti128 $1, %xmm14, %ymm10, %ymm15 |
4750 | vmovdqa %ymm15, 1312(%r12) |
4751 | vpermq $78, %ymm4, %ymm4 |
4752 | vpermq $78, %ymm5, %ymm5 |
4753 | vpermq $78, %ymm6, %ymm6 |
4754 | vpermq $78, %ymm7, %ymm7 |
4755 | vpermq $78, %ymm8, %ymm8 |
4756 | vpermq $78, %ymm9, %ymm9 |
4757 | vpermq $78, %ymm10, %ymm10 |
4758 | vinserti128 $0, %xmm4, %ymm3, %ymm15 |
4759 | vmovdqa %ymm15, 1696(%r12) |
4760 | vinserti128 $0, %xmm5, %ymm13, %ymm15 |
4761 | vmovdqa %ymm15, 1888(%r12) |
4762 | vinserti128 $0, %xmm6, %ymm11, %ymm15 |
4763 | vmovdqa %ymm15, 2080(%r12) |
4764 | vinserti128 $0, %xmm7, %ymm0, %ymm15 |
4765 | vmovdqa %ymm15, 2272(%r12) |
4766 | vinserti128 $0, %xmm8, %ymm12, %ymm15 |
4767 | vmovdqa %ymm15, 2464(%r12) |
4768 | vinserti128 $0, %xmm9, %ymm2, %ymm15 |
4769 | vmovdqa %ymm15, 2656(%r12) |
4770 | vinserti128 $0, %xmm10, %ymm14, %ymm15 |
4771 | vmovdqa %ymm15, 2848(%r12) |
4772 | vmovdqa 0(%rsp), %ymm11 |
4773 | vinserti128 $1, %xmm1, %ymm11, %ymm14 |
4774 | vmovdqa %ymm14, 1504(%r12) |
4775 | vpermq $78, %ymm11, %ymm11 |
4776 | vinserti128 $0, %xmm11, %ymm1, %ymm1 |
4777 | vmovdqa %ymm1, 3040(%r12) |
4778 | addq $32, %rsp |
4779 | add $1536, %rax |
4780 | add $1536, %r11 |
4781 | add $3072, %r12 |
4782 | dec %ecx |
4783 | jnz karatsuba_loop_4eced63f144beffcb0247f9c6f67d165 |
4784 | sub $12288, %r12 |
4785 | add $9408, %rsp |
4786 | subq $2400, %rsp |
4787 | vpxor %ymm0, %ymm0, %ymm0 |
4788 | vmovdqa %ymm0, 1792(%rsp) |
4789 | vmovdqa %ymm0, 1824(%rsp) |
4790 | vmovdqa %ymm0, 1856(%rsp) |
4791 | vmovdqa %ymm0, 1888(%rsp) |
4792 | vmovdqa %ymm0, 1920(%rsp) |
4793 | vmovdqa %ymm0, 1952(%rsp) |
4794 | vmovdqa %ymm0, 1984(%rsp) |
4795 | vmovdqa %ymm0, 2016(%rsp) |
4796 | vmovdqa %ymm0, 2048(%rsp) |
4797 | vmovdqa %ymm0, 2080(%rsp) |
4798 | vmovdqa %ymm0, 2112(%rsp) |
4799 | vmovdqa %ymm0, 2144(%rsp) |
4800 | vmovdqa %ymm0, 2176(%rsp) |
4801 | vmovdqa %ymm0, 2208(%rsp) |
4802 | vmovdqa %ymm0, 2240(%rsp) |
4803 | vmovdqa %ymm0, 2272(%rsp) |
4804 | vmovdqa %ymm0, 2304(%rsp) |
4805 | vmovdqa %ymm0, 2336(%rsp) |
4806 | vmovdqa %ymm0, 2368(%rsp) |
4807 | vmovdqa %ymm0, 2400(%rsp) |
4808 | vmovdqa %ymm0, 2432(%rsp) |
4809 | vmovdqa %ymm0, 2464(%rsp) |
4810 | vmovdqa %ymm0, 2496(%rsp) |
4811 | vmovdqa %ymm0, 2528(%rsp) |
4812 | vmovdqa %ymm0, 2560(%rsp) |
4813 | vmovdqa %ymm0, 2592(%rsp) |
4814 | vmovdqa %ymm0, 2624(%rsp) |
4815 | vmovdqa %ymm0, 2656(%rsp) |
4816 | vmovdqa %ymm0, 2688(%rsp) |
4817 | vmovdqa %ymm0, 2720(%rsp) |
4818 | vmovdqa %ymm0, 2752(%rsp) |
4819 | vmovdqa %ymm0, 2784(%rsp) |
4820 | vmovdqa const729(%rip), %ymm15 |
4821 | vmovdqa const3_inv(%rip), %ymm14 |
4822 | vmovdqa const5_inv(%rip), %ymm13 |
4823 | vmovdqa const9(%rip), %ymm12 |
4824 | vmovdqa 96(%r12), %ymm0 |
4825 | vpsubw 192(%r12), %ymm0, %ymm0 |
4826 | vmovdqa 480(%r12), %ymm1 |
4827 | vpsubw %ymm0, %ymm1, %ymm1 |
4828 | vpsubw 288(%r12), %ymm1, %ymm1 |
4829 | vpsubw 0(%r12), %ymm0, %ymm0 |
4830 | vpaddw 384(%r12), %ymm0, %ymm0 |
4831 | vmovdqa 672(%r12), %ymm2 |
4832 | vpsubw 768(%r12), %ymm2, %ymm2 |
4833 | vmovdqa 1056(%r12), %ymm3 |
4834 | vpsubw %ymm2, %ymm3, %ymm3 |
4835 | vpsubw 864(%r12), %ymm3, %ymm3 |
4836 | vpsubw 576(%r12), %ymm2, %ymm2 |
4837 | vpaddw 960(%r12), %ymm2, %ymm2 |
4838 | vmovdqa 1248(%r12), %ymm4 |
4839 | vpsubw 1344(%r12), %ymm4, %ymm4 |
4840 | vmovdqa 1632(%r12), %ymm5 |
4841 | vpsubw %ymm4, %ymm5, %ymm5 |
4842 | vpsubw 1440(%r12), %ymm5, %ymm5 |
4843 | vpsubw 1152(%r12), %ymm4, %ymm4 |
4844 | vpaddw 1536(%r12), %ymm4, %ymm4 |
4845 | vpsubw 576(%r12), %ymm1, %ymm1 |
4846 | vpsubw %ymm1, %ymm5, %ymm5 |
4847 | vpsubw %ymm3, %ymm5, %ymm5 |
4848 | vpsubw 0(%r12), %ymm1, %ymm1 |
4849 | vpaddw 1152(%r12), %ymm1, %ymm1 |
4850 | vmovdqa 288(%r12), %ymm6 |
4851 | vpsubw %ymm2, %ymm6, %ymm7 |
4852 | vmovdqa 1440(%r12), %ymm2 |
4853 | vpsubw %ymm7, %ymm2, %ymm2 |
4854 | vpsubw 864(%r12), %ymm2, %ymm2 |
4855 | vpsubw %ymm0, %ymm7, %ymm7 |
4856 | vpaddw %ymm4, %ymm7, %ymm7 |
4857 | vmovdqa 0(%r12), %ymm8 |
4858 | vmovdqa 864(%r12), %ymm9 |
4859 | vmovdqa %ymm8, 0(%rsp) |
4860 | vmovdqa %ymm0, 32(%rsp) |
4861 | vmovdqa %ymm1, 64(%rsp) |
4862 | vmovdqa %ymm7, 96(%rsp) |
4863 | vmovdqa %ymm5, 128(%rsp) |
4864 | vmovdqa %ymm2, 160(%rsp) |
4865 | vmovdqa %ymm3, 192(%rsp) |
4866 | vmovdqa %ymm9, 224(%rsp) |
4867 | vmovdqa 1824(%r12), %ymm0 |
4868 | vpsubw 1920(%r12), %ymm0, %ymm0 |
4869 | vmovdqa 2208(%r12), %ymm1 |
4870 | vpsubw %ymm0, %ymm1, %ymm1 |
4871 | vpsubw 2016(%r12), %ymm1, %ymm1 |
4872 | vpsubw 1728(%r12), %ymm0, %ymm0 |
4873 | vpaddw 2112(%r12), %ymm0, %ymm0 |
4874 | vmovdqa 2400(%r12), %ymm2 |
4875 | vpsubw 2496(%r12), %ymm2, %ymm2 |
4876 | vmovdqa 2784(%r12), %ymm3 |
4877 | vpsubw %ymm2, %ymm3, %ymm3 |
4878 | vpsubw 2592(%r12), %ymm3, %ymm3 |
4879 | vpsubw 2304(%r12), %ymm2, %ymm2 |
4880 | vpaddw 2688(%r12), %ymm2, %ymm2 |
4881 | vmovdqa 2976(%r12), %ymm4 |
4882 | vpsubw 3072(%r12), %ymm4, %ymm4 |
4883 | vmovdqa 3360(%r12), %ymm5 |
4884 | vpsubw %ymm4, %ymm5, %ymm5 |
4885 | vpsubw 3168(%r12), %ymm5, %ymm5 |
4886 | vpsubw 2880(%r12), %ymm4, %ymm4 |
4887 | vpaddw 3264(%r12), %ymm4, %ymm4 |
4888 | vpsubw 2304(%r12), %ymm1, %ymm1 |
4889 | vpsubw %ymm1, %ymm5, %ymm5 |
4890 | vpsubw %ymm3, %ymm5, %ymm5 |
4891 | vpsubw 1728(%r12), %ymm1, %ymm1 |
4892 | vpaddw 2880(%r12), %ymm1, %ymm1 |
4893 | vmovdqa 2016(%r12), %ymm6 |
4894 | vpsubw %ymm2, %ymm6, %ymm7 |
4895 | vmovdqa 3168(%r12), %ymm2 |
4896 | vpsubw %ymm7, %ymm2, %ymm2 |
4897 | vpsubw 2592(%r12), %ymm2, %ymm2 |
4898 | vpsubw %ymm0, %ymm7, %ymm7 |
4899 | vpaddw %ymm4, %ymm7, %ymm7 |
4900 | vmovdqa 1728(%r12), %ymm8 |
4901 | vmovdqa 2592(%r12), %ymm9 |
4902 | vmovdqa %ymm8, 256(%rsp) |
4903 | vmovdqa %ymm0, 288(%rsp) |
4904 | vmovdqa %ymm1, 320(%rsp) |
4905 | vmovdqa %ymm7, 352(%rsp) |
4906 | vmovdqa %ymm5, 384(%rsp) |
4907 | vmovdqa %ymm2, 416(%rsp) |
4908 | vmovdqa %ymm3, 448(%rsp) |
4909 | vmovdqa %ymm9, 480(%rsp) |
4910 | vmovdqa 3552(%r12), %ymm0 |
4911 | vpsubw 3648(%r12), %ymm0, %ymm0 |
4912 | vmovdqa 3936(%r12), %ymm1 |
4913 | vpsubw %ymm0, %ymm1, %ymm1 |
4914 | vpsubw 3744(%r12), %ymm1, %ymm1 |
4915 | vpsubw 3456(%r12), %ymm0, %ymm0 |
4916 | vpaddw 3840(%r12), %ymm0, %ymm0 |
4917 | vmovdqa 4128(%r12), %ymm2 |
4918 | vpsubw 4224(%r12), %ymm2, %ymm2 |
4919 | vmovdqa 4512(%r12), %ymm3 |
4920 | vpsubw %ymm2, %ymm3, %ymm3 |
4921 | vpsubw 4320(%r12), %ymm3, %ymm3 |
4922 | vpsubw 4032(%r12), %ymm2, %ymm2 |
4923 | vpaddw 4416(%r12), %ymm2, %ymm2 |
4924 | vmovdqa 4704(%r12), %ymm4 |
4925 | vpsubw 4800(%r12), %ymm4, %ymm4 |
4926 | vmovdqa 5088(%r12), %ymm5 |
4927 | vpsubw %ymm4, %ymm5, %ymm5 |
4928 | vpsubw 4896(%r12), %ymm5, %ymm5 |
4929 | vpsubw 4608(%r12), %ymm4, %ymm4 |
4930 | vpaddw 4992(%r12), %ymm4, %ymm4 |
4931 | vpsubw 4032(%r12), %ymm1, %ymm1 |
4932 | vpsubw %ymm1, %ymm5, %ymm5 |
4933 | vpsubw %ymm3, %ymm5, %ymm5 |
4934 | vpsubw 3456(%r12), %ymm1, %ymm1 |
4935 | vpaddw 4608(%r12), %ymm1, %ymm1 |
4936 | vmovdqa 3744(%r12), %ymm6 |
4937 | vpsubw %ymm2, %ymm6, %ymm7 |
4938 | vmovdqa 4896(%r12), %ymm2 |
4939 | vpsubw %ymm7, %ymm2, %ymm2 |
4940 | vpsubw 4320(%r12), %ymm2, %ymm2 |
4941 | vpsubw %ymm0, %ymm7, %ymm7 |
4942 | vpaddw %ymm4, %ymm7, %ymm7 |
4943 | vmovdqa 3456(%r12), %ymm8 |
4944 | vmovdqa 4320(%r12), %ymm9 |
4945 | vmovdqa %ymm8, 512(%rsp) |
4946 | vmovdqa %ymm0, 544(%rsp) |
4947 | vmovdqa %ymm1, 576(%rsp) |
4948 | vmovdqa %ymm7, 608(%rsp) |
4949 | vmovdqa %ymm5, 640(%rsp) |
4950 | vmovdqa %ymm2, 672(%rsp) |
4951 | vmovdqa %ymm3, 704(%rsp) |
4952 | vmovdqa %ymm9, 736(%rsp) |
4953 | vmovdqa 5280(%r12), %ymm0 |
4954 | vpsubw 5376(%r12), %ymm0, %ymm0 |
4955 | vmovdqa 5664(%r12), %ymm1 |
4956 | vpsubw %ymm0, %ymm1, %ymm1 |
4957 | vpsubw 5472(%r12), %ymm1, %ymm1 |
4958 | vpsubw 5184(%r12), %ymm0, %ymm0 |
4959 | vpaddw 5568(%r12), %ymm0, %ymm0 |
4960 | vmovdqa 5856(%r12), %ymm2 |
4961 | vpsubw 5952(%r12), %ymm2, %ymm2 |
4962 | vmovdqa 6240(%r12), %ymm3 |
4963 | vpsubw %ymm2, %ymm3, %ymm3 |
4964 | vpsubw 6048(%r12), %ymm3, %ymm3 |
4965 | vpsubw 5760(%r12), %ymm2, %ymm2 |
4966 | vpaddw 6144(%r12), %ymm2, %ymm2 |
4967 | vmovdqa 6432(%r12), %ymm4 |
4968 | vpsubw 6528(%r12), %ymm4, %ymm4 |
4969 | vmovdqa 6816(%r12), %ymm5 |
4970 | vpsubw %ymm4, %ymm5, %ymm5 |
4971 | vpsubw 6624(%r12), %ymm5, %ymm5 |
4972 | vpsubw 6336(%r12), %ymm4, %ymm4 |
4973 | vpaddw 6720(%r12), %ymm4, %ymm4 |
4974 | vpsubw 5760(%r12), %ymm1, %ymm1 |
4975 | vpsubw %ymm1, %ymm5, %ymm5 |
4976 | vpsubw %ymm3, %ymm5, %ymm5 |
4977 | vpsubw 5184(%r12), %ymm1, %ymm1 |
4978 | vpaddw 6336(%r12), %ymm1, %ymm1 |
4979 | vmovdqa 5472(%r12), %ymm6 |
4980 | vpsubw %ymm2, %ymm6, %ymm7 |
4981 | vmovdqa 6624(%r12), %ymm2 |
4982 | vpsubw %ymm7, %ymm2, %ymm2 |
4983 | vpsubw 6048(%r12), %ymm2, %ymm2 |
4984 | vpsubw %ymm0, %ymm7, %ymm7 |
4985 | vpaddw %ymm4, %ymm7, %ymm7 |
4986 | vmovdqa 5184(%r12), %ymm8 |
4987 | vmovdqa 6048(%r12), %ymm9 |
4988 | vmovdqa %ymm8, 768(%rsp) |
4989 | vmovdqa %ymm0, 800(%rsp) |
4990 | vmovdqa %ymm1, 832(%rsp) |
4991 | vmovdqa %ymm7, 864(%rsp) |
4992 | vmovdqa %ymm5, 896(%rsp) |
4993 | vmovdqa %ymm2, 928(%rsp) |
4994 | vmovdqa %ymm3, 960(%rsp) |
4995 | vmovdqa %ymm9, 992(%rsp) |
4996 | vmovdqa 7008(%r12), %ymm0 |
4997 | vpsubw 7104(%r12), %ymm0, %ymm0 |
4998 | vmovdqa 7392(%r12), %ymm1 |
4999 | vpsubw %ymm0, %ymm1, %ymm1 |
5000 | vpsubw 7200(%r12), %ymm1, %ymm1 |
5001 | vpsubw 6912(%r12), %ymm0, %ymm0 |
5002 | vpaddw 7296(%r12), %ymm0, %ymm0 |
5003 | vmovdqa 7584(%r12), %ymm2 |
5004 | vpsubw 7680(%r12), %ymm2, %ymm2 |
5005 | vmovdqa 7968(%r12), %ymm3 |
5006 | vpsubw %ymm2, %ymm3, %ymm3 |
5007 | vpsubw 7776(%r12), %ymm3, %ymm3 |
5008 | vpsubw 7488(%r12), %ymm2, %ymm2 |
5009 | vpaddw 7872(%r12), %ymm2, %ymm2 |
5010 | vmovdqa 8160(%r12), %ymm4 |
5011 | vpsubw 8256(%r12), %ymm4, %ymm4 |
5012 | vmovdqa 8544(%r12), %ymm5 |
5013 | vpsubw %ymm4, %ymm5, %ymm5 |
5014 | vpsubw 8352(%r12), %ymm5, %ymm5 |
5015 | vpsubw 8064(%r12), %ymm4, %ymm4 |
5016 | vpaddw 8448(%r12), %ymm4, %ymm4 |
5017 | vpsubw 7488(%r12), %ymm1, %ymm1 |
5018 | vpsubw %ymm1, %ymm5, %ymm5 |
5019 | vpsubw %ymm3, %ymm5, %ymm5 |
5020 | vpsubw 6912(%r12), %ymm1, %ymm1 |
5021 | vpaddw 8064(%r12), %ymm1, %ymm1 |
5022 | vmovdqa 7200(%r12), %ymm6 |
5023 | vpsubw %ymm2, %ymm6, %ymm7 |
5024 | vmovdqa 8352(%r12), %ymm2 |
5025 | vpsubw %ymm7, %ymm2, %ymm2 |
5026 | vpsubw 7776(%r12), %ymm2, %ymm2 |
5027 | vpsubw %ymm0, %ymm7, %ymm7 |
5028 | vpaddw %ymm4, %ymm7, %ymm7 |
5029 | vmovdqa 6912(%r12), %ymm8 |
5030 | vmovdqa 7776(%r12), %ymm9 |
5031 | vmovdqa %ymm8, 1024(%rsp) |
5032 | vmovdqa %ymm0, 1056(%rsp) |
5033 | vmovdqa %ymm1, 1088(%rsp) |
5034 | vmovdqa %ymm7, 1120(%rsp) |
5035 | vmovdqa %ymm5, 1152(%rsp) |
5036 | vmovdqa %ymm2, 1184(%rsp) |
5037 | vmovdqa %ymm3, 1216(%rsp) |
5038 | vmovdqa %ymm9, 1248(%rsp) |
5039 | vmovdqa 8736(%r12), %ymm0 |
5040 | vpsubw 8832(%r12), %ymm0, %ymm0 |
5041 | vmovdqa 9120(%r12), %ymm1 |
5042 | vpsubw %ymm0, %ymm1, %ymm1 |
5043 | vpsubw 8928(%r12), %ymm1, %ymm1 |
5044 | vpsubw 8640(%r12), %ymm0, %ymm0 |
5045 | vpaddw 9024(%r12), %ymm0, %ymm0 |
5046 | vmovdqa 9312(%r12), %ymm2 |
5047 | vpsubw 9408(%r12), %ymm2, %ymm2 |
5048 | vmovdqa 9696(%r12), %ymm3 |
5049 | vpsubw %ymm2, %ymm3, %ymm3 |
5050 | vpsubw 9504(%r12), %ymm3, %ymm3 |
5051 | vpsubw 9216(%r12), %ymm2, %ymm2 |
5052 | vpaddw 9600(%r12), %ymm2, %ymm2 |
5053 | vmovdqa 9888(%r12), %ymm4 |
5054 | vpsubw 9984(%r12), %ymm4, %ymm4 |
5055 | vmovdqa 10272(%r12), %ymm5 |
5056 | vpsubw %ymm4, %ymm5, %ymm5 |
5057 | vpsubw 10080(%r12), %ymm5, %ymm5 |
5058 | vpsubw 9792(%r12), %ymm4, %ymm4 |
5059 | vpaddw 10176(%r12), %ymm4, %ymm4 |
5060 | vpsubw 9216(%r12), %ymm1, %ymm1 |
5061 | vpsubw %ymm1, %ymm5, %ymm5 |
5062 | vpsubw %ymm3, %ymm5, %ymm5 |
5063 | vpsubw 8640(%r12), %ymm1, %ymm1 |
5064 | vpaddw 9792(%r12), %ymm1, %ymm1 |
5065 | vmovdqa 8928(%r12), %ymm6 |
5066 | vpsubw %ymm2, %ymm6, %ymm7 |
5067 | vmovdqa 10080(%r12), %ymm2 |
5068 | vpsubw %ymm7, %ymm2, %ymm2 |
5069 | vpsubw 9504(%r12), %ymm2, %ymm2 |
5070 | vpsubw %ymm0, %ymm7, %ymm7 |
5071 | vpaddw %ymm4, %ymm7, %ymm7 |
5072 | vmovdqa 8640(%r12), %ymm8 |
5073 | vmovdqa 9504(%r12), %ymm9 |
5074 | vmovdqa %ymm8, 1280(%rsp) |
5075 | vmovdqa %ymm0, 1312(%rsp) |
5076 | vmovdqa %ymm1, 1344(%rsp) |
5077 | vmovdqa %ymm7, 1376(%rsp) |
5078 | vmovdqa %ymm5, 1408(%rsp) |
5079 | vmovdqa %ymm2, 1440(%rsp) |
5080 | vmovdqa %ymm3, 1472(%rsp) |
5081 | vmovdqa %ymm9, 1504(%rsp) |
5082 | vmovdqa 10464(%r12), %ymm0 |
5083 | vpsubw 10560(%r12), %ymm0, %ymm0 |
5084 | vmovdqa 10848(%r12), %ymm1 |
5085 | vpsubw %ymm0, %ymm1, %ymm1 |
5086 | vpsubw 10656(%r12), %ymm1, %ymm1 |
5087 | vpsubw 10368(%r12), %ymm0, %ymm0 |
5088 | vpaddw 10752(%r12), %ymm0, %ymm0 |
5089 | vmovdqa 11040(%r12), %ymm2 |
5090 | vpsubw 11136(%r12), %ymm2, %ymm2 |
5091 | vmovdqa 11424(%r12), %ymm3 |
5092 | vpsubw %ymm2, %ymm3, %ymm3 |
5093 | vpsubw 11232(%r12), %ymm3, %ymm3 |
5094 | vpsubw 10944(%r12), %ymm2, %ymm2 |
5095 | vpaddw 11328(%r12), %ymm2, %ymm2 |
5096 | vmovdqa 11616(%r12), %ymm4 |
5097 | vpsubw 11712(%r12), %ymm4, %ymm4 |
5098 | vmovdqa 12000(%r12), %ymm5 |
5099 | vpsubw %ymm4, %ymm5, %ymm5 |
5100 | vpsubw 11808(%r12), %ymm5, %ymm5 |
5101 | vpsubw 11520(%r12), %ymm4, %ymm4 |
5102 | vpaddw 11904(%r12), %ymm4, %ymm4 |
5103 | vpsubw 10944(%r12), %ymm1, %ymm1 |
5104 | vpsubw %ymm1, %ymm5, %ymm5 |
5105 | vpsubw %ymm3, %ymm5, %ymm5 |
5106 | vpsubw 10368(%r12), %ymm1, %ymm1 |
5107 | vpaddw 11520(%r12), %ymm1, %ymm1 |
5108 | vmovdqa 10656(%r12), %ymm6 |
5109 | vpsubw %ymm2, %ymm6, %ymm7 |
5110 | vmovdqa 11808(%r12), %ymm2 |
5111 | vpsubw %ymm7, %ymm2, %ymm2 |
5112 | vpsubw 11232(%r12), %ymm2, %ymm2 |
5113 | vpsubw %ymm0, %ymm7, %ymm7 |
5114 | vpaddw %ymm4, %ymm7, %ymm7 |
5115 | vmovdqa 10368(%r12), %ymm8 |
5116 | vmovdqa 11232(%r12), %ymm9 |
5117 | vmovdqa %ymm8, 1536(%rsp) |
5118 | vmovdqa %ymm0, 1568(%rsp) |
5119 | vmovdqa %ymm1, 1600(%rsp) |
5120 | vmovdqa %ymm7, 1632(%rsp) |
5121 | vmovdqa %ymm5, 1664(%rsp) |
5122 | vmovdqa %ymm2, 1696(%rsp) |
5123 | vmovdqa %ymm3, 1728(%rsp) |
5124 | vmovdqa %ymm9, 1760(%rsp) |
5125 | vmovdqa 0(%rsp), %ymm11 |
5126 | vpunpcklwd const0(%rip), %ymm11, %ymm10 |
5127 | vpunpckhwd const0(%rip), %ymm11, %ymm9 |
5128 | vpslld $1, %ymm10, %ymm10 |
5129 | vpslld $1, %ymm9, %ymm9 |
5130 | vmovdqa 256(%rsp), %ymm8 |
5131 | vpunpcklwd const0(%rip), %ymm8, %ymm7 |
5132 | vpunpckhwd const0(%rip), %ymm8, %ymm8 |
5133 | vmovdqa 512(%rsp), %ymm6 |
5134 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
5135 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
5136 | vpaddd %ymm5, %ymm7, %ymm4 |
5137 | vpaddd %ymm6, %ymm8, %ymm3 |
5138 | vpsubd %ymm10, %ymm4, %ymm4 |
5139 | vpsubd %ymm9, %ymm3, %ymm3 |
5140 | vpsubd %ymm5, %ymm7, %ymm5 |
5141 | vpsubd %ymm6, %ymm8, %ymm6 |
5142 | vpsrld $1, %ymm5, %ymm5 |
5143 | vpsrld $1, %ymm6, %ymm6 |
5144 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
5145 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
5146 | vpackusdw %ymm6, %ymm5, %ymm6 |
5147 | vmovdqa 1536(%rsp), %ymm5 |
5148 | vpunpcklwd const0(%rip), %ymm5, %ymm8 |
5149 | vpunpckhwd const0(%rip), %ymm5, %ymm7 |
5150 | vpslld $1, %ymm8, %ymm8 |
5151 | vpslld $1, %ymm7, %ymm7 |
5152 | vpsubd %ymm8, %ymm4, %ymm4 |
5153 | vpsubd %ymm7, %ymm3, %ymm3 |
5154 | vpsrld $1, %ymm4, %ymm4 |
5155 | vpsrld $1, %ymm3, %ymm3 |
5156 | vpand mask32_to_16(%rip), %ymm4, %ymm4 |
5157 | vpand mask32_to_16(%rip), %ymm3, %ymm3 |
5158 | vpackusdw %ymm3, %ymm4, %ymm3 |
5159 | vmovdqa 768(%rsp), %ymm4 |
5160 | vpaddw 1024(%rsp), %ymm4, %ymm7 |
5161 | vpsubw 1024(%rsp), %ymm4, %ymm4 |
5162 | vpsrlw $2, %ymm4, %ymm4 |
5163 | vpsubw %ymm6, %ymm4, %ymm4 |
5164 | vpmullw %ymm14, %ymm4, %ymm4 |
5165 | vpsllw $1, %ymm11, %ymm8 |
5166 | vpsubw %ymm8, %ymm7, %ymm8 |
5167 | vpsllw $7, %ymm5, %ymm7 |
5168 | vpsubw %ymm7, %ymm8, %ymm7 |
5169 | vpsrlw $3, %ymm7, %ymm7 |
5170 | vpsubw %ymm3, %ymm7, %ymm7 |
5171 | vmovdqa 1280(%rsp), %ymm8 |
5172 | vpsubw %ymm11, %ymm8, %ymm8 |
5173 | vpmullw %ymm15, %ymm5, %ymm9 |
5174 | vpsubw %ymm9, %ymm8, %ymm9 |
5175 | vpmullw %ymm14, %ymm7, %ymm7 |
5176 | vpsubw %ymm7, %ymm3, %ymm3 |
5177 | vpmullw %ymm12, %ymm7, %ymm8 |
5178 | vpaddw %ymm8, %ymm3, %ymm8 |
5179 | vpmullw %ymm12, %ymm8, %ymm8 |
5180 | vpsubw %ymm8, %ymm9, %ymm8 |
5181 | vpmullw %ymm14, %ymm8, %ymm8 |
5182 | vpsubw %ymm6, %ymm8, %ymm8 |
5183 | vpsrlw $3, %ymm8, %ymm8 |
5184 | vpsubw %ymm4, %ymm8, %ymm8 |
5185 | vpsubw %ymm8, %ymm4, %ymm4 |
5186 | vpsubw %ymm4, %ymm6, %ymm6 |
5187 | vpmullw %ymm13, %ymm8, %ymm8 |
5188 | vpsubw %ymm8, %ymm6, %ymm6 |
5189 | vpshufb shuf48_16(%rip), %ymm7, %ymm7 |
5190 | vpand mask3_5_3_5(%rip), %ymm7, %ymm9 |
5191 | vpand mask5_3_5_3(%rip), %ymm7, %ymm7 |
5192 | vpermq $206, %ymm9, %ymm9 |
5193 | vpand mask_keephigh(%rip), %ymm9, %ymm10 |
5194 | vpor %ymm10, %ymm7, %ymm7 |
5195 | vpaddw %ymm7, %ymm11, %ymm11 |
5196 | vmovdqa %xmm9, 2048(%rsp) |
5197 | vpshufb shuf48_16(%rip), %ymm8, %ymm8 |
5198 | vpand mask3_5_3_5(%rip), %ymm8, %ymm9 |
5199 | vpand mask5_3_5_3(%rip), %ymm8, %ymm8 |
5200 | vpermq $206, %ymm9, %ymm9 |
5201 | vpand mask_keephigh(%rip), %ymm9, %ymm10 |
5202 | vpor %ymm10, %ymm8, %ymm8 |
5203 | vpaddw %ymm8, %ymm6, %ymm6 |
5204 | vmovdqa %xmm9, 2304(%rsp) |
5205 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
5206 | vpand mask3_5_3_5(%rip), %ymm5, %ymm9 |
5207 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
5208 | vpermq $206, %ymm9, %ymm9 |
5209 | vpand mask_keephigh(%rip), %ymm9, %ymm10 |
5210 | vpor %ymm10, %ymm5, %ymm5 |
5211 | vpaddw %ymm5, %ymm3, %ymm3 |
5212 | vmovdqa %xmm9, 2560(%rsp) |
5213 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
5214 | vmovdqu %ymm11, 0(%rdi) |
5215 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
5216 | vmovdqu %ymm6, 352(%rdi) |
5217 | vpand mask_mod8192(%rip), %ymm3, %ymm3 |
5218 | vmovdqu %ymm3, 704(%rdi) |
5219 | vpand mask_mod8192(%rip), %ymm4, %ymm4 |
5220 | vmovdqu %ymm4, 1056(%rdi) |
5221 | vmovdqa 32(%rsp), %ymm5 |
5222 | vpunpcklwd const0(%rip), %ymm5, %ymm8 |
5223 | vpunpckhwd const0(%rip), %ymm5, %ymm7 |
5224 | vpslld $1, %ymm8, %ymm8 |
5225 | vpslld $1, %ymm7, %ymm7 |
5226 | vmovdqa 288(%rsp), %ymm4 |
5227 | vpunpcklwd const0(%rip), %ymm4, %ymm3 |
5228 | vpunpckhwd const0(%rip), %ymm4, %ymm4 |
5229 | vmovdqa 544(%rsp), %ymm6 |
5230 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
5231 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
5232 | vpaddd %ymm11, %ymm3, %ymm9 |
5233 | vpaddd %ymm6, %ymm4, %ymm10 |
5234 | vpsubd %ymm8, %ymm9, %ymm9 |
5235 | vpsubd %ymm7, %ymm10, %ymm10 |
5236 | vpsubd %ymm11, %ymm3, %ymm11 |
5237 | vpsubd %ymm6, %ymm4, %ymm6 |
5238 | vpsrld $1, %ymm11, %ymm11 |
5239 | vpsrld $1, %ymm6, %ymm6 |
5240 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
5241 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
5242 | vpackusdw %ymm6, %ymm11, %ymm6 |
5243 | vmovdqa 1568(%rsp), %ymm11 |
5244 | vpunpcklwd const0(%rip), %ymm11, %ymm4 |
5245 | vpunpckhwd const0(%rip), %ymm11, %ymm3 |
5246 | vpslld $1, %ymm4, %ymm4 |
5247 | vpslld $1, %ymm3, %ymm3 |
5248 | vpsubd %ymm4, %ymm9, %ymm9 |
5249 | vpsubd %ymm3, %ymm10, %ymm10 |
5250 | vpsrld $1, %ymm9, %ymm9 |
5251 | vpsrld $1, %ymm10, %ymm10 |
5252 | vpand mask32_to_16(%rip), %ymm9, %ymm9 |
5253 | vpand mask32_to_16(%rip), %ymm10, %ymm10 |
5254 | vpackusdw %ymm10, %ymm9, %ymm10 |
5255 | vmovdqa 800(%rsp), %ymm9 |
5256 | vpaddw 1056(%rsp), %ymm9, %ymm3 |
5257 | vpsubw 1056(%rsp), %ymm9, %ymm9 |
5258 | vpsrlw $2, %ymm9, %ymm9 |
5259 | vpsubw %ymm6, %ymm9, %ymm9 |
5260 | vpmullw %ymm14, %ymm9, %ymm9 |
5261 | vpsllw $1, %ymm5, %ymm4 |
5262 | vpsubw %ymm4, %ymm3, %ymm4 |
5263 | vpsllw $7, %ymm11, %ymm3 |
5264 | vpsubw %ymm3, %ymm4, %ymm3 |
5265 | vpsrlw $3, %ymm3, %ymm3 |
5266 | vpsubw %ymm10, %ymm3, %ymm3 |
5267 | vmovdqa 1312(%rsp), %ymm4 |
5268 | vpsubw %ymm5, %ymm4, %ymm4 |
5269 | vpmullw %ymm15, %ymm11, %ymm7 |
5270 | vpsubw %ymm7, %ymm4, %ymm7 |
5271 | vpmullw %ymm14, %ymm3, %ymm3 |
5272 | vpsubw %ymm3, %ymm10, %ymm10 |
5273 | vpmullw %ymm12, %ymm3, %ymm4 |
5274 | vpaddw %ymm4, %ymm10, %ymm4 |
5275 | vpmullw %ymm12, %ymm4, %ymm4 |
5276 | vpsubw %ymm4, %ymm7, %ymm4 |
5277 | vpmullw %ymm14, %ymm4, %ymm4 |
5278 | vpsubw %ymm6, %ymm4, %ymm4 |
5279 | vpsrlw $3, %ymm4, %ymm4 |
5280 | vpsubw %ymm9, %ymm4, %ymm4 |
5281 | vpsubw %ymm4, %ymm9, %ymm9 |
5282 | vpsubw %ymm9, %ymm6, %ymm6 |
5283 | vpmullw %ymm13, %ymm4, %ymm4 |
5284 | vpsubw %ymm4, %ymm6, %ymm6 |
5285 | vpshufb shuf48_16(%rip), %ymm3, %ymm3 |
5286 | vpand mask3_5_3_5(%rip), %ymm3, %ymm7 |
5287 | vpand mask5_3_5_3(%rip), %ymm3, %ymm3 |
5288 | vpermq $206, %ymm7, %ymm7 |
5289 | vpand mask_keephigh(%rip), %ymm7, %ymm8 |
5290 | vpor %ymm8, %ymm3, %ymm3 |
5291 | vpaddw %ymm3, %ymm5, %ymm5 |
5292 | vmovdqa %xmm7, 2080(%rsp) |
5293 | vpshufb shuf48_16(%rip), %ymm4, %ymm4 |
5294 | vpand mask3_5_3_5(%rip), %ymm4, %ymm7 |
5295 | vpand mask5_3_5_3(%rip), %ymm4, %ymm4 |
5296 | vpermq $206, %ymm7, %ymm7 |
5297 | vpand mask_keephigh(%rip), %ymm7, %ymm8 |
5298 | vpor %ymm8, %ymm4, %ymm4 |
5299 | vpaddw %ymm4, %ymm6, %ymm6 |
5300 | vmovdqa %xmm7, 2336(%rsp) |
5301 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
5302 | vpand mask3_5_3_5(%rip), %ymm11, %ymm7 |
5303 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
5304 | vpermq $206, %ymm7, %ymm7 |
5305 | vpand mask_keephigh(%rip), %ymm7, %ymm8 |
5306 | vpor %ymm8, %ymm11, %ymm11 |
5307 | vpaddw %ymm11, %ymm10, %ymm10 |
5308 | vmovdqa %xmm7, 2592(%rsp) |
5309 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
5310 | vmovdqu %ymm5, 88(%rdi) |
5311 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
5312 | vmovdqu %ymm6, 440(%rdi) |
5313 | vpand mask_mod8192(%rip), %ymm10, %ymm10 |
5314 | vmovdqu %ymm10, 792(%rdi) |
5315 | vpand mask_mod8192(%rip), %ymm9, %ymm9 |
5316 | vmovdqu %ymm9, 1144(%rdi) |
5317 | vmovdqa 64(%rsp), %ymm11 |
5318 | vpunpcklwd const0(%rip), %ymm11, %ymm4 |
5319 | vpunpckhwd const0(%rip), %ymm11, %ymm3 |
5320 | vpslld $1, %ymm4, %ymm4 |
5321 | vpslld $1, %ymm3, %ymm3 |
5322 | vmovdqa 320(%rsp), %ymm9 |
5323 | vpunpcklwd const0(%rip), %ymm9, %ymm10 |
5324 | vpunpckhwd const0(%rip), %ymm9, %ymm9 |
5325 | vmovdqa 576(%rsp), %ymm6 |
5326 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
5327 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
5328 | vpaddd %ymm5, %ymm10, %ymm7 |
5329 | vpaddd %ymm6, %ymm9, %ymm8 |
5330 | vpsubd %ymm4, %ymm7, %ymm7 |
5331 | vpsubd %ymm3, %ymm8, %ymm8 |
5332 | vpsubd %ymm5, %ymm10, %ymm5 |
5333 | vpsubd %ymm6, %ymm9, %ymm6 |
5334 | vpsrld $1, %ymm5, %ymm5 |
5335 | vpsrld $1, %ymm6, %ymm6 |
5336 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
5337 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
5338 | vpackusdw %ymm6, %ymm5, %ymm6 |
5339 | vmovdqa 1600(%rsp), %ymm5 |
5340 | vpunpcklwd const0(%rip), %ymm5, %ymm9 |
5341 | vpunpckhwd const0(%rip), %ymm5, %ymm10 |
5342 | vpslld $1, %ymm9, %ymm9 |
5343 | vpslld $1, %ymm10, %ymm10 |
5344 | vpsubd %ymm9, %ymm7, %ymm7 |
5345 | vpsubd %ymm10, %ymm8, %ymm8 |
5346 | vpsrld $1, %ymm7, %ymm7 |
5347 | vpsrld $1, %ymm8, %ymm8 |
5348 | vpand mask32_to_16(%rip), %ymm7, %ymm7 |
5349 | vpand mask32_to_16(%rip), %ymm8, %ymm8 |
5350 | vpackusdw %ymm8, %ymm7, %ymm8 |
5351 | vmovdqa 832(%rsp), %ymm7 |
5352 | vpaddw 1088(%rsp), %ymm7, %ymm10 |
5353 | vpsubw 1088(%rsp), %ymm7, %ymm7 |
5354 | vpsrlw $2, %ymm7, %ymm7 |
5355 | vpsubw %ymm6, %ymm7, %ymm7 |
5356 | vpmullw %ymm14, %ymm7, %ymm7 |
5357 | vpsllw $1, %ymm11, %ymm9 |
5358 | vpsubw %ymm9, %ymm10, %ymm9 |
5359 | vpsllw $7, %ymm5, %ymm10 |
5360 | vpsubw %ymm10, %ymm9, %ymm10 |
5361 | vpsrlw $3, %ymm10, %ymm10 |
5362 | vpsubw %ymm8, %ymm10, %ymm10 |
5363 | vmovdqa 1344(%rsp), %ymm9 |
5364 | vpsubw %ymm11, %ymm9, %ymm9 |
5365 | vpmullw %ymm15, %ymm5, %ymm3 |
5366 | vpsubw %ymm3, %ymm9, %ymm3 |
5367 | vpmullw %ymm14, %ymm10, %ymm10 |
5368 | vpsubw %ymm10, %ymm8, %ymm8 |
5369 | vpmullw %ymm12, %ymm10, %ymm9 |
5370 | vpaddw %ymm9, %ymm8, %ymm9 |
5371 | vpmullw %ymm12, %ymm9, %ymm9 |
5372 | vpsubw %ymm9, %ymm3, %ymm9 |
5373 | vpmullw %ymm14, %ymm9, %ymm9 |
5374 | vpsubw %ymm6, %ymm9, %ymm9 |
5375 | vpsrlw $3, %ymm9, %ymm9 |
5376 | vpsubw %ymm7, %ymm9, %ymm9 |
5377 | vpsubw %ymm9, %ymm7, %ymm7 |
5378 | vpsubw %ymm7, %ymm6, %ymm6 |
5379 | vpmullw %ymm13, %ymm9, %ymm9 |
5380 | vpsubw %ymm9, %ymm6, %ymm6 |
5381 | vpshufb shuf48_16(%rip), %ymm10, %ymm10 |
5382 | vpand mask3_5_3_5(%rip), %ymm10, %ymm3 |
5383 | vpand mask5_3_5_3(%rip), %ymm10, %ymm10 |
5384 | vpermq $206, %ymm3, %ymm3 |
5385 | vpand mask_keephigh(%rip), %ymm3, %ymm4 |
5386 | vpor %ymm4, %ymm10, %ymm10 |
5387 | vpaddw %ymm10, %ymm11, %ymm11 |
5388 | vmovdqa %xmm3, 2112(%rsp) |
5389 | vpshufb shuf48_16(%rip), %ymm9, %ymm9 |
5390 | vpand mask3_5_3_5(%rip), %ymm9, %ymm3 |
5391 | vpand mask5_3_5_3(%rip), %ymm9, %ymm9 |
5392 | vpermq $206, %ymm3, %ymm3 |
5393 | vpand mask_keephigh(%rip), %ymm3, %ymm4 |
5394 | vpor %ymm4, %ymm9, %ymm9 |
5395 | vpaddw %ymm9, %ymm6, %ymm6 |
5396 | vmovdqa %xmm3, 2368(%rsp) |
5397 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
5398 | vpand mask3_5_3_5(%rip), %ymm5, %ymm3 |
5399 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
5400 | vpermq $206, %ymm3, %ymm3 |
5401 | vpand mask_keephigh(%rip), %ymm3, %ymm4 |
5402 | vpor %ymm4, %ymm5, %ymm5 |
5403 | vpaddw %ymm5, %ymm8, %ymm8 |
5404 | vmovdqa %xmm3, 2624(%rsp) |
5405 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
5406 | vmovdqu %ymm11, 176(%rdi) |
5407 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
5408 | vmovdqu %ymm6, 528(%rdi) |
5409 | vpand mask_mod8192(%rip), %ymm8, %ymm8 |
5410 | vmovdqu %ymm8, 880(%rdi) |
5411 | vpand mask_mod8192(%rip), %ymm7, %ymm7 |
5412 | vmovdqu %ymm7, 1232(%rdi) |
5413 | vmovdqa 96(%rsp), %ymm5 |
5414 | vpunpcklwd const0(%rip), %ymm5, %ymm9 |
5415 | vpunpckhwd const0(%rip), %ymm5, %ymm10 |
5416 | vpslld $1, %ymm9, %ymm9 |
5417 | vpslld $1, %ymm10, %ymm10 |
5418 | vmovdqa 352(%rsp), %ymm7 |
5419 | vpunpcklwd const0(%rip), %ymm7, %ymm8 |
5420 | vpunpckhwd const0(%rip), %ymm7, %ymm7 |
5421 | vmovdqa 608(%rsp), %ymm6 |
5422 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
5423 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
5424 | vpaddd %ymm11, %ymm8, %ymm3 |
5425 | vpaddd %ymm6, %ymm7, %ymm4 |
5426 | vpsubd %ymm9, %ymm3, %ymm3 |
5427 | vpsubd %ymm10, %ymm4, %ymm4 |
5428 | vpsubd %ymm11, %ymm8, %ymm11 |
5429 | vpsubd %ymm6, %ymm7, %ymm6 |
5430 | vpsrld $1, %ymm11, %ymm11 |
5431 | vpsrld $1, %ymm6, %ymm6 |
5432 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
5433 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
5434 | vpackusdw %ymm6, %ymm11, %ymm6 |
5435 | vmovdqa 1632(%rsp), %ymm11 |
5436 | vpunpcklwd const0(%rip), %ymm11, %ymm7 |
5437 | vpunpckhwd const0(%rip), %ymm11, %ymm8 |
5438 | vpslld $1, %ymm7, %ymm7 |
5439 | vpslld $1, %ymm8, %ymm8 |
5440 | vpsubd %ymm7, %ymm3, %ymm3 |
5441 | vpsubd %ymm8, %ymm4, %ymm4 |
5442 | vpsrld $1, %ymm3, %ymm3 |
5443 | vpsrld $1, %ymm4, %ymm4 |
5444 | vpand mask32_to_16(%rip), %ymm3, %ymm3 |
5445 | vpand mask32_to_16(%rip), %ymm4, %ymm4 |
5446 | vpackusdw %ymm4, %ymm3, %ymm4 |
5447 | vmovdqa 864(%rsp), %ymm3 |
5448 | vpaddw 1120(%rsp), %ymm3, %ymm8 |
5449 | vpsubw 1120(%rsp), %ymm3, %ymm3 |
5450 | vpsrlw $2, %ymm3, %ymm3 |
5451 | vpsubw %ymm6, %ymm3, %ymm3 |
5452 | vpmullw %ymm14, %ymm3, %ymm3 |
5453 | vpsllw $1, %ymm5, %ymm7 |
5454 | vpsubw %ymm7, %ymm8, %ymm7 |
5455 | vpsllw $7, %ymm11, %ymm8 |
5456 | vpsubw %ymm8, %ymm7, %ymm8 |
5457 | vpsrlw $3, %ymm8, %ymm8 |
5458 | vpsubw %ymm4, %ymm8, %ymm8 |
5459 | vmovdqa 1376(%rsp), %ymm7 |
5460 | vpsubw %ymm5, %ymm7, %ymm7 |
5461 | vpmullw %ymm15, %ymm11, %ymm10 |
5462 | vpsubw %ymm10, %ymm7, %ymm10 |
5463 | vpmullw %ymm14, %ymm8, %ymm8 |
5464 | vpsubw %ymm8, %ymm4, %ymm4 |
5465 | vpmullw %ymm12, %ymm8, %ymm7 |
5466 | vpaddw %ymm7, %ymm4, %ymm7 |
5467 | vpmullw %ymm12, %ymm7, %ymm7 |
5468 | vpsubw %ymm7, %ymm10, %ymm7 |
5469 | vpmullw %ymm14, %ymm7, %ymm7 |
5470 | vpsubw %ymm6, %ymm7, %ymm7 |
5471 | vpsrlw $3, %ymm7, %ymm7 |
5472 | vpsubw %ymm3, %ymm7, %ymm7 |
5473 | vpsubw %ymm7, %ymm3, %ymm3 |
5474 | vpsubw %ymm3, %ymm6, %ymm6 |
5475 | vpmullw %ymm13, %ymm7, %ymm7 |
5476 | vpsubw %ymm7, %ymm6, %ymm6 |
5477 | vpshufb shuf48_16(%rip), %ymm8, %ymm8 |
5478 | vpand mask3_5_3_5(%rip), %ymm8, %ymm10 |
5479 | vpand mask5_3_5_3(%rip), %ymm8, %ymm8 |
5480 | vpermq $206, %ymm10, %ymm10 |
5481 | vpand mask_keephigh(%rip), %ymm10, %ymm9 |
5482 | vpor %ymm9, %ymm8, %ymm8 |
5483 | vpaddw %ymm8, %ymm5, %ymm5 |
5484 | vmovdqa %xmm10, 2144(%rsp) |
5485 | vpshufb shuf48_16(%rip), %ymm7, %ymm7 |
5486 | vpand mask3_5_3_5(%rip), %ymm7, %ymm10 |
5487 | vpand mask5_3_5_3(%rip), %ymm7, %ymm7 |
5488 | vpermq $206, %ymm10, %ymm10 |
5489 | vpand mask_keephigh(%rip), %ymm10, %ymm9 |
5490 | vpor %ymm9, %ymm7, %ymm7 |
5491 | vpaddw %ymm7, %ymm6, %ymm6 |
5492 | vmovdqa %xmm10, 2400(%rsp) |
5493 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
5494 | vpand mask3_5_3_5(%rip), %ymm11, %ymm10 |
5495 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
5496 | vpermq $206, %ymm10, %ymm10 |
5497 | vpand mask_keephigh(%rip), %ymm10, %ymm9 |
5498 | vpor %ymm9, %ymm11, %ymm11 |
5499 | vpaddw %ymm11, %ymm4, %ymm4 |
5500 | vmovdqa %xmm10, 2656(%rsp) |
5501 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
5502 | vmovdqu %ymm5, 264(%rdi) |
5503 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
5504 | vmovdqu %ymm6, 616(%rdi) |
5505 | vpand mask_mod8192(%rip), %ymm4, %ymm4 |
5506 | vmovdqu %ymm4, 968(%rdi) |
5507 | vpand mask_mod8192(%rip), %ymm3, %ymm3 |
5508 | vmovdqu %ymm3, 1320(%rdi) |
5509 | vmovdqa 128(%rsp), %ymm11 |
5510 | vpunpcklwd const0(%rip), %ymm11, %ymm7 |
5511 | vpunpckhwd const0(%rip), %ymm11, %ymm8 |
5512 | vpslld $1, %ymm7, %ymm7 |
5513 | vpslld $1, %ymm8, %ymm8 |
5514 | vmovdqa 384(%rsp), %ymm3 |
5515 | vpunpcklwd const0(%rip), %ymm3, %ymm4 |
5516 | vpunpckhwd const0(%rip), %ymm3, %ymm3 |
5517 | vmovdqa 640(%rsp), %ymm6 |
5518 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
5519 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
5520 | vpaddd %ymm5, %ymm4, %ymm10 |
5521 | vpaddd %ymm6, %ymm3, %ymm9 |
5522 | vpsubd %ymm7, %ymm10, %ymm10 |
5523 | vpsubd %ymm8, %ymm9, %ymm9 |
5524 | vpsubd %ymm5, %ymm4, %ymm5 |
5525 | vpsubd %ymm6, %ymm3, %ymm6 |
5526 | vpsrld $1, %ymm5, %ymm5 |
5527 | vpsrld $1, %ymm6, %ymm6 |
5528 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
5529 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
5530 | vpackusdw %ymm6, %ymm5, %ymm6 |
5531 | vmovdqa 1664(%rsp), %ymm5 |
5532 | vpunpcklwd const0(%rip), %ymm5, %ymm3 |
5533 | vpunpckhwd const0(%rip), %ymm5, %ymm4 |
5534 | vpslld $1, %ymm3, %ymm3 |
5535 | vpslld $1, %ymm4, %ymm4 |
5536 | vpsubd %ymm3, %ymm10, %ymm10 |
5537 | vpsubd %ymm4, %ymm9, %ymm9 |
5538 | vpsrld $1, %ymm10, %ymm10 |
5539 | vpsrld $1, %ymm9, %ymm9 |
5540 | vpand mask32_to_16(%rip), %ymm10, %ymm10 |
5541 | vpand mask32_to_16(%rip), %ymm9, %ymm9 |
5542 | vpackusdw %ymm9, %ymm10, %ymm9 |
5543 | vmovdqa 896(%rsp), %ymm10 |
5544 | vpaddw 1152(%rsp), %ymm10, %ymm4 |
5545 | vpsubw 1152(%rsp), %ymm10, %ymm10 |
5546 | vpsrlw $2, %ymm10, %ymm10 |
5547 | vpsubw %ymm6, %ymm10, %ymm10 |
5548 | vpmullw %ymm14, %ymm10, %ymm10 |
5549 | vpsllw $1, %ymm11, %ymm3 |
5550 | vpsubw %ymm3, %ymm4, %ymm3 |
5551 | vpsllw $7, %ymm5, %ymm4 |
5552 | vpsubw %ymm4, %ymm3, %ymm4 |
5553 | vpsrlw $3, %ymm4, %ymm4 |
5554 | vpsubw %ymm9, %ymm4, %ymm4 |
5555 | vmovdqa 1408(%rsp), %ymm3 |
5556 | vpsubw %ymm11, %ymm3, %ymm3 |
5557 | vpmullw %ymm15, %ymm5, %ymm8 |
5558 | vpsubw %ymm8, %ymm3, %ymm8 |
5559 | vpmullw %ymm14, %ymm4, %ymm4 |
5560 | vpsubw %ymm4, %ymm9, %ymm9 |
5561 | vpmullw %ymm12, %ymm4, %ymm3 |
5562 | vpaddw %ymm3, %ymm9, %ymm3 |
5563 | vpmullw %ymm12, %ymm3, %ymm3 |
5564 | vpsubw %ymm3, %ymm8, %ymm3 |
5565 | vpmullw %ymm14, %ymm3, %ymm3 |
5566 | vpsubw %ymm6, %ymm3, %ymm3 |
5567 | vpsrlw $3, %ymm3, %ymm3 |
5568 | vpsubw %ymm10, %ymm3, %ymm3 |
5569 | vpsubw %ymm3, %ymm10, %ymm10 |
5570 | vpsubw %ymm10, %ymm6, %ymm6 |
5571 | vpmullw %ymm13, %ymm3, %ymm3 |
5572 | vpsubw %ymm3, %ymm6, %ymm6 |
5573 | vmovdqu 352(%rdi), %ymm8 |
5574 | vmovdqu 704(%rdi), %ymm7 |
5575 | vmovdqu 1056(%rdi), %ymm2 |
5576 | vpaddw %ymm11, %ymm8, %ymm11 |
5577 | vpaddw %ymm6, %ymm7, %ymm6 |
5578 | vpaddw %ymm9, %ymm2, %ymm9 |
5579 | vpshufb shuf48_16(%rip), %ymm10, %ymm10 |
5580 | vpand mask3_5_3_5(%rip), %ymm10, %ymm2 |
5581 | vpand mask5_3_5_3(%rip), %ymm10, %ymm10 |
5582 | vpermq $206, %ymm2, %ymm2 |
5583 | vpand mask_keephigh(%rip), %ymm2, %ymm7 |
5584 | vpor %ymm7, %ymm10, %ymm10 |
5585 | vmovdqu 0(%rdi), %ymm7 |
5586 | vpaddw %ymm10, %ymm7, %ymm7 |
5587 | vpand mask_mod8192(%rip), %ymm7, %ymm7 |
5588 | vmovdqu %ymm7, 0(%rdi) |
5589 | vmovdqa %xmm2, 1920(%rsp) |
5590 | vpshufb shuf48_16(%rip), %ymm4, %ymm4 |
5591 | vpand mask3_5_3_5(%rip), %ymm4, %ymm2 |
5592 | vpand mask5_3_5_3(%rip), %ymm4, %ymm4 |
5593 | vpermq $206, %ymm2, %ymm2 |
5594 | vpand mask_keephigh(%rip), %ymm2, %ymm7 |
5595 | vpor %ymm7, %ymm4, %ymm4 |
5596 | vpaddw %ymm4, %ymm11, %ymm11 |
5597 | vmovdqa %xmm2, 2176(%rsp) |
5598 | vpshufb shuf48_16(%rip), %ymm3, %ymm3 |
5599 | vpand mask3_5_3_5(%rip), %ymm3, %ymm2 |
5600 | vpand mask5_3_5_3(%rip), %ymm3, %ymm3 |
5601 | vpermq $206, %ymm2, %ymm2 |
5602 | vpand mask_keephigh(%rip), %ymm2, %ymm7 |
5603 | vpor %ymm7, %ymm3, %ymm3 |
5604 | vpaddw %ymm3, %ymm6, %ymm6 |
5605 | vmovdqa %xmm2, 2432(%rsp) |
5606 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
5607 | vpand mask3_5_3_5(%rip), %ymm5, %ymm2 |
5608 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
5609 | vpermq $206, %ymm2, %ymm2 |
5610 | vpand mask_keephigh(%rip), %ymm2, %ymm7 |
5611 | vpor %ymm7, %ymm5, %ymm5 |
5612 | vpaddw %ymm5, %ymm9, %ymm9 |
5613 | vmovdqa %xmm2, 2688(%rsp) |
5614 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
5615 | vmovdqu %ymm11, 352(%rdi) |
5616 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
5617 | vmovdqu %ymm6, 704(%rdi) |
5618 | vpand mask_mod8192(%rip), %ymm9, %ymm9 |
5619 | vmovdqu %ymm9, 1056(%rdi) |
5620 | vmovdqa 160(%rsp), %ymm5 |
5621 | vpunpcklwd const0(%rip), %ymm5, %ymm3 |
5622 | vpunpckhwd const0(%rip), %ymm5, %ymm4 |
5623 | vpslld $1, %ymm3, %ymm3 |
5624 | vpslld $1, %ymm4, %ymm4 |
5625 | vmovdqa 416(%rsp), %ymm10 |
5626 | vpunpcklwd const0(%rip), %ymm10, %ymm9 |
5627 | vpunpckhwd const0(%rip), %ymm10, %ymm10 |
5628 | vmovdqa 672(%rsp), %ymm6 |
5629 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
5630 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
5631 | vpaddd %ymm11, %ymm9, %ymm2 |
5632 | vpaddd %ymm6, %ymm10, %ymm7 |
5633 | vpsubd %ymm3, %ymm2, %ymm2 |
5634 | vpsubd %ymm4, %ymm7, %ymm7 |
5635 | vpsubd %ymm11, %ymm9, %ymm11 |
5636 | vpsubd %ymm6, %ymm10, %ymm6 |
5637 | vpsrld $1, %ymm11, %ymm11 |
5638 | vpsrld $1, %ymm6, %ymm6 |
5639 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
5640 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
5641 | vpackusdw %ymm6, %ymm11, %ymm6 |
5642 | vmovdqa 1696(%rsp), %ymm11 |
5643 | vpunpcklwd const0(%rip), %ymm11, %ymm10 |
5644 | vpunpckhwd const0(%rip), %ymm11, %ymm9 |
5645 | vpslld $1, %ymm10, %ymm10 |
5646 | vpslld $1, %ymm9, %ymm9 |
5647 | vpsubd %ymm10, %ymm2, %ymm2 |
5648 | vpsubd %ymm9, %ymm7, %ymm7 |
5649 | vpsrld $1, %ymm2, %ymm2 |
5650 | vpsrld $1, %ymm7, %ymm7 |
5651 | vpand mask32_to_16(%rip), %ymm2, %ymm2 |
5652 | vpand mask32_to_16(%rip), %ymm7, %ymm7 |
5653 | vpackusdw %ymm7, %ymm2, %ymm7 |
5654 | vmovdqa 928(%rsp), %ymm2 |
5655 | vpaddw 1184(%rsp), %ymm2, %ymm9 |
5656 | vpsubw 1184(%rsp), %ymm2, %ymm2 |
5657 | vpsrlw $2, %ymm2, %ymm2 |
5658 | vpsubw %ymm6, %ymm2, %ymm2 |
5659 | vpmullw %ymm14, %ymm2, %ymm2 |
5660 | vpsllw $1, %ymm5, %ymm10 |
5661 | vpsubw %ymm10, %ymm9, %ymm10 |
5662 | vpsllw $7, %ymm11, %ymm9 |
5663 | vpsubw %ymm9, %ymm10, %ymm9 |
5664 | vpsrlw $3, %ymm9, %ymm9 |
5665 | vpsubw %ymm7, %ymm9, %ymm9 |
5666 | vmovdqa 1440(%rsp), %ymm10 |
5667 | vpsubw %ymm5, %ymm10, %ymm10 |
5668 | vpmullw %ymm15, %ymm11, %ymm4 |
5669 | vpsubw %ymm4, %ymm10, %ymm4 |
5670 | vpmullw %ymm14, %ymm9, %ymm9 |
5671 | vpsubw %ymm9, %ymm7, %ymm7 |
5672 | vpmullw %ymm12, %ymm9, %ymm10 |
5673 | vpaddw %ymm10, %ymm7, %ymm10 |
5674 | vpmullw %ymm12, %ymm10, %ymm10 |
5675 | vpsubw %ymm10, %ymm4, %ymm10 |
5676 | vpmullw %ymm14, %ymm10, %ymm10 |
5677 | vpsubw %ymm6, %ymm10, %ymm10 |
5678 | vpsrlw $3, %ymm10, %ymm10 |
5679 | vpsubw %ymm2, %ymm10, %ymm10 |
5680 | vpsubw %ymm10, %ymm2, %ymm2 |
5681 | vpsubw %ymm2, %ymm6, %ymm6 |
5682 | vpmullw %ymm13, %ymm10, %ymm10 |
5683 | vpsubw %ymm10, %ymm6, %ymm6 |
5684 | vmovdqu 440(%rdi), %ymm4 |
5685 | vmovdqu 792(%rdi), %ymm3 |
5686 | vmovdqu 1144(%rdi), %ymm8 |
5687 | vpaddw %ymm5, %ymm4, %ymm5 |
5688 | vpaddw %ymm6, %ymm3, %ymm6 |
5689 | vpaddw %ymm7, %ymm8, %ymm7 |
5690 | vpshufb shuf48_16(%rip), %ymm2, %ymm2 |
5691 | vpand mask3_5_3_5(%rip), %ymm2, %ymm8 |
5692 | vpand mask5_3_5_3(%rip), %ymm2, %ymm2 |
5693 | vpermq $206, %ymm8, %ymm8 |
5694 | vpand mask_keephigh(%rip), %ymm8, %ymm3 |
5695 | vpor %ymm3, %ymm2, %ymm2 |
5696 | vmovdqu 88(%rdi), %ymm3 |
5697 | vpaddw %ymm2, %ymm3, %ymm3 |
5698 | vpand mask_mod8192(%rip), %ymm3, %ymm3 |
5699 | vmovdqu %ymm3, 88(%rdi) |
5700 | vmovdqa %xmm8, 1952(%rsp) |
5701 | vpshufb shuf48_16(%rip), %ymm9, %ymm9 |
5702 | vpand mask3_5_3_5(%rip), %ymm9, %ymm8 |
5703 | vpand mask5_3_5_3(%rip), %ymm9, %ymm9 |
5704 | vpermq $206, %ymm8, %ymm8 |
5705 | vpand mask_keephigh(%rip), %ymm8, %ymm3 |
5706 | vpor %ymm3, %ymm9, %ymm9 |
5707 | vpaddw %ymm9, %ymm5, %ymm5 |
5708 | vmovdqa %xmm8, 2208(%rsp) |
5709 | vpshufb shuf48_16(%rip), %ymm10, %ymm10 |
5710 | vpand mask3_5_3_5(%rip), %ymm10, %ymm8 |
5711 | vpand mask5_3_5_3(%rip), %ymm10, %ymm10 |
5712 | vpermq $206, %ymm8, %ymm8 |
5713 | vpand mask_keephigh(%rip), %ymm8, %ymm3 |
5714 | vpor %ymm3, %ymm10, %ymm10 |
5715 | vpaddw %ymm10, %ymm6, %ymm6 |
5716 | vmovdqa %xmm8, 2464(%rsp) |
5717 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
5718 | vpand mask3_5_3_5(%rip), %ymm11, %ymm8 |
5719 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
5720 | vpermq $206, %ymm8, %ymm8 |
5721 | vpand mask_keephigh(%rip), %ymm8, %ymm3 |
5722 | vpor %ymm3, %ymm11, %ymm11 |
5723 | vpaddw %ymm11, %ymm7, %ymm7 |
5724 | vmovdqa %xmm8, 2720(%rsp) |
5725 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
5726 | vmovdqu %ymm5, 440(%rdi) |
5727 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
5728 | vmovdqu %ymm6, 792(%rdi) |
5729 | vpand mask_mod8192(%rip), %ymm7, %ymm7 |
5730 | vmovdqu %ymm7, 1144(%rdi) |
5731 | vmovdqa 192(%rsp), %ymm11 |
5732 | vpunpcklwd const0(%rip), %ymm11, %ymm10 |
5733 | vpunpckhwd const0(%rip), %ymm11, %ymm9 |
5734 | vpslld $1, %ymm10, %ymm10 |
5735 | vpslld $1, %ymm9, %ymm9 |
5736 | vmovdqa 448(%rsp), %ymm2 |
5737 | vpunpcklwd const0(%rip), %ymm2, %ymm7 |
5738 | vpunpckhwd const0(%rip), %ymm2, %ymm2 |
5739 | vmovdqa 704(%rsp), %ymm6 |
5740 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
5741 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
5742 | vpaddd %ymm5, %ymm7, %ymm8 |
5743 | vpaddd %ymm6, %ymm2, %ymm3 |
5744 | vpsubd %ymm10, %ymm8, %ymm8 |
5745 | vpsubd %ymm9, %ymm3, %ymm3 |
5746 | vpsubd %ymm5, %ymm7, %ymm5 |
5747 | vpsubd %ymm6, %ymm2, %ymm6 |
5748 | vpsrld $1, %ymm5, %ymm5 |
5749 | vpsrld $1, %ymm6, %ymm6 |
5750 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
5751 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
5752 | vpackusdw %ymm6, %ymm5, %ymm6 |
5753 | vmovdqa 1728(%rsp), %ymm5 |
5754 | vpunpcklwd const0(%rip), %ymm5, %ymm2 |
5755 | vpunpckhwd const0(%rip), %ymm5, %ymm7 |
5756 | vpslld $1, %ymm2, %ymm2 |
5757 | vpslld $1, %ymm7, %ymm7 |
5758 | vpsubd %ymm2, %ymm8, %ymm8 |
5759 | vpsubd %ymm7, %ymm3, %ymm3 |
5760 | vpsrld $1, %ymm8, %ymm8 |
5761 | vpsrld $1, %ymm3, %ymm3 |
5762 | vpand mask32_to_16(%rip), %ymm8, %ymm8 |
5763 | vpand mask32_to_16(%rip), %ymm3, %ymm3 |
5764 | vpackusdw %ymm3, %ymm8, %ymm3 |
5765 | vmovdqa 960(%rsp), %ymm8 |
5766 | vpaddw 1216(%rsp), %ymm8, %ymm7 |
5767 | vpsubw 1216(%rsp), %ymm8, %ymm8 |
5768 | vpsrlw $2, %ymm8, %ymm8 |
5769 | vpsubw %ymm6, %ymm8, %ymm8 |
5770 | vpmullw %ymm14, %ymm8, %ymm8 |
5771 | vpsllw $1, %ymm11, %ymm2 |
5772 | vpsubw %ymm2, %ymm7, %ymm2 |
5773 | vpsllw $7, %ymm5, %ymm7 |
5774 | vpsubw %ymm7, %ymm2, %ymm7 |
5775 | vpsrlw $3, %ymm7, %ymm7 |
5776 | vpsubw %ymm3, %ymm7, %ymm7 |
5777 | vmovdqa 1472(%rsp), %ymm2 |
5778 | vpsubw %ymm11, %ymm2, %ymm2 |
5779 | vpmullw %ymm15, %ymm5, %ymm9 |
5780 | vpsubw %ymm9, %ymm2, %ymm9 |
5781 | vpmullw %ymm14, %ymm7, %ymm7 |
5782 | vpsubw %ymm7, %ymm3, %ymm3 |
5783 | vpmullw %ymm12, %ymm7, %ymm2 |
5784 | vpaddw %ymm2, %ymm3, %ymm2 |
5785 | vpmullw %ymm12, %ymm2, %ymm2 |
5786 | vpsubw %ymm2, %ymm9, %ymm2 |
5787 | vpmullw %ymm14, %ymm2, %ymm2 |
5788 | vpsubw %ymm6, %ymm2, %ymm2 |
5789 | vpsrlw $3, %ymm2, %ymm2 |
5790 | vpsubw %ymm8, %ymm2, %ymm2 |
5791 | vpsubw %ymm2, %ymm8, %ymm8 |
5792 | vpsubw %ymm8, %ymm6, %ymm6 |
5793 | vpmullw %ymm13, %ymm2, %ymm2 |
5794 | vpsubw %ymm2, %ymm6, %ymm6 |
5795 | vmovdqu 528(%rdi), %ymm9 |
5796 | vmovdqu 880(%rdi), %ymm10 |
5797 | vmovdqu 1232(%rdi), %ymm4 |
5798 | vpaddw %ymm11, %ymm9, %ymm11 |
5799 | vpaddw %ymm6, %ymm10, %ymm6 |
5800 | vpaddw %ymm3, %ymm4, %ymm3 |
5801 | vpshufb shuf48_16(%rip), %ymm8, %ymm8 |
5802 | vpand mask3_5_3_5(%rip), %ymm8, %ymm4 |
5803 | vpand mask5_3_5_3(%rip), %ymm8, %ymm8 |
5804 | vpermq $206, %ymm4, %ymm4 |
5805 | vpand mask_keephigh(%rip), %ymm4, %ymm10 |
5806 | vpor %ymm10, %ymm8, %ymm8 |
5807 | vmovdqu 176(%rdi), %ymm10 |
5808 | vpaddw %ymm8, %ymm10, %ymm10 |
5809 | vpand mask_mod8192(%rip), %ymm10, %ymm10 |
5810 | vmovdqu %ymm10, 176(%rdi) |
5811 | vmovdqa %xmm4, 1984(%rsp) |
5812 | vpshufb shuf48_16(%rip), %ymm7, %ymm7 |
5813 | vpand mask3_5_3_5(%rip), %ymm7, %ymm4 |
5814 | vpand mask5_3_5_3(%rip), %ymm7, %ymm7 |
5815 | vpermq $206, %ymm4, %ymm4 |
5816 | vpand mask_keephigh(%rip), %ymm4, %ymm10 |
5817 | vpor %ymm10, %ymm7, %ymm7 |
5818 | vpaddw %ymm7, %ymm11, %ymm11 |
5819 | vmovdqa %xmm4, 2240(%rsp) |
5820 | vpshufb shuf48_16(%rip), %ymm2, %ymm2 |
5821 | vpand mask3_5_3_5(%rip), %ymm2, %ymm4 |
5822 | vpand mask5_3_5_3(%rip), %ymm2, %ymm2 |
5823 | vpermq $206, %ymm4, %ymm4 |
5824 | vpand mask_keephigh(%rip), %ymm4, %ymm10 |
5825 | vpor %ymm10, %ymm2, %ymm2 |
5826 | vpaddw %ymm2, %ymm6, %ymm6 |
5827 | vmovdqa %xmm4, 2496(%rsp) |
5828 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
5829 | vpand mask3_5_3_5(%rip), %ymm5, %ymm4 |
5830 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
5831 | vpermq $206, %ymm4, %ymm4 |
5832 | vpand mask_keephigh(%rip), %ymm4, %ymm10 |
5833 | vpor %ymm10, %ymm5, %ymm5 |
5834 | vpaddw %ymm5, %ymm3, %ymm3 |
5835 | vmovdqa %xmm4, 2752(%rsp) |
5836 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
5837 | vmovdqu %ymm11, 528(%rdi) |
5838 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
5839 | vmovdqu %ymm6, 880(%rdi) |
5840 | vpand mask_mod8192(%rip), %ymm3, %ymm3 |
5841 | vmovdqu %ymm3, 1232(%rdi) |
5842 | vmovdqa 224(%rsp), %ymm5 |
5843 | vpunpcklwd const0(%rip), %ymm5, %ymm2 |
5844 | vpunpckhwd const0(%rip), %ymm5, %ymm7 |
5845 | vpslld $1, %ymm2, %ymm2 |
5846 | vpslld $1, %ymm7, %ymm7 |
5847 | vmovdqa 480(%rsp), %ymm8 |
5848 | vpunpcklwd const0(%rip), %ymm8, %ymm3 |
5849 | vpunpckhwd const0(%rip), %ymm8, %ymm8 |
5850 | vmovdqa 736(%rsp), %ymm6 |
5851 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
5852 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
5853 | vpaddd %ymm11, %ymm3, %ymm4 |
5854 | vpaddd %ymm6, %ymm8, %ymm10 |
5855 | vpsubd %ymm2, %ymm4, %ymm4 |
5856 | vpsubd %ymm7, %ymm10, %ymm10 |
5857 | vpsubd %ymm11, %ymm3, %ymm11 |
5858 | vpsubd %ymm6, %ymm8, %ymm6 |
5859 | vpsrld $1, %ymm11, %ymm11 |
5860 | vpsrld $1, %ymm6, %ymm6 |
5861 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
5862 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
5863 | vpackusdw %ymm6, %ymm11, %ymm6 |
5864 | vmovdqa 1760(%rsp), %ymm11 |
5865 | vpunpcklwd const0(%rip), %ymm11, %ymm8 |
5866 | vpunpckhwd const0(%rip), %ymm11, %ymm3 |
5867 | vpslld $1, %ymm8, %ymm8 |
5868 | vpslld $1, %ymm3, %ymm3 |
5869 | vpsubd %ymm8, %ymm4, %ymm4 |
5870 | vpsubd %ymm3, %ymm10, %ymm10 |
5871 | vpsrld $1, %ymm4, %ymm4 |
5872 | vpsrld $1, %ymm10, %ymm10 |
5873 | vpand mask32_to_16(%rip), %ymm4, %ymm4 |
5874 | vpand mask32_to_16(%rip), %ymm10, %ymm10 |
5875 | vpackusdw %ymm10, %ymm4, %ymm10 |
5876 | vmovdqa 992(%rsp), %ymm4 |
5877 | vpaddw 1248(%rsp), %ymm4, %ymm3 |
5878 | vpsubw 1248(%rsp), %ymm4, %ymm4 |
5879 | vpsrlw $2, %ymm4, %ymm4 |
5880 | vpsubw %ymm6, %ymm4, %ymm4 |
5881 | vpmullw %ymm14, %ymm4, %ymm4 |
5882 | vpsllw $1, %ymm5, %ymm8 |
5883 | vpsubw %ymm8, %ymm3, %ymm8 |
5884 | vpsllw $7, %ymm11, %ymm3 |
5885 | vpsubw %ymm3, %ymm8, %ymm3 |
5886 | vpsrlw $3, %ymm3, %ymm3 |
5887 | vpsubw %ymm10, %ymm3, %ymm3 |
5888 | vmovdqa 1504(%rsp), %ymm8 |
5889 | vpsubw %ymm5, %ymm8, %ymm8 |
5890 | vpmullw %ymm15, %ymm11, %ymm7 |
5891 | vpsubw %ymm7, %ymm8, %ymm7 |
5892 | vpmullw %ymm14, %ymm3, %ymm3 |
5893 | vpsubw %ymm3, %ymm10, %ymm10 |
5894 | vpmullw %ymm12, %ymm3, %ymm8 |
5895 | vpaddw %ymm8, %ymm10, %ymm8 |
5896 | vpmullw %ymm12, %ymm8, %ymm8 |
5897 | vpsubw %ymm8, %ymm7, %ymm8 |
5898 | vpmullw %ymm14, %ymm8, %ymm8 |
5899 | vpsubw %ymm6, %ymm8, %ymm8 |
5900 | vpsrlw $3, %ymm8, %ymm8 |
5901 | vpsubw %ymm4, %ymm8, %ymm8 |
5902 | vpsubw %ymm8, %ymm4, %ymm4 |
5903 | vpsubw %ymm4, %ymm6, %ymm6 |
5904 | vpmullw %ymm13, %ymm8, %ymm8 |
5905 | vpsubw %ymm8, %ymm6, %ymm6 |
5906 | vmovdqu 616(%rdi), %ymm7 |
5907 | vmovdqu 968(%rdi), %ymm2 |
5908 | vmovdqu 1320(%rdi), %ymm9 |
5909 | vpaddw %ymm5, %ymm7, %ymm5 |
5910 | vpaddw %ymm6, %ymm2, %ymm6 |
5911 | vpaddw %ymm10, %ymm9, %ymm10 |
5912 | vpshufb shuf48_16(%rip), %ymm4, %ymm4 |
5913 | vpand mask3_5_3_5(%rip), %ymm4, %ymm9 |
5914 | vpand mask5_3_5_3(%rip), %ymm4, %ymm4 |
5915 | vpermq $206, %ymm9, %ymm9 |
5916 | vpand mask_keephigh(%rip), %ymm9, %ymm2 |
5917 | vpor %ymm2, %ymm4, %ymm4 |
5918 | vmovdqu 264(%rdi), %ymm2 |
5919 | vpaddw %ymm4, %ymm2, %ymm2 |
5920 | vpand mask_mod8192(%rip), %ymm2, %ymm2 |
5921 | vmovdqu %ymm2, 264(%rdi) |
5922 | vmovdqa %xmm9, 2016(%rsp) |
5923 | vpshufb shuf48_16(%rip), %ymm3, %ymm3 |
5924 | vpand mask3_5_3_5(%rip), %ymm3, %ymm9 |
5925 | vpand mask5_3_5_3(%rip), %ymm3, %ymm3 |
5926 | vpermq $206, %ymm9, %ymm9 |
5927 | vpand mask_keephigh(%rip), %ymm9, %ymm2 |
5928 | vpor %ymm2, %ymm3, %ymm3 |
5929 | vpaddw %ymm3, %ymm5, %ymm5 |
5930 | vmovdqa %xmm9, 2272(%rsp) |
5931 | vpshufb shuf48_16(%rip), %ymm8, %ymm8 |
5932 | vpand mask3_5_3_5(%rip), %ymm8, %ymm9 |
5933 | vpand mask5_3_5_3(%rip), %ymm8, %ymm8 |
5934 | vpermq $206, %ymm9, %ymm9 |
5935 | vpand mask_keephigh(%rip), %ymm9, %ymm2 |
5936 | vpor %ymm2, %ymm8, %ymm8 |
5937 | vpaddw %ymm8, %ymm6, %ymm6 |
5938 | vmovdqa %xmm9, 2528(%rsp) |
5939 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
5940 | vpand mask3_5_3_5(%rip), %ymm11, %ymm9 |
5941 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
5942 | vpermq $206, %ymm9, %ymm9 |
5943 | vpand mask_keephigh(%rip), %ymm9, %ymm2 |
5944 | vpor %ymm2, %ymm11, %ymm11 |
5945 | vpaddw %ymm11, %ymm10, %ymm10 |
5946 | vmovdqa %xmm9, 2784(%rsp) |
5947 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
5948 | vmovdqu %ymm5, 616(%rdi) |
5949 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
5950 | vmovdqu %ymm6, 968(%rdi) |
5951 | vpand mask_mod8192(%rip), %ymm10, %ymm10 |
5952 | vmovdqu %ymm10, 1320(%rdi) |
5953 | vmovdqa 128(%r12), %ymm0 |
5954 | vpsubw 224(%r12), %ymm0, %ymm0 |
5955 | vmovdqa 512(%r12), %ymm1 |
5956 | vpsubw %ymm0, %ymm1, %ymm1 |
5957 | vpsubw 320(%r12), %ymm1, %ymm1 |
5958 | vpsubw 32(%r12), %ymm0, %ymm0 |
5959 | vpaddw 416(%r12), %ymm0, %ymm0 |
5960 | vmovdqa 704(%r12), %ymm2 |
5961 | vpsubw 800(%r12), %ymm2, %ymm2 |
5962 | vmovdqa 1088(%r12), %ymm3 |
5963 | vpsubw %ymm2, %ymm3, %ymm3 |
5964 | vpsubw 896(%r12), %ymm3, %ymm3 |
5965 | vpsubw 608(%r12), %ymm2, %ymm2 |
5966 | vpaddw 992(%r12), %ymm2, %ymm2 |
5967 | vmovdqa 1280(%r12), %ymm4 |
5968 | vpsubw 1376(%r12), %ymm4, %ymm4 |
5969 | vmovdqa 1664(%r12), %ymm5 |
5970 | vpsubw %ymm4, %ymm5, %ymm5 |
5971 | vpsubw 1472(%r12), %ymm5, %ymm5 |
5972 | vpsubw 1184(%r12), %ymm4, %ymm4 |
5973 | vpaddw 1568(%r12), %ymm4, %ymm4 |
5974 | vpsubw 608(%r12), %ymm1, %ymm1 |
5975 | vpsubw %ymm1, %ymm5, %ymm5 |
5976 | vpsubw %ymm3, %ymm5, %ymm5 |
5977 | vpsubw 32(%r12), %ymm1, %ymm1 |
5978 | vpaddw 1184(%r12), %ymm1, %ymm1 |
5979 | vmovdqa 320(%r12), %ymm6 |
5980 | vpsubw %ymm2, %ymm6, %ymm7 |
5981 | vmovdqa 1472(%r12), %ymm2 |
5982 | vpsubw %ymm7, %ymm2, %ymm2 |
5983 | vpsubw 896(%r12), %ymm2, %ymm2 |
5984 | vpsubw %ymm0, %ymm7, %ymm7 |
5985 | vpaddw %ymm4, %ymm7, %ymm7 |
5986 | vmovdqa 32(%r12), %ymm8 |
5987 | vmovdqa 896(%r12), %ymm9 |
5988 | vmovdqa %ymm8, 0(%rsp) |
5989 | vmovdqa %ymm0, 32(%rsp) |
5990 | vmovdqa %ymm1, 64(%rsp) |
5991 | vmovdqa %ymm7, 96(%rsp) |
5992 | vmovdqa %ymm5, 128(%rsp) |
5993 | vmovdqa %ymm2, 160(%rsp) |
5994 | vmovdqa %ymm3, 192(%rsp) |
5995 | vmovdqa %ymm9, 224(%rsp) |
5996 | vmovdqa 1856(%r12), %ymm0 |
5997 | vpsubw 1952(%r12), %ymm0, %ymm0 |
5998 | vmovdqa 2240(%r12), %ymm1 |
5999 | vpsubw %ymm0, %ymm1, %ymm1 |
6000 | vpsubw 2048(%r12), %ymm1, %ymm1 |
6001 | vpsubw 1760(%r12), %ymm0, %ymm0 |
6002 | vpaddw 2144(%r12), %ymm0, %ymm0 |
6003 | vmovdqa 2432(%r12), %ymm2 |
6004 | vpsubw 2528(%r12), %ymm2, %ymm2 |
6005 | vmovdqa 2816(%r12), %ymm3 |
6006 | vpsubw %ymm2, %ymm3, %ymm3 |
6007 | vpsubw 2624(%r12), %ymm3, %ymm3 |
6008 | vpsubw 2336(%r12), %ymm2, %ymm2 |
6009 | vpaddw 2720(%r12), %ymm2, %ymm2 |
6010 | vmovdqa 3008(%r12), %ymm4 |
6011 | vpsubw 3104(%r12), %ymm4, %ymm4 |
6012 | vmovdqa 3392(%r12), %ymm5 |
6013 | vpsubw %ymm4, %ymm5, %ymm5 |
6014 | vpsubw 3200(%r12), %ymm5, %ymm5 |
6015 | vpsubw 2912(%r12), %ymm4, %ymm4 |
6016 | vpaddw 3296(%r12), %ymm4, %ymm4 |
6017 | vpsubw 2336(%r12), %ymm1, %ymm1 |
6018 | vpsubw %ymm1, %ymm5, %ymm5 |
6019 | vpsubw %ymm3, %ymm5, %ymm5 |
6020 | vpsubw 1760(%r12), %ymm1, %ymm1 |
6021 | vpaddw 2912(%r12), %ymm1, %ymm1 |
6022 | vmovdqa 2048(%r12), %ymm6 |
6023 | vpsubw %ymm2, %ymm6, %ymm7 |
6024 | vmovdqa 3200(%r12), %ymm2 |
6025 | vpsubw %ymm7, %ymm2, %ymm2 |
6026 | vpsubw 2624(%r12), %ymm2, %ymm2 |
6027 | vpsubw %ymm0, %ymm7, %ymm7 |
6028 | vpaddw %ymm4, %ymm7, %ymm7 |
6029 | vmovdqa 1760(%r12), %ymm8 |
6030 | vmovdqa 2624(%r12), %ymm9 |
6031 | vmovdqa %ymm8, 256(%rsp) |
6032 | vmovdqa %ymm0, 288(%rsp) |
6033 | vmovdqa %ymm1, 320(%rsp) |
6034 | vmovdqa %ymm7, 352(%rsp) |
6035 | vmovdqa %ymm5, 384(%rsp) |
6036 | vmovdqa %ymm2, 416(%rsp) |
6037 | vmovdqa %ymm3, 448(%rsp) |
6038 | vmovdqa %ymm9, 480(%rsp) |
6039 | vmovdqa 3584(%r12), %ymm0 |
6040 | vpsubw 3680(%r12), %ymm0, %ymm0 |
6041 | vmovdqa 3968(%r12), %ymm1 |
6042 | vpsubw %ymm0, %ymm1, %ymm1 |
6043 | vpsubw 3776(%r12), %ymm1, %ymm1 |
6044 | vpsubw 3488(%r12), %ymm0, %ymm0 |
6045 | vpaddw 3872(%r12), %ymm0, %ymm0 |
6046 | vmovdqa 4160(%r12), %ymm2 |
6047 | vpsubw 4256(%r12), %ymm2, %ymm2 |
6048 | vmovdqa 4544(%r12), %ymm3 |
6049 | vpsubw %ymm2, %ymm3, %ymm3 |
6050 | vpsubw 4352(%r12), %ymm3, %ymm3 |
6051 | vpsubw 4064(%r12), %ymm2, %ymm2 |
6052 | vpaddw 4448(%r12), %ymm2, %ymm2 |
6053 | vmovdqa 4736(%r12), %ymm4 |
6054 | vpsubw 4832(%r12), %ymm4, %ymm4 |
6055 | vmovdqa 5120(%r12), %ymm5 |
6056 | vpsubw %ymm4, %ymm5, %ymm5 |
6057 | vpsubw 4928(%r12), %ymm5, %ymm5 |
6058 | vpsubw 4640(%r12), %ymm4, %ymm4 |
6059 | vpaddw 5024(%r12), %ymm4, %ymm4 |
6060 | vpsubw 4064(%r12), %ymm1, %ymm1 |
6061 | vpsubw %ymm1, %ymm5, %ymm5 |
6062 | vpsubw %ymm3, %ymm5, %ymm5 |
6063 | vpsubw 3488(%r12), %ymm1, %ymm1 |
6064 | vpaddw 4640(%r12), %ymm1, %ymm1 |
6065 | vmovdqa 3776(%r12), %ymm6 |
6066 | vpsubw %ymm2, %ymm6, %ymm7 |
6067 | vmovdqa 4928(%r12), %ymm2 |
6068 | vpsubw %ymm7, %ymm2, %ymm2 |
6069 | vpsubw 4352(%r12), %ymm2, %ymm2 |
6070 | vpsubw %ymm0, %ymm7, %ymm7 |
6071 | vpaddw %ymm4, %ymm7, %ymm7 |
6072 | vmovdqa 3488(%r12), %ymm8 |
6073 | vmovdqa 4352(%r12), %ymm9 |
6074 | vmovdqa %ymm8, 512(%rsp) |
6075 | vmovdqa %ymm0, 544(%rsp) |
6076 | vmovdqa %ymm1, 576(%rsp) |
6077 | vmovdqa %ymm7, 608(%rsp) |
6078 | vmovdqa %ymm5, 640(%rsp) |
6079 | vmovdqa %ymm2, 672(%rsp) |
6080 | vmovdqa %ymm3, 704(%rsp) |
6081 | vmovdqa %ymm9, 736(%rsp) |
6082 | vmovdqa 5312(%r12), %ymm0 |
6083 | vpsubw 5408(%r12), %ymm0, %ymm0 |
6084 | vmovdqa 5696(%r12), %ymm1 |
6085 | vpsubw %ymm0, %ymm1, %ymm1 |
6086 | vpsubw 5504(%r12), %ymm1, %ymm1 |
6087 | vpsubw 5216(%r12), %ymm0, %ymm0 |
6088 | vpaddw 5600(%r12), %ymm0, %ymm0 |
6089 | vmovdqa 5888(%r12), %ymm2 |
6090 | vpsubw 5984(%r12), %ymm2, %ymm2 |
6091 | vmovdqa 6272(%r12), %ymm3 |
6092 | vpsubw %ymm2, %ymm3, %ymm3 |
6093 | vpsubw 6080(%r12), %ymm3, %ymm3 |
6094 | vpsubw 5792(%r12), %ymm2, %ymm2 |
6095 | vpaddw 6176(%r12), %ymm2, %ymm2 |
6096 | vmovdqa 6464(%r12), %ymm4 |
6097 | vpsubw 6560(%r12), %ymm4, %ymm4 |
6098 | vmovdqa 6848(%r12), %ymm5 |
6099 | vpsubw %ymm4, %ymm5, %ymm5 |
6100 | vpsubw 6656(%r12), %ymm5, %ymm5 |
6101 | vpsubw 6368(%r12), %ymm4, %ymm4 |
6102 | vpaddw 6752(%r12), %ymm4, %ymm4 |
6103 | vpsubw 5792(%r12), %ymm1, %ymm1 |
6104 | vpsubw %ymm1, %ymm5, %ymm5 |
6105 | vpsubw %ymm3, %ymm5, %ymm5 |
6106 | vpsubw 5216(%r12), %ymm1, %ymm1 |
6107 | vpaddw 6368(%r12), %ymm1, %ymm1 |
6108 | vmovdqa 5504(%r12), %ymm6 |
6109 | vpsubw %ymm2, %ymm6, %ymm7 |
6110 | vmovdqa 6656(%r12), %ymm2 |
6111 | vpsubw %ymm7, %ymm2, %ymm2 |
6112 | vpsubw 6080(%r12), %ymm2, %ymm2 |
6113 | vpsubw %ymm0, %ymm7, %ymm7 |
6114 | vpaddw %ymm4, %ymm7, %ymm7 |
6115 | vmovdqa 5216(%r12), %ymm8 |
6116 | vmovdqa 6080(%r12), %ymm9 |
6117 | vmovdqa %ymm8, 768(%rsp) |
6118 | vmovdqa %ymm0, 800(%rsp) |
6119 | vmovdqa %ymm1, 832(%rsp) |
6120 | vmovdqa %ymm7, 864(%rsp) |
6121 | vmovdqa %ymm5, 896(%rsp) |
6122 | vmovdqa %ymm2, 928(%rsp) |
6123 | vmovdqa %ymm3, 960(%rsp) |
6124 | vmovdqa %ymm9, 992(%rsp) |
6125 | vmovdqa 7040(%r12), %ymm0 |
6126 | vpsubw 7136(%r12), %ymm0, %ymm0 |
6127 | vmovdqa 7424(%r12), %ymm1 |
6128 | vpsubw %ymm0, %ymm1, %ymm1 |
6129 | vpsubw 7232(%r12), %ymm1, %ymm1 |
6130 | vpsubw 6944(%r12), %ymm0, %ymm0 |
6131 | vpaddw 7328(%r12), %ymm0, %ymm0 |
6132 | vmovdqa 7616(%r12), %ymm2 |
6133 | vpsubw 7712(%r12), %ymm2, %ymm2 |
6134 | vmovdqa 8000(%r12), %ymm3 |
6135 | vpsubw %ymm2, %ymm3, %ymm3 |
6136 | vpsubw 7808(%r12), %ymm3, %ymm3 |
6137 | vpsubw 7520(%r12), %ymm2, %ymm2 |
6138 | vpaddw 7904(%r12), %ymm2, %ymm2 |
6139 | vmovdqa 8192(%r12), %ymm4 |
6140 | vpsubw 8288(%r12), %ymm4, %ymm4 |
6141 | vmovdqa 8576(%r12), %ymm5 |
6142 | vpsubw %ymm4, %ymm5, %ymm5 |
6143 | vpsubw 8384(%r12), %ymm5, %ymm5 |
6144 | vpsubw 8096(%r12), %ymm4, %ymm4 |
6145 | vpaddw 8480(%r12), %ymm4, %ymm4 |
6146 | vpsubw 7520(%r12), %ymm1, %ymm1 |
6147 | vpsubw %ymm1, %ymm5, %ymm5 |
6148 | vpsubw %ymm3, %ymm5, %ymm5 |
6149 | vpsubw 6944(%r12), %ymm1, %ymm1 |
6150 | vpaddw 8096(%r12), %ymm1, %ymm1 |
6151 | vmovdqa 7232(%r12), %ymm6 |
6152 | vpsubw %ymm2, %ymm6, %ymm7 |
6153 | vmovdqa 8384(%r12), %ymm2 |
6154 | vpsubw %ymm7, %ymm2, %ymm2 |
6155 | vpsubw 7808(%r12), %ymm2, %ymm2 |
6156 | vpsubw %ymm0, %ymm7, %ymm7 |
6157 | vpaddw %ymm4, %ymm7, %ymm7 |
6158 | vmovdqa 6944(%r12), %ymm8 |
6159 | vmovdqa 7808(%r12), %ymm9 |
6160 | vmovdqa %ymm8, 1024(%rsp) |
6161 | vmovdqa %ymm0, 1056(%rsp) |
6162 | vmovdqa %ymm1, 1088(%rsp) |
6163 | vmovdqa %ymm7, 1120(%rsp) |
6164 | vmovdqa %ymm5, 1152(%rsp) |
6165 | vmovdqa %ymm2, 1184(%rsp) |
6166 | vmovdqa %ymm3, 1216(%rsp) |
6167 | vmovdqa %ymm9, 1248(%rsp) |
6168 | vmovdqa 8768(%r12), %ymm0 |
6169 | vpsubw 8864(%r12), %ymm0, %ymm0 |
6170 | vmovdqa 9152(%r12), %ymm1 |
6171 | vpsubw %ymm0, %ymm1, %ymm1 |
6172 | vpsubw 8960(%r12), %ymm1, %ymm1 |
6173 | vpsubw 8672(%r12), %ymm0, %ymm0 |
6174 | vpaddw 9056(%r12), %ymm0, %ymm0 |
6175 | vmovdqa 9344(%r12), %ymm2 |
6176 | vpsubw 9440(%r12), %ymm2, %ymm2 |
6177 | vmovdqa 9728(%r12), %ymm3 |
6178 | vpsubw %ymm2, %ymm3, %ymm3 |
6179 | vpsubw 9536(%r12), %ymm3, %ymm3 |
6180 | vpsubw 9248(%r12), %ymm2, %ymm2 |
6181 | vpaddw 9632(%r12), %ymm2, %ymm2 |
6182 | vmovdqa 9920(%r12), %ymm4 |
6183 | vpsubw 10016(%r12), %ymm4, %ymm4 |
6184 | vmovdqa 10304(%r12), %ymm5 |
6185 | vpsubw %ymm4, %ymm5, %ymm5 |
6186 | vpsubw 10112(%r12), %ymm5, %ymm5 |
6187 | vpsubw 9824(%r12), %ymm4, %ymm4 |
6188 | vpaddw 10208(%r12), %ymm4, %ymm4 |
6189 | vpsubw 9248(%r12), %ymm1, %ymm1 |
6190 | vpsubw %ymm1, %ymm5, %ymm5 |
6191 | vpsubw %ymm3, %ymm5, %ymm5 |
6192 | vpsubw 8672(%r12), %ymm1, %ymm1 |
6193 | vpaddw 9824(%r12), %ymm1, %ymm1 |
6194 | vmovdqa 8960(%r12), %ymm6 |
6195 | vpsubw %ymm2, %ymm6, %ymm7 |
6196 | vmovdqa 10112(%r12), %ymm2 |
6197 | vpsubw %ymm7, %ymm2, %ymm2 |
6198 | vpsubw 9536(%r12), %ymm2, %ymm2 |
6199 | vpsubw %ymm0, %ymm7, %ymm7 |
6200 | vpaddw %ymm4, %ymm7, %ymm7 |
6201 | vmovdqa 8672(%r12), %ymm8 |
6202 | vmovdqa 9536(%r12), %ymm9 |
6203 | vmovdqa %ymm8, 1280(%rsp) |
6204 | vmovdqa %ymm0, 1312(%rsp) |
6205 | vmovdqa %ymm1, 1344(%rsp) |
6206 | vmovdqa %ymm7, 1376(%rsp) |
6207 | vmovdqa %ymm5, 1408(%rsp) |
6208 | vmovdqa %ymm2, 1440(%rsp) |
6209 | vmovdqa %ymm3, 1472(%rsp) |
6210 | vmovdqa %ymm9, 1504(%rsp) |
6211 | vmovdqa 10496(%r12), %ymm0 |
6212 | vpsubw 10592(%r12), %ymm0, %ymm0 |
6213 | vmovdqa 10880(%r12), %ymm1 |
6214 | vpsubw %ymm0, %ymm1, %ymm1 |
6215 | vpsubw 10688(%r12), %ymm1, %ymm1 |
6216 | vpsubw 10400(%r12), %ymm0, %ymm0 |
6217 | vpaddw 10784(%r12), %ymm0, %ymm0 |
6218 | vmovdqa 11072(%r12), %ymm2 |
6219 | vpsubw 11168(%r12), %ymm2, %ymm2 |
6220 | vmovdqa 11456(%r12), %ymm3 |
6221 | vpsubw %ymm2, %ymm3, %ymm3 |
6222 | vpsubw 11264(%r12), %ymm3, %ymm3 |
6223 | vpsubw 10976(%r12), %ymm2, %ymm2 |
6224 | vpaddw 11360(%r12), %ymm2, %ymm2 |
6225 | vmovdqa 11648(%r12), %ymm4 |
6226 | vpsubw 11744(%r12), %ymm4, %ymm4 |
6227 | vmovdqa 12032(%r12), %ymm5 |
6228 | vpsubw %ymm4, %ymm5, %ymm5 |
6229 | vpsubw 11840(%r12), %ymm5, %ymm5 |
6230 | vpsubw 11552(%r12), %ymm4, %ymm4 |
6231 | vpaddw 11936(%r12), %ymm4, %ymm4 |
6232 | vpsubw 10976(%r12), %ymm1, %ymm1 |
6233 | vpsubw %ymm1, %ymm5, %ymm5 |
6234 | vpsubw %ymm3, %ymm5, %ymm5 |
6235 | vpsubw 10400(%r12), %ymm1, %ymm1 |
6236 | vpaddw 11552(%r12), %ymm1, %ymm1 |
6237 | vmovdqa 10688(%r12), %ymm6 |
6238 | vpsubw %ymm2, %ymm6, %ymm7 |
6239 | vmovdqa 11840(%r12), %ymm2 |
6240 | vpsubw %ymm7, %ymm2, %ymm2 |
6241 | vpsubw 11264(%r12), %ymm2, %ymm2 |
6242 | vpsubw %ymm0, %ymm7, %ymm7 |
6243 | vpaddw %ymm4, %ymm7, %ymm7 |
6244 | vmovdqa 10400(%r12), %ymm8 |
6245 | vmovdqa 11264(%r12), %ymm9 |
6246 | vmovdqa %ymm8, 1536(%rsp) |
6247 | vmovdqa %ymm0, 1568(%rsp) |
6248 | vmovdqa %ymm1, 1600(%rsp) |
6249 | vmovdqa %ymm7, 1632(%rsp) |
6250 | vmovdqa %ymm5, 1664(%rsp) |
6251 | vmovdqa %ymm2, 1696(%rsp) |
6252 | vmovdqa %ymm3, 1728(%rsp) |
6253 | vmovdqa %ymm9, 1760(%rsp) |
6254 | vmovdqa 0(%rsp), %ymm11 |
6255 | vpunpcklwd const0(%rip), %ymm11, %ymm8 |
6256 | vpunpckhwd const0(%rip), %ymm11, %ymm3 |
6257 | vpslld $1, %ymm8, %ymm8 |
6258 | vpslld $1, %ymm3, %ymm3 |
6259 | vmovdqa 256(%rsp), %ymm4 |
6260 | vpunpcklwd const0(%rip), %ymm4, %ymm10 |
6261 | vpunpckhwd const0(%rip), %ymm4, %ymm4 |
6262 | vmovdqa 512(%rsp), %ymm6 |
6263 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
6264 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
6265 | vpaddd %ymm5, %ymm10, %ymm9 |
6266 | vpaddd %ymm6, %ymm4, %ymm2 |
6267 | vpsubd %ymm8, %ymm9, %ymm9 |
6268 | vpsubd %ymm3, %ymm2, %ymm2 |
6269 | vpsubd %ymm5, %ymm10, %ymm5 |
6270 | vpsubd %ymm6, %ymm4, %ymm6 |
6271 | vpsrld $1, %ymm5, %ymm5 |
6272 | vpsrld $1, %ymm6, %ymm6 |
6273 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
6274 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
6275 | vpackusdw %ymm6, %ymm5, %ymm6 |
6276 | vmovdqa 1536(%rsp), %ymm5 |
6277 | vpunpcklwd const0(%rip), %ymm5, %ymm4 |
6278 | vpunpckhwd const0(%rip), %ymm5, %ymm10 |
6279 | vpslld $1, %ymm4, %ymm4 |
6280 | vpslld $1, %ymm10, %ymm10 |
6281 | vpsubd %ymm4, %ymm9, %ymm9 |
6282 | vpsubd %ymm10, %ymm2, %ymm2 |
6283 | vpsrld $1, %ymm9, %ymm9 |
6284 | vpsrld $1, %ymm2, %ymm2 |
6285 | vpand mask32_to_16(%rip), %ymm9, %ymm9 |
6286 | vpand mask32_to_16(%rip), %ymm2, %ymm2 |
6287 | vpackusdw %ymm2, %ymm9, %ymm2 |
6288 | vmovdqa 768(%rsp), %ymm9 |
6289 | vpaddw 1024(%rsp), %ymm9, %ymm10 |
6290 | vpsubw 1024(%rsp), %ymm9, %ymm9 |
6291 | vpsrlw $2, %ymm9, %ymm9 |
6292 | vpsubw %ymm6, %ymm9, %ymm9 |
6293 | vpmullw %ymm14, %ymm9, %ymm9 |
6294 | vpsllw $1, %ymm11, %ymm4 |
6295 | vpsubw %ymm4, %ymm10, %ymm4 |
6296 | vpsllw $7, %ymm5, %ymm10 |
6297 | vpsubw %ymm10, %ymm4, %ymm10 |
6298 | vpsrlw $3, %ymm10, %ymm10 |
6299 | vpsubw %ymm2, %ymm10, %ymm10 |
6300 | vmovdqa 1280(%rsp), %ymm4 |
6301 | vpsubw %ymm11, %ymm4, %ymm4 |
6302 | vpmullw %ymm15, %ymm5, %ymm3 |
6303 | vpsubw %ymm3, %ymm4, %ymm3 |
6304 | vpmullw %ymm14, %ymm10, %ymm10 |
6305 | vpsubw %ymm10, %ymm2, %ymm2 |
6306 | vpmullw %ymm12, %ymm10, %ymm4 |
6307 | vpaddw %ymm4, %ymm2, %ymm4 |
6308 | vpmullw %ymm12, %ymm4, %ymm4 |
6309 | vpsubw %ymm4, %ymm3, %ymm4 |
6310 | vpmullw %ymm14, %ymm4, %ymm4 |
6311 | vpsubw %ymm6, %ymm4, %ymm4 |
6312 | vpsrlw $3, %ymm4, %ymm4 |
6313 | vpsubw %ymm9, %ymm4, %ymm4 |
6314 | vpsubw %ymm4, %ymm9, %ymm9 |
6315 | vpsubw %ymm9, %ymm6, %ymm6 |
6316 | vpmullw %ymm13, %ymm4, %ymm4 |
6317 | vpsubw %ymm4, %ymm6, %ymm6 |
6318 | vpshufb shuf48_16(%rip), %ymm10, %ymm10 |
6319 | vpand mask3_5_3_5(%rip), %ymm10, %ymm3 |
6320 | vpand mask5_3_5_3(%rip), %ymm10, %ymm10 |
6321 | vpermq $206, %ymm3, %ymm3 |
6322 | vpand mask_keephigh(%rip), %ymm3, %ymm8 |
6323 | vpor %ymm8, %ymm10, %ymm10 |
6324 | vpaddw 2048(%rsp), %ymm11, %ymm11 |
6325 | vpaddw %ymm10, %ymm11, %ymm11 |
6326 | vmovdqa %xmm3, 2048(%rsp) |
6327 | vpshufb shuf48_16(%rip), %ymm4, %ymm4 |
6328 | vpand mask3_5_3_5(%rip), %ymm4, %ymm3 |
6329 | vpand mask5_3_5_3(%rip), %ymm4, %ymm4 |
6330 | vpermq $206, %ymm3, %ymm3 |
6331 | vpand mask_keephigh(%rip), %ymm3, %ymm8 |
6332 | vpor %ymm8, %ymm4, %ymm4 |
6333 | vpaddw 2304(%rsp), %ymm6, %ymm6 |
6334 | vpaddw %ymm4, %ymm6, %ymm6 |
6335 | vmovdqa %xmm3, 2304(%rsp) |
6336 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
6337 | vpand mask3_5_3_5(%rip), %ymm5, %ymm3 |
6338 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
6339 | vpermq $206, %ymm3, %ymm3 |
6340 | vpand mask_keephigh(%rip), %ymm3, %ymm8 |
6341 | vpor %ymm8, %ymm5, %ymm5 |
6342 | vpaddw 2560(%rsp), %ymm2, %ymm2 |
6343 | vpaddw %ymm5, %ymm2, %ymm2 |
6344 | vmovdqa %xmm3, 2560(%rsp) |
6345 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
6346 | vmovdqu %ymm11, 32(%rdi) |
6347 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
6348 | vmovdqu %ymm6, 384(%rdi) |
6349 | vpand mask_mod8192(%rip), %ymm2, %ymm2 |
6350 | vmovdqu %ymm2, 736(%rdi) |
6351 | vpand mask_mod8192(%rip), %ymm9, %ymm9 |
6352 | vmovdqu %ymm9, 1088(%rdi) |
6353 | vmovdqa 32(%rsp), %ymm5 |
6354 | vpunpcklwd const0(%rip), %ymm5, %ymm4 |
6355 | vpunpckhwd const0(%rip), %ymm5, %ymm10 |
6356 | vpslld $1, %ymm4, %ymm4 |
6357 | vpslld $1, %ymm10, %ymm10 |
6358 | vmovdqa 288(%rsp), %ymm9 |
6359 | vpunpcklwd const0(%rip), %ymm9, %ymm2 |
6360 | vpunpckhwd const0(%rip), %ymm9, %ymm9 |
6361 | vmovdqa 544(%rsp), %ymm6 |
6362 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
6363 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
6364 | vpaddd %ymm11, %ymm2, %ymm3 |
6365 | vpaddd %ymm6, %ymm9, %ymm8 |
6366 | vpsubd %ymm4, %ymm3, %ymm3 |
6367 | vpsubd %ymm10, %ymm8, %ymm8 |
6368 | vpsubd %ymm11, %ymm2, %ymm11 |
6369 | vpsubd %ymm6, %ymm9, %ymm6 |
6370 | vpsrld $1, %ymm11, %ymm11 |
6371 | vpsrld $1, %ymm6, %ymm6 |
6372 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
6373 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
6374 | vpackusdw %ymm6, %ymm11, %ymm6 |
6375 | vmovdqa 1568(%rsp), %ymm11 |
6376 | vpunpcklwd const0(%rip), %ymm11, %ymm9 |
6377 | vpunpckhwd const0(%rip), %ymm11, %ymm2 |
6378 | vpslld $1, %ymm9, %ymm9 |
6379 | vpslld $1, %ymm2, %ymm2 |
6380 | vpsubd %ymm9, %ymm3, %ymm3 |
6381 | vpsubd %ymm2, %ymm8, %ymm8 |
6382 | vpsrld $1, %ymm3, %ymm3 |
6383 | vpsrld $1, %ymm8, %ymm8 |
6384 | vpand mask32_to_16(%rip), %ymm3, %ymm3 |
6385 | vpand mask32_to_16(%rip), %ymm8, %ymm8 |
6386 | vpackusdw %ymm8, %ymm3, %ymm8 |
6387 | vmovdqa 800(%rsp), %ymm3 |
6388 | vpaddw 1056(%rsp), %ymm3, %ymm2 |
6389 | vpsubw 1056(%rsp), %ymm3, %ymm3 |
6390 | vpsrlw $2, %ymm3, %ymm3 |
6391 | vpsubw %ymm6, %ymm3, %ymm3 |
6392 | vpmullw %ymm14, %ymm3, %ymm3 |
6393 | vpsllw $1, %ymm5, %ymm9 |
6394 | vpsubw %ymm9, %ymm2, %ymm9 |
6395 | vpsllw $7, %ymm11, %ymm2 |
6396 | vpsubw %ymm2, %ymm9, %ymm2 |
6397 | vpsrlw $3, %ymm2, %ymm2 |
6398 | vpsubw %ymm8, %ymm2, %ymm2 |
6399 | vmovdqa 1312(%rsp), %ymm9 |
6400 | vpsubw %ymm5, %ymm9, %ymm9 |
6401 | vpmullw %ymm15, %ymm11, %ymm10 |
6402 | vpsubw %ymm10, %ymm9, %ymm10 |
6403 | vpmullw %ymm14, %ymm2, %ymm2 |
6404 | vpsubw %ymm2, %ymm8, %ymm8 |
6405 | vpmullw %ymm12, %ymm2, %ymm9 |
6406 | vpaddw %ymm9, %ymm8, %ymm9 |
6407 | vpmullw %ymm12, %ymm9, %ymm9 |
6408 | vpsubw %ymm9, %ymm10, %ymm9 |
6409 | vpmullw %ymm14, %ymm9, %ymm9 |
6410 | vpsubw %ymm6, %ymm9, %ymm9 |
6411 | vpsrlw $3, %ymm9, %ymm9 |
6412 | vpsubw %ymm3, %ymm9, %ymm9 |
6413 | vpsubw %ymm9, %ymm3, %ymm3 |
6414 | vpsubw %ymm3, %ymm6, %ymm6 |
6415 | vpmullw %ymm13, %ymm9, %ymm9 |
6416 | vpsubw %ymm9, %ymm6, %ymm6 |
6417 | vpshufb shuf48_16(%rip), %ymm2, %ymm2 |
6418 | vpand mask3_5_3_5(%rip), %ymm2, %ymm10 |
6419 | vpand mask5_3_5_3(%rip), %ymm2, %ymm2 |
6420 | vpermq $206, %ymm10, %ymm10 |
6421 | vpand mask_keephigh(%rip), %ymm10, %ymm4 |
6422 | vpor %ymm4, %ymm2, %ymm2 |
6423 | vpaddw 2080(%rsp), %ymm5, %ymm5 |
6424 | vpaddw %ymm2, %ymm5, %ymm5 |
6425 | vmovdqa %xmm10, 2080(%rsp) |
6426 | vpshufb shuf48_16(%rip), %ymm9, %ymm9 |
6427 | vpand mask3_5_3_5(%rip), %ymm9, %ymm10 |
6428 | vpand mask5_3_5_3(%rip), %ymm9, %ymm9 |
6429 | vpermq $206, %ymm10, %ymm10 |
6430 | vpand mask_keephigh(%rip), %ymm10, %ymm4 |
6431 | vpor %ymm4, %ymm9, %ymm9 |
6432 | vpaddw 2336(%rsp), %ymm6, %ymm6 |
6433 | vpaddw %ymm9, %ymm6, %ymm6 |
6434 | vmovdqa %xmm10, 2336(%rsp) |
6435 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
6436 | vpand mask3_5_3_5(%rip), %ymm11, %ymm10 |
6437 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
6438 | vpermq $206, %ymm10, %ymm10 |
6439 | vpand mask_keephigh(%rip), %ymm10, %ymm4 |
6440 | vpor %ymm4, %ymm11, %ymm11 |
6441 | vpaddw 2592(%rsp), %ymm8, %ymm8 |
6442 | vpaddw %ymm11, %ymm8, %ymm8 |
6443 | vmovdqa %xmm10, 2592(%rsp) |
6444 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
6445 | vmovdqu %ymm5, 120(%rdi) |
6446 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
6447 | vmovdqu %ymm6, 472(%rdi) |
6448 | vpand mask_mod8192(%rip), %ymm8, %ymm8 |
6449 | vmovdqu %ymm8, 824(%rdi) |
6450 | vpand mask_mod8192(%rip), %ymm3, %ymm3 |
6451 | vmovdqu %ymm3, 1176(%rdi) |
6452 | vmovdqa 64(%rsp), %ymm11 |
6453 | vpunpcklwd const0(%rip), %ymm11, %ymm9 |
6454 | vpunpckhwd const0(%rip), %ymm11, %ymm2 |
6455 | vpslld $1, %ymm9, %ymm9 |
6456 | vpslld $1, %ymm2, %ymm2 |
6457 | vmovdqa 320(%rsp), %ymm3 |
6458 | vpunpcklwd const0(%rip), %ymm3, %ymm8 |
6459 | vpunpckhwd const0(%rip), %ymm3, %ymm3 |
6460 | vmovdqa 576(%rsp), %ymm6 |
6461 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
6462 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
6463 | vpaddd %ymm5, %ymm8, %ymm10 |
6464 | vpaddd %ymm6, %ymm3, %ymm4 |
6465 | vpsubd %ymm9, %ymm10, %ymm10 |
6466 | vpsubd %ymm2, %ymm4, %ymm4 |
6467 | vpsubd %ymm5, %ymm8, %ymm5 |
6468 | vpsubd %ymm6, %ymm3, %ymm6 |
6469 | vpsrld $1, %ymm5, %ymm5 |
6470 | vpsrld $1, %ymm6, %ymm6 |
6471 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
6472 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
6473 | vpackusdw %ymm6, %ymm5, %ymm6 |
6474 | vmovdqa 1600(%rsp), %ymm5 |
6475 | vpunpcklwd const0(%rip), %ymm5, %ymm3 |
6476 | vpunpckhwd const0(%rip), %ymm5, %ymm8 |
6477 | vpslld $1, %ymm3, %ymm3 |
6478 | vpslld $1, %ymm8, %ymm8 |
6479 | vpsubd %ymm3, %ymm10, %ymm10 |
6480 | vpsubd %ymm8, %ymm4, %ymm4 |
6481 | vpsrld $1, %ymm10, %ymm10 |
6482 | vpsrld $1, %ymm4, %ymm4 |
6483 | vpand mask32_to_16(%rip), %ymm10, %ymm10 |
6484 | vpand mask32_to_16(%rip), %ymm4, %ymm4 |
6485 | vpackusdw %ymm4, %ymm10, %ymm4 |
6486 | vmovdqa 832(%rsp), %ymm10 |
6487 | vpaddw 1088(%rsp), %ymm10, %ymm8 |
6488 | vpsubw 1088(%rsp), %ymm10, %ymm10 |
6489 | vpsrlw $2, %ymm10, %ymm10 |
6490 | vpsubw %ymm6, %ymm10, %ymm10 |
6491 | vpmullw %ymm14, %ymm10, %ymm10 |
6492 | vpsllw $1, %ymm11, %ymm3 |
6493 | vpsubw %ymm3, %ymm8, %ymm3 |
6494 | vpsllw $7, %ymm5, %ymm8 |
6495 | vpsubw %ymm8, %ymm3, %ymm8 |
6496 | vpsrlw $3, %ymm8, %ymm8 |
6497 | vpsubw %ymm4, %ymm8, %ymm8 |
6498 | vmovdqa 1344(%rsp), %ymm3 |
6499 | vpsubw %ymm11, %ymm3, %ymm3 |
6500 | vpmullw %ymm15, %ymm5, %ymm2 |
6501 | vpsubw %ymm2, %ymm3, %ymm2 |
6502 | vpmullw %ymm14, %ymm8, %ymm8 |
6503 | vpsubw %ymm8, %ymm4, %ymm4 |
6504 | vpmullw %ymm12, %ymm8, %ymm3 |
6505 | vpaddw %ymm3, %ymm4, %ymm3 |
6506 | vpmullw %ymm12, %ymm3, %ymm3 |
6507 | vpsubw %ymm3, %ymm2, %ymm3 |
6508 | vpmullw %ymm14, %ymm3, %ymm3 |
6509 | vpsubw %ymm6, %ymm3, %ymm3 |
6510 | vpsrlw $3, %ymm3, %ymm3 |
6511 | vpsubw %ymm10, %ymm3, %ymm3 |
6512 | vpsubw %ymm3, %ymm10, %ymm10 |
6513 | vpsubw %ymm10, %ymm6, %ymm6 |
6514 | vpmullw %ymm13, %ymm3, %ymm3 |
6515 | vpsubw %ymm3, %ymm6, %ymm6 |
6516 | vpshufb shuf48_16(%rip), %ymm8, %ymm8 |
6517 | vpand mask3_5_3_5(%rip), %ymm8, %ymm2 |
6518 | vpand mask5_3_5_3(%rip), %ymm8, %ymm8 |
6519 | vpermq $206, %ymm2, %ymm2 |
6520 | vpand mask_keephigh(%rip), %ymm2, %ymm9 |
6521 | vpor %ymm9, %ymm8, %ymm8 |
6522 | vpaddw 2112(%rsp), %ymm11, %ymm11 |
6523 | vpaddw %ymm8, %ymm11, %ymm11 |
6524 | vmovdqa %xmm2, 2112(%rsp) |
6525 | vpshufb shuf48_16(%rip), %ymm3, %ymm3 |
6526 | vpand mask3_5_3_5(%rip), %ymm3, %ymm2 |
6527 | vpand mask5_3_5_3(%rip), %ymm3, %ymm3 |
6528 | vpermq $206, %ymm2, %ymm2 |
6529 | vpand mask_keephigh(%rip), %ymm2, %ymm9 |
6530 | vpor %ymm9, %ymm3, %ymm3 |
6531 | vpaddw 2368(%rsp), %ymm6, %ymm6 |
6532 | vpaddw %ymm3, %ymm6, %ymm6 |
6533 | vmovdqa %xmm2, 2368(%rsp) |
6534 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
6535 | vpand mask3_5_3_5(%rip), %ymm5, %ymm2 |
6536 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
6537 | vpermq $206, %ymm2, %ymm2 |
6538 | vpand mask_keephigh(%rip), %ymm2, %ymm9 |
6539 | vpor %ymm9, %ymm5, %ymm5 |
6540 | vpaddw 2624(%rsp), %ymm4, %ymm4 |
6541 | vpaddw %ymm5, %ymm4, %ymm4 |
6542 | vmovdqa %xmm2, 2624(%rsp) |
6543 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
6544 | vmovdqu %ymm11, 208(%rdi) |
6545 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
6546 | vmovdqu %ymm6, 560(%rdi) |
6547 | vpand mask_mod8192(%rip), %ymm4, %ymm4 |
6548 | vmovdqu %ymm4, 912(%rdi) |
6549 | vpand mask_mod8192(%rip), %ymm10, %ymm10 |
6550 | vmovdqu %ymm10, 1264(%rdi) |
6551 | vmovdqa 96(%rsp), %ymm5 |
6552 | vpunpcklwd const0(%rip), %ymm5, %ymm3 |
6553 | vpunpckhwd const0(%rip), %ymm5, %ymm8 |
6554 | vpslld $1, %ymm3, %ymm3 |
6555 | vpslld $1, %ymm8, %ymm8 |
6556 | vmovdqa 352(%rsp), %ymm10 |
6557 | vpunpcklwd const0(%rip), %ymm10, %ymm4 |
6558 | vpunpckhwd const0(%rip), %ymm10, %ymm10 |
6559 | vmovdqa 608(%rsp), %ymm6 |
6560 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
6561 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
6562 | vpaddd %ymm11, %ymm4, %ymm2 |
6563 | vpaddd %ymm6, %ymm10, %ymm9 |
6564 | vpsubd %ymm3, %ymm2, %ymm2 |
6565 | vpsubd %ymm8, %ymm9, %ymm9 |
6566 | vpsubd %ymm11, %ymm4, %ymm11 |
6567 | vpsubd %ymm6, %ymm10, %ymm6 |
6568 | vpsrld $1, %ymm11, %ymm11 |
6569 | vpsrld $1, %ymm6, %ymm6 |
6570 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
6571 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
6572 | vpackusdw %ymm6, %ymm11, %ymm6 |
6573 | vmovdqa 1632(%rsp), %ymm11 |
6574 | vpunpcklwd const0(%rip), %ymm11, %ymm10 |
6575 | vpunpckhwd const0(%rip), %ymm11, %ymm4 |
6576 | vpslld $1, %ymm10, %ymm10 |
6577 | vpslld $1, %ymm4, %ymm4 |
6578 | vpsubd %ymm10, %ymm2, %ymm2 |
6579 | vpsubd %ymm4, %ymm9, %ymm9 |
6580 | vpsrld $1, %ymm2, %ymm2 |
6581 | vpsrld $1, %ymm9, %ymm9 |
6582 | vpand mask32_to_16(%rip), %ymm2, %ymm2 |
6583 | vpand mask32_to_16(%rip), %ymm9, %ymm9 |
6584 | vpackusdw %ymm9, %ymm2, %ymm9 |
6585 | vmovdqa 864(%rsp), %ymm2 |
6586 | vpaddw 1120(%rsp), %ymm2, %ymm4 |
6587 | vpsubw 1120(%rsp), %ymm2, %ymm2 |
6588 | vpsrlw $2, %ymm2, %ymm2 |
6589 | vpsubw %ymm6, %ymm2, %ymm2 |
6590 | vpmullw %ymm14, %ymm2, %ymm2 |
6591 | vpsllw $1, %ymm5, %ymm10 |
6592 | vpsubw %ymm10, %ymm4, %ymm10 |
6593 | vpsllw $7, %ymm11, %ymm4 |
6594 | vpsubw %ymm4, %ymm10, %ymm4 |
6595 | vpsrlw $3, %ymm4, %ymm4 |
6596 | vpsubw %ymm9, %ymm4, %ymm4 |
6597 | vmovdqa 1376(%rsp), %ymm10 |
6598 | vpsubw %ymm5, %ymm10, %ymm10 |
6599 | vpmullw %ymm15, %ymm11, %ymm8 |
6600 | vpsubw %ymm8, %ymm10, %ymm8 |
6601 | vpmullw %ymm14, %ymm4, %ymm4 |
6602 | vpsubw %ymm4, %ymm9, %ymm9 |
6603 | vpmullw %ymm12, %ymm4, %ymm10 |
6604 | vpaddw %ymm10, %ymm9, %ymm10 |
6605 | vpmullw %ymm12, %ymm10, %ymm10 |
6606 | vpsubw %ymm10, %ymm8, %ymm10 |
6607 | vpmullw %ymm14, %ymm10, %ymm10 |
6608 | vpsubw %ymm6, %ymm10, %ymm10 |
6609 | vpsrlw $3, %ymm10, %ymm10 |
6610 | vpsubw %ymm2, %ymm10, %ymm10 |
6611 | vpsubw %ymm10, %ymm2, %ymm2 |
6612 | vpsubw %ymm2, %ymm6, %ymm6 |
6613 | vpmullw %ymm13, %ymm10, %ymm10 |
6614 | vpsubw %ymm10, %ymm6, %ymm6 |
6615 | vpshufb shuf48_16(%rip), %ymm4, %ymm4 |
6616 | vpand mask3_5_3_5(%rip), %ymm4, %ymm8 |
6617 | vpand mask5_3_5_3(%rip), %ymm4, %ymm4 |
6618 | vpermq $206, %ymm8, %ymm8 |
6619 | vpand mask_keephigh(%rip), %ymm8, %ymm3 |
6620 | vpor %ymm3, %ymm4, %ymm4 |
6621 | vpaddw 2144(%rsp), %ymm5, %ymm5 |
6622 | vpaddw %ymm4, %ymm5, %ymm5 |
6623 | vmovdqa %xmm8, 2144(%rsp) |
6624 | vpshufb shuf48_16(%rip), %ymm10, %ymm10 |
6625 | vpand mask3_5_3_5(%rip), %ymm10, %ymm8 |
6626 | vpand mask5_3_5_3(%rip), %ymm10, %ymm10 |
6627 | vpermq $206, %ymm8, %ymm8 |
6628 | vpand mask_keephigh(%rip), %ymm8, %ymm3 |
6629 | vpor %ymm3, %ymm10, %ymm10 |
6630 | vpaddw 2400(%rsp), %ymm6, %ymm6 |
6631 | vpaddw %ymm10, %ymm6, %ymm6 |
6632 | vmovdqa %xmm8, 2400(%rsp) |
6633 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
6634 | vpand mask3_5_3_5(%rip), %ymm11, %ymm8 |
6635 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
6636 | vpermq $206, %ymm8, %ymm8 |
6637 | vpand mask_keephigh(%rip), %ymm8, %ymm3 |
6638 | vpor %ymm3, %ymm11, %ymm11 |
6639 | vpaddw 2656(%rsp), %ymm9, %ymm9 |
6640 | vpaddw %ymm11, %ymm9, %ymm9 |
6641 | vmovdqa %xmm8, 2656(%rsp) |
6642 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
6643 | vmovdqu %ymm5, 296(%rdi) |
6644 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
6645 | vmovdqu %ymm6, 648(%rdi) |
6646 | vpand mask_mod8192(%rip), %ymm9, %ymm9 |
6647 | vmovdqu %ymm9, 1000(%rdi) |
6648 | vpand mask_mod8192(%rip), %ymm2, %ymm2 |
6649 | vmovdqu %ymm2, 1352(%rdi) |
6650 | vmovdqa 128(%rsp), %ymm11 |
6651 | vpunpcklwd const0(%rip), %ymm11, %ymm10 |
6652 | vpunpckhwd const0(%rip), %ymm11, %ymm4 |
6653 | vpslld $1, %ymm10, %ymm10 |
6654 | vpslld $1, %ymm4, %ymm4 |
6655 | vmovdqa 384(%rsp), %ymm2 |
6656 | vpunpcklwd const0(%rip), %ymm2, %ymm9 |
6657 | vpunpckhwd const0(%rip), %ymm2, %ymm2 |
6658 | vmovdqa 640(%rsp), %ymm6 |
6659 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
6660 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
6661 | vpaddd %ymm5, %ymm9, %ymm8 |
6662 | vpaddd %ymm6, %ymm2, %ymm3 |
6663 | vpsubd %ymm10, %ymm8, %ymm8 |
6664 | vpsubd %ymm4, %ymm3, %ymm3 |
6665 | vpsubd %ymm5, %ymm9, %ymm5 |
6666 | vpsubd %ymm6, %ymm2, %ymm6 |
6667 | vpsrld $1, %ymm5, %ymm5 |
6668 | vpsrld $1, %ymm6, %ymm6 |
6669 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
6670 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
6671 | vpackusdw %ymm6, %ymm5, %ymm6 |
6672 | vmovdqa 1664(%rsp), %ymm5 |
6673 | vpunpcklwd const0(%rip), %ymm5, %ymm2 |
6674 | vpunpckhwd const0(%rip), %ymm5, %ymm9 |
6675 | vpslld $1, %ymm2, %ymm2 |
6676 | vpslld $1, %ymm9, %ymm9 |
6677 | vpsubd %ymm2, %ymm8, %ymm8 |
6678 | vpsubd %ymm9, %ymm3, %ymm3 |
6679 | vpsrld $1, %ymm8, %ymm8 |
6680 | vpsrld $1, %ymm3, %ymm3 |
6681 | vpand mask32_to_16(%rip), %ymm8, %ymm8 |
6682 | vpand mask32_to_16(%rip), %ymm3, %ymm3 |
6683 | vpackusdw %ymm3, %ymm8, %ymm3 |
6684 | vmovdqa 896(%rsp), %ymm8 |
6685 | vpaddw 1152(%rsp), %ymm8, %ymm9 |
6686 | vpsubw 1152(%rsp), %ymm8, %ymm8 |
6687 | vpsrlw $2, %ymm8, %ymm8 |
6688 | vpsubw %ymm6, %ymm8, %ymm8 |
6689 | vpmullw %ymm14, %ymm8, %ymm8 |
6690 | vpsllw $1, %ymm11, %ymm2 |
6691 | vpsubw %ymm2, %ymm9, %ymm2 |
6692 | vpsllw $7, %ymm5, %ymm9 |
6693 | vpsubw %ymm9, %ymm2, %ymm9 |
6694 | vpsrlw $3, %ymm9, %ymm9 |
6695 | vpsubw %ymm3, %ymm9, %ymm9 |
6696 | vmovdqa 1408(%rsp), %ymm2 |
6697 | vpsubw %ymm11, %ymm2, %ymm2 |
6698 | vpmullw %ymm15, %ymm5, %ymm4 |
6699 | vpsubw %ymm4, %ymm2, %ymm4 |
6700 | vpmullw %ymm14, %ymm9, %ymm9 |
6701 | vpsubw %ymm9, %ymm3, %ymm3 |
6702 | vpmullw %ymm12, %ymm9, %ymm2 |
6703 | vpaddw %ymm2, %ymm3, %ymm2 |
6704 | vpmullw %ymm12, %ymm2, %ymm2 |
6705 | vpsubw %ymm2, %ymm4, %ymm2 |
6706 | vpmullw %ymm14, %ymm2, %ymm2 |
6707 | vpsubw %ymm6, %ymm2, %ymm2 |
6708 | vpsrlw $3, %ymm2, %ymm2 |
6709 | vpsubw %ymm8, %ymm2, %ymm2 |
6710 | vpsubw %ymm2, %ymm8, %ymm8 |
6711 | vpsubw %ymm8, %ymm6, %ymm6 |
6712 | vpmullw %ymm13, %ymm2, %ymm2 |
6713 | vpsubw %ymm2, %ymm6, %ymm6 |
6714 | vmovdqu 384(%rdi), %ymm4 |
6715 | vmovdqu 736(%rdi), %ymm10 |
6716 | vmovdqu 1088(%rdi), %ymm7 |
6717 | vpaddw %ymm11, %ymm4, %ymm11 |
6718 | vpaddw %ymm6, %ymm10, %ymm6 |
6719 | vpaddw %ymm3, %ymm7, %ymm3 |
6720 | vpshufb shuf48_16(%rip), %ymm8, %ymm8 |
6721 | vpand mask3_5_3_5(%rip), %ymm8, %ymm7 |
6722 | vpand mask5_3_5_3(%rip), %ymm8, %ymm8 |
6723 | vpermq $206, %ymm7, %ymm7 |
6724 | vpand mask_keephigh(%rip), %ymm7, %ymm10 |
6725 | vpor %ymm10, %ymm8, %ymm8 |
6726 | vmovdqu 32(%rdi), %ymm10 |
6727 | vpaddw 1920(%rsp), %ymm10, %ymm10 |
6728 | vpaddw %ymm8, %ymm10, %ymm10 |
6729 | vpand mask_mod8192(%rip), %ymm10, %ymm10 |
6730 | vmovdqu %ymm10, 32(%rdi) |
6731 | vmovdqa %xmm7, 1920(%rsp) |
6732 | vpshufb shuf48_16(%rip), %ymm9, %ymm9 |
6733 | vpand mask3_5_3_5(%rip), %ymm9, %ymm7 |
6734 | vpand mask5_3_5_3(%rip), %ymm9, %ymm9 |
6735 | vpermq $206, %ymm7, %ymm7 |
6736 | vpand mask_keephigh(%rip), %ymm7, %ymm10 |
6737 | vpor %ymm10, %ymm9, %ymm9 |
6738 | vpaddw 2176(%rsp), %ymm11, %ymm11 |
6739 | vpaddw %ymm9, %ymm11, %ymm11 |
6740 | vmovdqa %xmm7, 2176(%rsp) |
6741 | vpshufb shuf48_16(%rip), %ymm2, %ymm2 |
6742 | vpand mask3_5_3_5(%rip), %ymm2, %ymm7 |
6743 | vpand mask5_3_5_3(%rip), %ymm2, %ymm2 |
6744 | vpermq $206, %ymm7, %ymm7 |
6745 | vpand mask_keephigh(%rip), %ymm7, %ymm10 |
6746 | vpor %ymm10, %ymm2, %ymm2 |
6747 | vpaddw 2432(%rsp), %ymm6, %ymm6 |
6748 | vpaddw %ymm2, %ymm6, %ymm6 |
6749 | vmovdqa %xmm7, 2432(%rsp) |
6750 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
6751 | vpand mask3_5_3_5(%rip), %ymm5, %ymm7 |
6752 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
6753 | vpermq $206, %ymm7, %ymm7 |
6754 | vpand mask_keephigh(%rip), %ymm7, %ymm10 |
6755 | vpor %ymm10, %ymm5, %ymm5 |
6756 | vpaddw 2688(%rsp), %ymm3, %ymm3 |
6757 | vpaddw %ymm5, %ymm3, %ymm3 |
6758 | vmovdqa %xmm7, 2688(%rsp) |
6759 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
6760 | vmovdqu %ymm11, 384(%rdi) |
6761 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
6762 | vmovdqu %ymm6, 736(%rdi) |
6763 | vpand mask_mod8192(%rip), %ymm3, %ymm3 |
6764 | vmovdqu %ymm3, 1088(%rdi) |
6765 | vmovdqa 160(%rsp), %ymm5 |
6766 | vpunpcklwd const0(%rip), %ymm5, %ymm2 |
6767 | vpunpckhwd const0(%rip), %ymm5, %ymm9 |
6768 | vpslld $1, %ymm2, %ymm2 |
6769 | vpslld $1, %ymm9, %ymm9 |
6770 | vmovdqa 416(%rsp), %ymm8 |
6771 | vpunpcklwd const0(%rip), %ymm8, %ymm3 |
6772 | vpunpckhwd const0(%rip), %ymm8, %ymm8 |
6773 | vmovdqa 672(%rsp), %ymm6 |
6774 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
6775 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
6776 | vpaddd %ymm11, %ymm3, %ymm7 |
6777 | vpaddd %ymm6, %ymm8, %ymm10 |
6778 | vpsubd %ymm2, %ymm7, %ymm7 |
6779 | vpsubd %ymm9, %ymm10, %ymm10 |
6780 | vpsubd %ymm11, %ymm3, %ymm11 |
6781 | vpsubd %ymm6, %ymm8, %ymm6 |
6782 | vpsrld $1, %ymm11, %ymm11 |
6783 | vpsrld $1, %ymm6, %ymm6 |
6784 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
6785 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
6786 | vpackusdw %ymm6, %ymm11, %ymm6 |
6787 | vmovdqa 1696(%rsp), %ymm11 |
6788 | vpunpcklwd const0(%rip), %ymm11, %ymm8 |
6789 | vpunpckhwd const0(%rip), %ymm11, %ymm3 |
6790 | vpslld $1, %ymm8, %ymm8 |
6791 | vpslld $1, %ymm3, %ymm3 |
6792 | vpsubd %ymm8, %ymm7, %ymm7 |
6793 | vpsubd %ymm3, %ymm10, %ymm10 |
6794 | vpsrld $1, %ymm7, %ymm7 |
6795 | vpsrld $1, %ymm10, %ymm10 |
6796 | vpand mask32_to_16(%rip), %ymm7, %ymm7 |
6797 | vpand mask32_to_16(%rip), %ymm10, %ymm10 |
6798 | vpackusdw %ymm10, %ymm7, %ymm10 |
6799 | vmovdqa 928(%rsp), %ymm7 |
6800 | vpaddw 1184(%rsp), %ymm7, %ymm3 |
6801 | vpsubw 1184(%rsp), %ymm7, %ymm7 |
6802 | vpsrlw $2, %ymm7, %ymm7 |
6803 | vpsubw %ymm6, %ymm7, %ymm7 |
6804 | vpmullw %ymm14, %ymm7, %ymm7 |
6805 | vpsllw $1, %ymm5, %ymm8 |
6806 | vpsubw %ymm8, %ymm3, %ymm8 |
6807 | vpsllw $7, %ymm11, %ymm3 |
6808 | vpsubw %ymm3, %ymm8, %ymm3 |
6809 | vpsrlw $3, %ymm3, %ymm3 |
6810 | vpsubw %ymm10, %ymm3, %ymm3 |
6811 | vmovdqa 1440(%rsp), %ymm8 |
6812 | vpsubw %ymm5, %ymm8, %ymm8 |
6813 | vpmullw %ymm15, %ymm11, %ymm9 |
6814 | vpsubw %ymm9, %ymm8, %ymm9 |
6815 | vpmullw %ymm14, %ymm3, %ymm3 |
6816 | vpsubw %ymm3, %ymm10, %ymm10 |
6817 | vpmullw %ymm12, %ymm3, %ymm8 |
6818 | vpaddw %ymm8, %ymm10, %ymm8 |
6819 | vpmullw %ymm12, %ymm8, %ymm8 |
6820 | vpsubw %ymm8, %ymm9, %ymm8 |
6821 | vpmullw %ymm14, %ymm8, %ymm8 |
6822 | vpsubw %ymm6, %ymm8, %ymm8 |
6823 | vpsrlw $3, %ymm8, %ymm8 |
6824 | vpsubw %ymm7, %ymm8, %ymm8 |
6825 | vpsubw %ymm8, %ymm7, %ymm7 |
6826 | vpsubw %ymm7, %ymm6, %ymm6 |
6827 | vpmullw %ymm13, %ymm8, %ymm8 |
6828 | vpsubw %ymm8, %ymm6, %ymm6 |
6829 | vmovdqu 472(%rdi), %ymm9 |
6830 | vmovdqu 824(%rdi), %ymm2 |
6831 | vmovdqu 1176(%rdi), %ymm4 |
6832 | vpaddw %ymm5, %ymm9, %ymm5 |
6833 | vpaddw %ymm6, %ymm2, %ymm6 |
6834 | vpaddw %ymm10, %ymm4, %ymm10 |
6835 | vpshufb shuf48_16(%rip), %ymm7, %ymm7 |
6836 | vpand mask3_5_3_5(%rip), %ymm7, %ymm4 |
6837 | vpand mask5_3_5_3(%rip), %ymm7, %ymm7 |
6838 | vpermq $206, %ymm4, %ymm4 |
6839 | vpand mask_keephigh(%rip), %ymm4, %ymm2 |
6840 | vpor %ymm2, %ymm7, %ymm7 |
6841 | vmovdqu 120(%rdi), %ymm2 |
6842 | vpaddw 1952(%rsp), %ymm2, %ymm2 |
6843 | vpaddw %ymm7, %ymm2, %ymm2 |
6844 | vpand mask_mod8192(%rip), %ymm2, %ymm2 |
6845 | vmovdqu %ymm2, 120(%rdi) |
6846 | vmovdqa %xmm4, 1952(%rsp) |
6847 | vpshufb shuf48_16(%rip), %ymm3, %ymm3 |
6848 | vpand mask3_5_3_5(%rip), %ymm3, %ymm4 |
6849 | vpand mask5_3_5_3(%rip), %ymm3, %ymm3 |
6850 | vpermq $206, %ymm4, %ymm4 |
6851 | vpand mask_keephigh(%rip), %ymm4, %ymm2 |
6852 | vpor %ymm2, %ymm3, %ymm3 |
6853 | vpaddw 2208(%rsp), %ymm5, %ymm5 |
6854 | vpaddw %ymm3, %ymm5, %ymm5 |
6855 | vmovdqa %xmm4, 2208(%rsp) |
6856 | vpshufb shuf48_16(%rip), %ymm8, %ymm8 |
6857 | vpand mask3_5_3_5(%rip), %ymm8, %ymm4 |
6858 | vpand mask5_3_5_3(%rip), %ymm8, %ymm8 |
6859 | vpermq $206, %ymm4, %ymm4 |
6860 | vpand mask_keephigh(%rip), %ymm4, %ymm2 |
6861 | vpor %ymm2, %ymm8, %ymm8 |
6862 | vpaddw 2464(%rsp), %ymm6, %ymm6 |
6863 | vpaddw %ymm8, %ymm6, %ymm6 |
6864 | vmovdqa %xmm4, 2464(%rsp) |
6865 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
6866 | vpand mask3_5_3_5(%rip), %ymm11, %ymm4 |
6867 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
6868 | vpermq $206, %ymm4, %ymm4 |
6869 | vpand mask_keephigh(%rip), %ymm4, %ymm2 |
6870 | vpor %ymm2, %ymm11, %ymm11 |
6871 | vpaddw 2720(%rsp), %ymm10, %ymm10 |
6872 | vpaddw %ymm11, %ymm10, %ymm10 |
6873 | vmovdqa %xmm4, 2720(%rsp) |
6874 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
6875 | vmovdqu %ymm5, 472(%rdi) |
6876 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
6877 | vmovdqu %ymm6, 824(%rdi) |
6878 | vpand mask_mod8192(%rip), %ymm10, %ymm10 |
6879 | vmovdqu %ymm10, 1176(%rdi) |
6880 | vmovdqa 192(%rsp), %ymm11 |
6881 | vpunpcklwd const0(%rip), %ymm11, %ymm8 |
6882 | vpunpckhwd const0(%rip), %ymm11, %ymm3 |
6883 | vpslld $1, %ymm8, %ymm8 |
6884 | vpslld $1, %ymm3, %ymm3 |
6885 | vmovdqa 448(%rsp), %ymm7 |
6886 | vpunpcklwd const0(%rip), %ymm7, %ymm10 |
6887 | vpunpckhwd const0(%rip), %ymm7, %ymm7 |
6888 | vmovdqa 704(%rsp), %ymm6 |
6889 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
6890 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
6891 | vpaddd %ymm5, %ymm10, %ymm4 |
6892 | vpaddd %ymm6, %ymm7, %ymm2 |
6893 | vpsubd %ymm8, %ymm4, %ymm4 |
6894 | vpsubd %ymm3, %ymm2, %ymm2 |
6895 | vpsubd %ymm5, %ymm10, %ymm5 |
6896 | vpsubd %ymm6, %ymm7, %ymm6 |
6897 | vpsrld $1, %ymm5, %ymm5 |
6898 | vpsrld $1, %ymm6, %ymm6 |
6899 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
6900 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
6901 | vpackusdw %ymm6, %ymm5, %ymm6 |
6902 | vmovdqa 1728(%rsp), %ymm5 |
6903 | vpunpcklwd const0(%rip), %ymm5, %ymm7 |
6904 | vpunpckhwd const0(%rip), %ymm5, %ymm10 |
6905 | vpslld $1, %ymm7, %ymm7 |
6906 | vpslld $1, %ymm10, %ymm10 |
6907 | vpsubd %ymm7, %ymm4, %ymm4 |
6908 | vpsubd %ymm10, %ymm2, %ymm2 |
6909 | vpsrld $1, %ymm4, %ymm4 |
6910 | vpsrld $1, %ymm2, %ymm2 |
6911 | vpand mask32_to_16(%rip), %ymm4, %ymm4 |
6912 | vpand mask32_to_16(%rip), %ymm2, %ymm2 |
6913 | vpackusdw %ymm2, %ymm4, %ymm2 |
6914 | vmovdqa 960(%rsp), %ymm4 |
6915 | vpaddw 1216(%rsp), %ymm4, %ymm10 |
6916 | vpsubw 1216(%rsp), %ymm4, %ymm4 |
6917 | vpsrlw $2, %ymm4, %ymm4 |
6918 | vpsubw %ymm6, %ymm4, %ymm4 |
6919 | vpmullw %ymm14, %ymm4, %ymm4 |
6920 | vpsllw $1, %ymm11, %ymm7 |
6921 | vpsubw %ymm7, %ymm10, %ymm7 |
6922 | vpsllw $7, %ymm5, %ymm10 |
6923 | vpsubw %ymm10, %ymm7, %ymm10 |
6924 | vpsrlw $3, %ymm10, %ymm10 |
6925 | vpsubw %ymm2, %ymm10, %ymm10 |
6926 | vmovdqa 1472(%rsp), %ymm7 |
6927 | vpsubw %ymm11, %ymm7, %ymm7 |
6928 | vpmullw %ymm15, %ymm5, %ymm3 |
6929 | vpsubw %ymm3, %ymm7, %ymm3 |
6930 | vpmullw %ymm14, %ymm10, %ymm10 |
6931 | vpsubw %ymm10, %ymm2, %ymm2 |
6932 | vpmullw %ymm12, %ymm10, %ymm7 |
6933 | vpaddw %ymm7, %ymm2, %ymm7 |
6934 | vpmullw %ymm12, %ymm7, %ymm7 |
6935 | vpsubw %ymm7, %ymm3, %ymm7 |
6936 | vpmullw %ymm14, %ymm7, %ymm7 |
6937 | vpsubw %ymm6, %ymm7, %ymm7 |
6938 | vpsrlw $3, %ymm7, %ymm7 |
6939 | vpsubw %ymm4, %ymm7, %ymm7 |
6940 | vpsubw %ymm7, %ymm4, %ymm4 |
6941 | vpsubw %ymm4, %ymm6, %ymm6 |
6942 | vpmullw %ymm13, %ymm7, %ymm7 |
6943 | vpsubw %ymm7, %ymm6, %ymm6 |
6944 | vmovdqu 560(%rdi), %ymm3 |
6945 | vmovdqu 912(%rdi), %ymm8 |
6946 | vmovdqu 1264(%rdi), %ymm9 |
6947 | vpaddw %ymm11, %ymm3, %ymm11 |
6948 | vpaddw %ymm6, %ymm8, %ymm6 |
6949 | vpaddw %ymm2, %ymm9, %ymm2 |
6950 | vpshufb shuf48_16(%rip), %ymm4, %ymm4 |
6951 | vpand mask3_5_3_5(%rip), %ymm4, %ymm9 |
6952 | vpand mask5_3_5_3(%rip), %ymm4, %ymm4 |
6953 | vpermq $206, %ymm9, %ymm9 |
6954 | vpand mask_keephigh(%rip), %ymm9, %ymm8 |
6955 | vpor %ymm8, %ymm4, %ymm4 |
6956 | vmovdqu 208(%rdi), %ymm8 |
6957 | vpaddw 1984(%rsp), %ymm8, %ymm8 |
6958 | vpaddw %ymm4, %ymm8, %ymm8 |
6959 | vpand mask_mod8192(%rip), %ymm8, %ymm8 |
6960 | vmovdqu %ymm8, 208(%rdi) |
6961 | vmovdqa %xmm9, 1984(%rsp) |
6962 | vpshufb shuf48_16(%rip), %ymm10, %ymm10 |
6963 | vpand mask3_5_3_5(%rip), %ymm10, %ymm9 |
6964 | vpand mask5_3_5_3(%rip), %ymm10, %ymm10 |
6965 | vpermq $206, %ymm9, %ymm9 |
6966 | vpand mask_keephigh(%rip), %ymm9, %ymm8 |
6967 | vpor %ymm8, %ymm10, %ymm10 |
6968 | vpaddw 2240(%rsp), %ymm11, %ymm11 |
6969 | vpaddw %ymm10, %ymm11, %ymm11 |
6970 | vmovdqa %xmm9, 2240(%rsp) |
6971 | vpshufb shuf48_16(%rip), %ymm7, %ymm7 |
6972 | vpand mask3_5_3_5(%rip), %ymm7, %ymm9 |
6973 | vpand mask5_3_5_3(%rip), %ymm7, %ymm7 |
6974 | vpermq $206, %ymm9, %ymm9 |
6975 | vpand mask_keephigh(%rip), %ymm9, %ymm8 |
6976 | vpor %ymm8, %ymm7, %ymm7 |
6977 | vpaddw 2496(%rsp), %ymm6, %ymm6 |
6978 | vpaddw %ymm7, %ymm6, %ymm6 |
6979 | vmovdqa %xmm9, 2496(%rsp) |
6980 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
6981 | vpand mask3_5_3_5(%rip), %ymm5, %ymm9 |
6982 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
6983 | vpermq $206, %ymm9, %ymm9 |
6984 | vpand mask_keephigh(%rip), %ymm9, %ymm8 |
6985 | vpor %ymm8, %ymm5, %ymm5 |
6986 | vpaddw 2752(%rsp), %ymm2, %ymm2 |
6987 | vpaddw %ymm5, %ymm2, %ymm2 |
6988 | vmovdqa %xmm9, 2752(%rsp) |
6989 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
6990 | vmovdqu %ymm11, 560(%rdi) |
6991 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
6992 | vmovdqu %ymm6, 912(%rdi) |
6993 | vpand mask_mod8192(%rip), %ymm2, %ymm2 |
6994 | vmovdqu %ymm2, 1264(%rdi) |
6995 | vmovdqa 224(%rsp), %ymm5 |
6996 | vpunpcklwd const0(%rip), %ymm5, %ymm7 |
6997 | vpunpckhwd const0(%rip), %ymm5, %ymm10 |
6998 | vpslld $1, %ymm7, %ymm7 |
6999 | vpslld $1, %ymm10, %ymm10 |
7000 | vmovdqa 480(%rsp), %ymm4 |
7001 | vpunpcklwd const0(%rip), %ymm4, %ymm2 |
7002 | vpunpckhwd const0(%rip), %ymm4, %ymm4 |
7003 | vmovdqa 736(%rsp), %ymm6 |
7004 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
7005 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
7006 | vpaddd %ymm11, %ymm2, %ymm9 |
7007 | vpaddd %ymm6, %ymm4, %ymm8 |
7008 | vpsubd %ymm7, %ymm9, %ymm9 |
7009 | vpsubd %ymm10, %ymm8, %ymm8 |
7010 | vpsubd %ymm11, %ymm2, %ymm11 |
7011 | vpsubd %ymm6, %ymm4, %ymm6 |
7012 | vpsrld $1, %ymm11, %ymm11 |
7013 | vpsrld $1, %ymm6, %ymm6 |
7014 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
7015 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
7016 | vpackusdw %ymm6, %ymm11, %ymm6 |
7017 | vmovdqa 1760(%rsp), %ymm11 |
7018 | vpunpcklwd const0(%rip), %ymm11, %ymm4 |
7019 | vpunpckhwd const0(%rip), %ymm11, %ymm2 |
7020 | vpslld $1, %ymm4, %ymm4 |
7021 | vpslld $1, %ymm2, %ymm2 |
7022 | vpsubd %ymm4, %ymm9, %ymm9 |
7023 | vpsubd %ymm2, %ymm8, %ymm8 |
7024 | vpsrld $1, %ymm9, %ymm9 |
7025 | vpsrld $1, %ymm8, %ymm8 |
7026 | vpand mask32_to_16(%rip), %ymm9, %ymm9 |
7027 | vpand mask32_to_16(%rip), %ymm8, %ymm8 |
7028 | vpackusdw %ymm8, %ymm9, %ymm8 |
7029 | vmovdqa 992(%rsp), %ymm9 |
7030 | vpaddw 1248(%rsp), %ymm9, %ymm2 |
7031 | vpsubw 1248(%rsp), %ymm9, %ymm9 |
7032 | vpsrlw $2, %ymm9, %ymm9 |
7033 | vpsubw %ymm6, %ymm9, %ymm9 |
7034 | vpmullw %ymm14, %ymm9, %ymm9 |
7035 | vpsllw $1, %ymm5, %ymm4 |
7036 | vpsubw %ymm4, %ymm2, %ymm4 |
7037 | vpsllw $7, %ymm11, %ymm2 |
7038 | vpsubw %ymm2, %ymm4, %ymm2 |
7039 | vpsrlw $3, %ymm2, %ymm2 |
7040 | vpsubw %ymm8, %ymm2, %ymm2 |
7041 | vmovdqa 1504(%rsp), %ymm4 |
7042 | vpsubw %ymm5, %ymm4, %ymm4 |
7043 | vpmullw %ymm15, %ymm11, %ymm10 |
7044 | vpsubw %ymm10, %ymm4, %ymm10 |
7045 | vpmullw %ymm14, %ymm2, %ymm2 |
7046 | vpsubw %ymm2, %ymm8, %ymm8 |
7047 | vpmullw %ymm12, %ymm2, %ymm4 |
7048 | vpaddw %ymm4, %ymm8, %ymm4 |
7049 | vpmullw %ymm12, %ymm4, %ymm4 |
7050 | vpsubw %ymm4, %ymm10, %ymm4 |
7051 | vpmullw %ymm14, %ymm4, %ymm4 |
7052 | vpsubw %ymm6, %ymm4, %ymm4 |
7053 | vpsrlw $3, %ymm4, %ymm4 |
7054 | vpsubw %ymm9, %ymm4, %ymm4 |
7055 | vpsubw %ymm4, %ymm9, %ymm9 |
7056 | vpsubw %ymm9, %ymm6, %ymm6 |
7057 | vpmullw %ymm13, %ymm4, %ymm4 |
7058 | vpsubw %ymm4, %ymm6, %ymm6 |
7059 | vmovdqu 648(%rdi), %ymm10 |
7060 | vmovdqu 1000(%rdi), %ymm7 |
7061 | vmovdqu 1352(%rdi), %ymm3 |
7062 | vpaddw %ymm5, %ymm10, %ymm5 |
7063 | vpaddw %ymm6, %ymm7, %ymm6 |
7064 | vpaddw %ymm8, %ymm3, %ymm8 |
7065 | vpshufb shuf48_16(%rip), %ymm9, %ymm9 |
7066 | vpand mask3_5_3_5(%rip), %ymm9, %ymm3 |
7067 | vpand mask5_3_5_3(%rip), %ymm9, %ymm9 |
7068 | vpermq $206, %ymm3, %ymm3 |
7069 | vpand mask_keephigh(%rip), %ymm3, %ymm7 |
7070 | vpor %ymm7, %ymm9, %ymm9 |
7071 | vmovdqu 296(%rdi), %ymm7 |
7072 | vpaddw 2016(%rsp), %ymm7, %ymm7 |
7073 | vpaddw %ymm9, %ymm7, %ymm7 |
7074 | vpand mask_mod8192(%rip), %ymm7, %ymm7 |
7075 | vmovdqu %ymm7, 296(%rdi) |
7076 | vmovdqa %xmm3, 2016(%rsp) |
7077 | vpshufb shuf48_16(%rip), %ymm2, %ymm2 |
7078 | vpand mask3_5_3_5(%rip), %ymm2, %ymm3 |
7079 | vpand mask5_3_5_3(%rip), %ymm2, %ymm2 |
7080 | vpermq $206, %ymm3, %ymm3 |
7081 | vpand mask_keephigh(%rip), %ymm3, %ymm7 |
7082 | vpor %ymm7, %ymm2, %ymm2 |
7083 | vpaddw 2272(%rsp), %ymm5, %ymm5 |
7084 | vpaddw %ymm2, %ymm5, %ymm5 |
7085 | vmovdqa %xmm3, 2272(%rsp) |
7086 | vpshufb shuf48_16(%rip), %ymm4, %ymm4 |
7087 | vpand mask3_5_3_5(%rip), %ymm4, %ymm3 |
7088 | vpand mask5_3_5_3(%rip), %ymm4, %ymm4 |
7089 | vpermq $206, %ymm3, %ymm3 |
7090 | vpand mask_keephigh(%rip), %ymm3, %ymm7 |
7091 | vpor %ymm7, %ymm4, %ymm4 |
7092 | vpaddw 2528(%rsp), %ymm6, %ymm6 |
7093 | vpaddw %ymm4, %ymm6, %ymm6 |
7094 | vmovdqa %xmm3, 2528(%rsp) |
7095 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
7096 | vpand mask3_5_3_5(%rip), %ymm11, %ymm3 |
7097 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
7098 | vpermq $206, %ymm3, %ymm3 |
7099 | vpand mask_keephigh(%rip), %ymm3, %ymm7 |
7100 | vpor %ymm7, %ymm11, %ymm11 |
7101 | vpaddw 2784(%rsp), %ymm8, %ymm8 |
7102 | vpaddw %ymm11, %ymm8, %ymm8 |
7103 | vmovdqa %xmm3, 2784(%rsp) |
7104 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
7105 | vmovdqu %ymm5, 648(%rdi) |
7106 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
7107 | vmovdqu %ymm6, 1000(%rdi) |
7108 | vpand mask_mod8192(%rip), %ymm8, %ymm8 |
7109 | vmovdqu %ymm8, 1352(%rdi) |
7110 | vmovdqa 160(%r12), %ymm0 |
7111 | vpsubw 256(%r12), %ymm0, %ymm0 |
7112 | vmovdqa 544(%r12), %ymm1 |
7113 | vpsubw %ymm0, %ymm1, %ymm1 |
7114 | vpsubw 352(%r12), %ymm1, %ymm1 |
7115 | vpsubw 64(%r12), %ymm0, %ymm0 |
7116 | vpaddw 448(%r12), %ymm0, %ymm0 |
7117 | vmovdqa 736(%r12), %ymm2 |
7118 | vpsubw 832(%r12), %ymm2, %ymm2 |
7119 | vmovdqa 1120(%r12), %ymm3 |
7120 | vpsubw %ymm2, %ymm3, %ymm3 |
7121 | vpsubw 928(%r12), %ymm3, %ymm3 |
7122 | vpsubw 640(%r12), %ymm2, %ymm2 |
7123 | vpaddw 1024(%r12), %ymm2, %ymm2 |
7124 | vmovdqa 1312(%r12), %ymm4 |
7125 | vpsubw 1408(%r12), %ymm4, %ymm4 |
7126 | vmovdqa 1696(%r12), %ymm5 |
7127 | vpsubw %ymm4, %ymm5, %ymm5 |
7128 | vpsubw 1504(%r12), %ymm5, %ymm5 |
7129 | vpsubw 1216(%r12), %ymm4, %ymm4 |
7130 | vpaddw 1600(%r12), %ymm4, %ymm4 |
7131 | vpsubw 640(%r12), %ymm1, %ymm1 |
7132 | vpsubw %ymm1, %ymm5, %ymm5 |
7133 | vpsubw %ymm3, %ymm5, %ymm5 |
7134 | vpsubw 64(%r12), %ymm1, %ymm1 |
7135 | vpaddw 1216(%r12), %ymm1, %ymm1 |
7136 | vmovdqa 352(%r12), %ymm6 |
7137 | vpsubw %ymm2, %ymm6, %ymm7 |
7138 | vmovdqa 1504(%r12), %ymm2 |
7139 | vpsubw %ymm7, %ymm2, %ymm2 |
7140 | vpsubw 928(%r12), %ymm2, %ymm2 |
7141 | vpsubw %ymm0, %ymm7, %ymm7 |
7142 | vpaddw %ymm4, %ymm7, %ymm7 |
7143 | vmovdqa 64(%r12), %ymm8 |
7144 | vmovdqa 928(%r12), %ymm9 |
7145 | vmovdqa %ymm8, 0(%rsp) |
7146 | vmovdqa %ymm0, 32(%rsp) |
7147 | vmovdqa %ymm1, 64(%rsp) |
7148 | vmovdqa %ymm7, 96(%rsp) |
7149 | vmovdqa %ymm5, 128(%rsp) |
7150 | vmovdqa %ymm2, 160(%rsp) |
7151 | vmovdqa %ymm3, 192(%rsp) |
7152 | vmovdqa %ymm9, 224(%rsp) |
7153 | vmovdqa 1888(%r12), %ymm0 |
7154 | vpsubw 1984(%r12), %ymm0, %ymm0 |
7155 | vmovdqa 2272(%r12), %ymm1 |
7156 | vpsubw %ymm0, %ymm1, %ymm1 |
7157 | vpsubw 2080(%r12), %ymm1, %ymm1 |
7158 | vpsubw 1792(%r12), %ymm0, %ymm0 |
7159 | vpaddw 2176(%r12), %ymm0, %ymm0 |
7160 | vmovdqa 2464(%r12), %ymm2 |
7161 | vpsubw 2560(%r12), %ymm2, %ymm2 |
7162 | vmovdqa 2848(%r12), %ymm3 |
7163 | vpsubw %ymm2, %ymm3, %ymm3 |
7164 | vpsubw 2656(%r12), %ymm3, %ymm3 |
7165 | vpsubw 2368(%r12), %ymm2, %ymm2 |
7166 | vpaddw 2752(%r12), %ymm2, %ymm2 |
7167 | vmovdqa 3040(%r12), %ymm4 |
7168 | vpsubw 3136(%r12), %ymm4, %ymm4 |
7169 | vmovdqa 3424(%r12), %ymm5 |
7170 | vpsubw %ymm4, %ymm5, %ymm5 |
7171 | vpsubw 3232(%r12), %ymm5, %ymm5 |
7172 | vpsubw 2944(%r12), %ymm4, %ymm4 |
7173 | vpaddw 3328(%r12), %ymm4, %ymm4 |
7174 | vpsubw 2368(%r12), %ymm1, %ymm1 |
7175 | vpsubw %ymm1, %ymm5, %ymm5 |
7176 | vpsubw %ymm3, %ymm5, %ymm5 |
7177 | vpsubw 1792(%r12), %ymm1, %ymm1 |
7178 | vpaddw 2944(%r12), %ymm1, %ymm1 |
7179 | vmovdqa 2080(%r12), %ymm6 |
7180 | vpsubw %ymm2, %ymm6, %ymm7 |
7181 | vmovdqa 3232(%r12), %ymm2 |
7182 | vpsubw %ymm7, %ymm2, %ymm2 |
7183 | vpsubw 2656(%r12), %ymm2, %ymm2 |
7184 | vpsubw %ymm0, %ymm7, %ymm7 |
7185 | vpaddw %ymm4, %ymm7, %ymm7 |
7186 | vmovdqa 1792(%r12), %ymm8 |
7187 | vmovdqa 2656(%r12), %ymm9 |
7188 | vmovdqa %ymm8, 256(%rsp) |
7189 | vmovdqa %ymm0, 288(%rsp) |
7190 | vmovdqa %ymm1, 320(%rsp) |
7191 | vmovdqa %ymm7, 352(%rsp) |
7192 | vmovdqa %ymm5, 384(%rsp) |
7193 | vmovdqa %ymm2, 416(%rsp) |
7194 | vmovdqa %ymm3, 448(%rsp) |
7195 | vmovdqa %ymm9, 480(%rsp) |
7196 | vmovdqa 3616(%r12), %ymm0 |
7197 | vpsubw 3712(%r12), %ymm0, %ymm0 |
7198 | vmovdqa 4000(%r12), %ymm1 |
7199 | vpsubw %ymm0, %ymm1, %ymm1 |
7200 | vpsubw 3808(%r12), %ymm1, %ymm1 |
7201 | vpsubw 3520(%r12), %ymm0, %ymm0 |
7202 | vpaddw 3904(%r12), %ymm0, %ymm0 |
7203 | vmovdqa 4192(%r12), %ymm2 |
7204 | vpsubw 4288(%r12), %ymm2, %ymm2 |
7205 | vmovdqa 4576(%r12), %ymm3 |
7206 | vpsubw %ymm2, %ymm3, %ymm3 |
7207 | vpsubw 4384(%r12), %ymm3, %ymm3 |
7208 | vpsubw 4096(%r12), %ymm2, %ymm2 |
7209 | vpaddw 4480(%r12), %ymm2, %ymm2 |
7210 | vmovdqa 4768(%r12), %ymm4 |
7211 | vpsubw 4864(%r12), %ymm4, %ymm4 |
7212 | vmovdqa 5152(%r12), %ymm5 |
7213 | vpsubw %ymm4, %ymm5, %ymm5 |
7214 | vpsubw 4960(%r12), %ymm5, %ymm5 |
7215 | vpsubw 4672(%r12), %ymm4, %ymm4 |
7216 | vpaddw 5056(%r12), %ymm4, %ymm4 |
7217 | vpsubw 4096(%r12), %ymm1, %ymm1 |
7218 | vpsubw %ymm1, %ymm5, %ymm5 |
7219 | vpsubw %ymm3, %ymm5, %ymm5 |
7220 | vpsubw 3520(%r12), %ymm1, %ymm1 |
7221 | vpaddw 4672(%r12), %ymm1, %ymm1 |
7222 | vmovdqa 3808(%r12), %ymm6 |
7223 | vpsubw %ymm2, %ymm6, %ymm7 |
7224 | vmovdqa 4960(%r12), %ymm2 |
7225 | vpsubw %ymm7, %ymm2, %ymm2 |
7226 | vpsubw 4384(%r12), %ymm2, %ymm2 |
7227 | vpsubw %ymm0, %ymm7, %ymm7 |
7228 | vpaddw %ymm4, %ymm7, %ymm7 |
7229 | vmovdqa 3520(%r12), %ymm8 |
7230 | vmovdqa 4384(%r12), %ymm9 |
7231 | vmovdqa %ymm8, 512(%rsp) |
7232 | vmovdqa %ymm0, 544(%rsp) |
7233 | vmovdqa %ymm1, 576(%rsp) |
7234 | vmovdqa %ymm7, 608(%rsp) |
7235 | vmovdqa %ymm5, 640(%rsp) |
7236 | vmovdqa %ymm2, 672(%rsp) |
7237 | vmovdqa %ymm3, 704(%rsp) |
7238 | vmovdqa %ymm9, 736(%rsp) |
7239 | vmovdqa 5344(%r12), %ymm0 |
7240 | vpsubw 5440(%r12), %ymm0, %ymm0 |
7241 | vmovdqa 5728(%r12), %ymm1 |
7242 | vpsubw %ymm0, %ymm1, %ymm1 |
7243 | vpsubw 5536(%r12), %ymm1, %ymm1 |
7244 | vpsubw 5248(%r12), %ymm0, %ymm0 |
7245 | vpaddw 5632(%r12), %ymm0, %ymm0 |
7246 | vmovdqa 5920(%r12), %ymm2 |
7247 | vpsubw 6016(%r12), %ymm2, %ymm2 |
7248 | vmovdqa 6304(%r12), %ymm3 |
7249 | vpsubw %ymm2, %ymm3, %ymm3 |
7250 | vpsubw 6112(%r12), %ymm3, %ymm3 |
7251 | vpsubw 5824(%r12), %ymm2, %ymm2 |
7252 | vpaddw 6208(%r12), %ymm2, %ymm2 |
7253 | vmovdqa 6496(%r12), %ymm4 |
7254 | vpsubw 6592(%r12), %ymm4, %ymm4 |
7255 | vmovdqa 6880(%r12), %ymm5 |
7256 | vpsubw %ymm4, %ymm5, %ymm5 |
7257 | vpsubw 6688(%r12), %ymm5, %ymm5 |
7258 | vpsubw 6400(%r12), %ymm4, %ymm4 |
7259 | vpaddw 6784(%r12), %ymm4, %ymm4 |
7260 | vpsubw 5824(%r12), %ymm1, %ymm1 |
7261 | vpsubw %ymm1, %ymm5, %ymm5 |
7262 | vpsubw %ymm3, %ymm5, %ymm5 |
7263 | vpsubw 5248(%r12), %ymm1, %ymm1 |
7264 | vpaddw 6400(%r12), %ymm1, %ymm1 |
7265 | vmovdqa 5536(%r12), %ymm6 |
7266 | vpsubw %ymm2, %ymm6, %ymm7 |
7267 | vmovdqa 6688(%r12), %ymm2 |
7268 | vpsubw %ymm7, %ymm2, %ymm2 |
7269 | vpsubw 6112(%r12), %ymm2, %ymm2 |
7270 | vpsubw %ymm0, %ymm7, %ymm7 |
7271 | vpaddw %ymm4, %ymm7, %ymm7 |
7272 | vmovdqa 5248(%r12), %ymm8 |
7273 | vmovdqa 6112(%r12), %ymm9 |
7274 | vmovdqa %ymm8, 768(%rsp) |
7275 | vmovdqa %ymm0, 800(%rsp) |
7276 | vmovdqa %ymm1, 832(%rsp) |
7277 | vmovdqa %ymm7, 864(%rsp) |
7278 | vmovdqa %ymm5, 896(%rsp) |
7279 | vmovdqa %ymm2, 928(%rsp) |
7280 | vmovdqa %ymm3, 960(%rsp) |
7281 | vmovdqa %ymm9, 992(%rsp) |
7282 | vmovdqa 7072(%r12), %ymm0 |
7283 | vpsubw 7168(%r12), %ymm0, %ymm0 |
7284 | vmovdqa 7456(%r12), %ymm1 |
7285 | vpsubw %ymm0, %ymm1, %ymm1 |
7286 | vpsubw 7264(%r12), %ymm1, %ymm1 |
7287 | vpsubw 6976(%r12), %ymm0, %ymm0 |
7288 | vpaddw 7360(%r12), %ymm0, %ymm0 |
7289 | vmovdqa 7648(%r12), %ymm2 |
7290 | vpsubw 7744(%r12), %ymm2, %ymm2 |
7291 | vmovdqa 8032(%r12), %ymm3 |
7292 | vpsubw %ymm2, %ymm3, %ymm3 |
7293 | vpsubw 7840(%r12), %ymm3, %ymm3 |
7294 | vpsubw 7552(%r12), %ymm2, %ymm2 |
7295 | vpaddw 7936(%r12), %ymm2, %ymm2 |
7296 | vmovdqa 8224(%r12), %ymm4 |
7297 | vpsubw 8320(%r12), %ymm4, %ymm4 |
7298 | vmovdqa 8608(%r12), %ymm5 |
7299 | vpsubw %ymm4, %ymm5, %ymm5 |
7300 | vpsubw 8416(%r12), %ymm5, %ymm5 |
7301 | vpsubw 8128(%r12), %ymm4, %ymm4 |
7302 | vpaddw 8512(%r12), %ymm4, %ymm4 |
7303 | vpsubw 7552(%r12), %ymm1, %ymm1 |
7304 | vpsubw %ymm1, %ymm5, %ymm5 |
7305 | vpsubw %ymm3, %ymm5, %ymm5 |
7306 | vpsubw 6976(%r12), %ymm1, %ymm1 |
7307 | vpaddw 8128(%r12), %ymm1, %ymm1 |
7308 | vmovdqa 7264(%r12), %ymm6 |
7309 | vpsubw %ymm2, %ymm6, %ymm7 |
7310 | vmovdqa 8416(%r12), %ymm2 |
7311 | vpsubw %ymm7, %ymm2, %ymm2 |
7312 | vpsubw 7840(%r12), %ymm2, %ymm2 |
7313 | vpsubw %ymm0, %ymm7, %ymm7 |
7314 | vpaddw %ymm4, %ymm7, %ymm7 |
7315 | vmovdqa 6976(%r12), %ymm8 |
7316 | vmovdqa 7840(%r12), %ymm9 |
7317 | vmovdqa %ymm8, 1024(%rsp) |
7318 | vmovdqa %ymm0, 1056(%rsp) |
7319 | vmovdqa %ymm1, 1088(%rsp) |
7320 | vmovdqa %ymm7, 1120(%rsp) |
7321 | vmovdqa %ymm5, 1152(%rsp) |
7322 | vmovdqa %ymm2, 1184(%rsp) |
7323 | vmovdqa %ymm3, 1216(%rsp) |
7324 | vmovdqa %ymm9, 1248(%rsp) |
7325 | vmovdqa 8800(%r12), %ymm0 |
7326 | vpsubw 8896(%r12), %ymm0, %ymm0 |
7327 | vmovdqa 9184(%r12), %ymm1 |
7328 | vpsubw %ymm0, %ymm1, %ymm1 |
7329 | vpsubw 8992(%r12), %ymm1, %ymm1 |
7330 | vpsubw 8704(%r12), %ymm0, %ymm0 |
7331 | vpaddw 9088(%r12), %ymm0, %ymm0 |
7332 | vmovdqa 9376(%r12), %ymm2 |
7333 | vpsubw 9472(%r12), %ymm2, %ymm2 |
7334 | vmovdqa 9760(%r12), %ymm3 |
7335 | vpsubw %ymm2, %ymm3, %ymm3 |
7336 | vpsubw 9568(%r12), %ymm3, %ymm3 |
7337 | vpsubw 9280(%r12), %ymm2, %ymm2 |
7338 | vpaddw 9664(%r12), %ymm2, %ymm2 |
7339 | vmovdqa 9952(%r12), %ymm4 |
7340 | vpsubw 10048(%r12), %ymm4, %ymm4 |
7341 | vmovdqa 10336(%r12), %ymm5 |
7342 | vpsubw %ymm4, %ymm5, %ymm5 |
7343 | vpsubw 10144(%r12), %ymm5, %ymm5 |
7344 | vpsubw 9856(%r12), %ymm4, %ymm4 |
7345 | vpaddw 10240(%r12), %ymm4, %ymm4 |
7346 | vpsubw 9280(%r12), %ymm1, %ymm1 |
7347 | vpsubw %ymm1, %ymm5, %ymm5 |
7348 | vpsubw %ymm3, %ymm5, %ymm5 |
7349 | vpsubw 8704(%r12), %ymm1, %ymm1 |
7350 | vpaddw 9856(%r12), %ymm1, %ymm1 |
7351 | vmovdqa 8992(%r12), %ymm6 |
7352 | vpsubw %ymm2, %ymm6, %ymm7 |
7353 | vmovdqa 10144(%r12), %ymm2 |
7354 | vpsubw %ymm7, %ymm2, %ymm2 |
7355 | vpsubw 9568(%r12), %ymm2, %ymm2 |
7356 | vpsubw %ymm0, %ymm7, %ymm7 |
7357 | vpaddw %ymm4, %ymm7, %ymm7 |
7358 | vmovdqa 8704(%r12), %ymm8 |
7359 | vmovdqa 9568(%r12), %ymm9 |
7360 | vmovdqa %ymm8, 1280(%rsp) |
7361 | vmovdqa %ymm0, 1312(%rsp) |
7362 | vmovdqa %ymm1, 1344(%rsp) |
7363 | vmovdqa %ymm7, 1376(%rsp) |
7364 | vmovdqa %ymm5, 1408(%rsp) |
7365 | vmovdqa %ymm2, 1440(%rsp) |
7366 | vmovdqa %ymm3, 1472(%rsp) |
7367 | vmovdqa %ymm9, 1504(%rsp) |
7368 | vmovdqa 10528(%r12), %ymm0 |
7369 | vpsubw 10624(%r12), %ymm0, %ymm0 |
7370 | vmovdqa 10912(%r12), %ymm1 |
7371 | vpsubw %ymm0, %ymm1, %ymm1 |
7372 | vpsubw 10720(%r12), %ymm1, %ymm1 |
7373 | vpsubw 10432(%r12), %ymm0, %ymm0 |
7374 | vpaddw 10816(%r12), %ymm0, %ymm0 |
7375 | vmovdqa 11104(%r12), %ymm2 |
7376 | vpsubw 11200(%r12), %ymm2, %ymm2 |
7377 | vmovdqa 11488(%r12), %ymm3 |
7378 | vpsubw %ymm2, %ymm3, %ymm3 |
7379 | vpsubw 11296(%r12), %ymm3, %ymm3 |
7380 | vpsubw 11008(%r12), %ymm2, %ymm2 |
7381 | vpaddw 11392(%r12), %ymm2, %ymm2 |
7382 | vmovdqa 11680(%r12), %ymm4 |
7383 | vpsubw 11776(%r12), %ymm4, %ymm4 |
7384 | vmovdqa 12064(%r12), %ymm5 |
7385 | vpsubw %ymm4, %ymm5, %ymm5 |
7386 | vpsubw 11872(%r12), %ymm5, %ymm5 |
7387 | vpsubw 11584(%r12), %ymm4, %ymm4 |
7388 | vpaddw 11968(%r12), %ymm4, %ymm4 |
7389 | vpsubw 11008(%r12), %ymm1, %ymm1 |
7390 | vpsubw %ymm1, %ymm5, %ymm5 |
7391 | vpsubw %ymm3, %ymm5, %ymm5 |
7392 | vpsubw 10432(%r12), %ymm1, %ymm1 |
7393 | vpaddw 11584(%r12), %ymm1, %ymm1 |
7394 | vmovdqa 10720(%r12), %ymm6 |
7395 | vpsubw %ymm2, %ymm6, %ymm7 |
7396 | vmovdqa 11872(%r12), %ymm2 |
7397 | vpsubw %ymm7, %ymm2, %ymm2 |
7398 | vpsubw 11296(%r12), %ymm2, %ymm2 |
7399 | vpsubw %ymm0, %ymm7, %ymm7 |
7400 | vpaddw %ymm4, %ymm7, %ymm7 |
7401 | vmovdqa 10432(%r12), %ymm8 |
7402 | vmovdqa 11296(%r12), %ymm9 |
7403 | vmovdqa %ymm8, 1536(%rsp) |
7404 | vmovdqa %ymm0, 1568(%rsp) |
7405 | vmovdqa %ymm1, 1600(%rsp) |
7406 | vmovdqa %ymm7, 1632(%rsp) |
7407 | vmovdqa %ymm5, 1664(%rsp) |
7408 | vmovdqa %ymm2, 1696(%rsp) |
7409 | vmovdqa %ymm3, 1728(%rsp) |
7410 | vmovdqa %ymm9, 1760(%rsp) |
7411 | vmovdqa 0(%rsp), %ymm11 |
7412 | vpunpcklwd const0(%rip), %ymm11, %ymm4 |
7413 | vpunpckhwd const0(%rip), %ymm11, %ymm2 |
7414 | vpslld $1, %ymm4, %ymm4 |
7415 | vpslld $1, %ymm2, %ymm2 |
7416 | vmovdqa 256(%rsp), %ymm9 |
7417 | vpunpcklwd const0(%rip), %ymm9, %ymm8 |
7418 | vpunpckhwd const0(%rip), %ymm9, %ymm9 |
7419 | vmovdqa 512(%rsp), %ymm6 |
7420 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
7421 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
7422 | vpaddd %ymm5, %ymm8, %ymm3 |
7423 | vpaddd %ymm6, %ymm9, %ymm7 |
7424 | vpsubd %ymm4, %ymm3, %ymm3 |
7425 | vpsubd %ymm2, %ymm7, %ymm7 |
7426 | vpsubd %ymm5, %ymm8, %ymm5 |
7427 | vpsubd %ymm6, %ymm9, %ymm6 |
7428 | vpsrld $1, %ymm5, %ymm5 |
7429 | vpsrld $1, %ymm6, %ymm6 |
7430 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
7431 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
7432 | vpackusdw %ymm6, %ymm5, %ymm6 |
7433 | vmovdqa 1536(%rsp), %ymm5 |
7434 | vpunpcklwd const0(%rip), %ymm5, %ymm9 |
7435 | vpunpckhwd const0(%rip), %ymm5, %ymm8 |
7436 | vpslld $1, %ymm9, %ymm9 |
7437 | vpslld $1, %ymm8, %ymm8 |
7438 | vpsubd %ymm9, %ymm3, %ymm3 |
7439 | vpsubd %ymm8, %ymm7, %ymm7 |
7440 | vpsrld $1, %ymm3, %ymm3 |
7441 | vpsrld $1, %ymm7, %ymm7 |
7442 | vpand mask32_to_16(%rip), %ymm3, %ymm3 |
7443 | vpand mask32_to_16(%rip), %ymm7, %ymm7 |
7444 | vpackusdw %ymm7, %ymm3, %ymm7 |
7445 | vmovdqa 768(%rsp), %ymm3 |
7446 | vpaddw 1024(%rsp), %ymm3, %ymm8 |
7447 | vpsubw 1024(%rsp), %ymm3, %ymm3 |
7448 | vpsrlw $2, %ymm3, %ymm3 |
7449 | vpsubw %ymm6, %ymm3, %ymm3 |
7450 | vpmullw %ymm14, %ymm3, %ymm3 |
7451 | vpsllw $1, %ymm11, %ymm9 |
7452 | vpsubw %ymm9, %ymm8, %ymm9 |
7453 | vpsllw $7, %ymm5, %ymm8 |
7454 | vpsubw %ymm8, %ymm9, %ymm8 |
7455 | vpsrlw $3, %ymm8, %ymm8 |
7456 | vpsubw %ymm7, %ymm8, %ymm8 |
7457 | vmovdqa 1280(%rsp), %ymm9 |
7458 | vpsubw %ymm11, %ymm9, %ymm9 |
7459 | vpmullw %ymm15, %ymm5, %ymm2 |
7460 | vpsubw %ymm2, %ymm9, %ymm2 |
7461 | vpmullw %ymm14, %ymm8, %ymm8 |
7462 | vpsubw %ymm8, %ymm7, %ymm7 |
7463 | vpmullw %ymm12, %ymm8, %ymm9 |
7464 | vpaddw %ymm9, %ymm7, %ymm9 |
7465 | vpmullw %ymm12, %ymm9, %ymm9 |
7466 | vpsubw %ymm9, %ymm2, %ymm9 |
7467 | vpmullw %ymm14, %ymm9, %ymm9 |
7468 | vpsubw %ymm6, %ymm9, %ymm9 |
7469 | vpsrlw $3, %ymm9, %ymm9 |
7470 | vpsubw %ymm3, %ymm9, %ymm9 |
7471 | vpsubw %ymm9, %ymm3, %ymm3 |
7472 | vpsubw %ymm3, %ymm6, %ymm6 |
7473 | vpmullw %ymm13, %ymm9, %ymm9 |
7474 | vpsubw %ymm9, %ymm6, %ymm6 |
7475 | vpshufb shuf48_16(%rip), %ymm8, %ymm8 |
7476 | vpand mask3_5_4_3_1(%rip), %ymm8, %ymm2 |
7477 | vpand mask5_3_5_3(%rip), %ymm8, %ymm8 |
7478 | vpermq $139, %ymm2, %ymm2 |
7479 | vpand mask_keephigh(%rip), %ymm2, %ymm4 |
7480 | vpor %ymm4, %ymm8, %ymm8 |
7481 | vpaddw 2048(%rsp), %ymm11, %ymm11 |
7482 | vpaddw %ymm8, %ymm11, %ymm11 |
7483 | vmovdqa %xmm2, 2048(%rsp) |
7484 | vpshufb shuf48_16(%rip), %ymm9, %ymm9 |
7485 | vpand mask3_5_4_3_1(%rip), %ymm9, %ymm2 |
7486 | vpand mask5_3_5_3(%rip), %ymm9, %ymm9 |
7487 | vpermq $139, %ymm2, %ymm2 |
7488 | vpand mask_keephigh(%rip), %ymm2, %ymm4 |
7489 | vpor %ymm4, %ymm9, %ymm9 |
7490 | vpaddw 2304(%rsp), %ymm6, %ymm6 |
7491 | vpaddw %ymm9, %ymm6, %ymm6 |
7492 | vmovdqa %xmm2, 2304(%rsp) |
7493 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
7494 | vpand mask3_5_4_3_1(%rip), %ymm5, %ymm2 |
7495 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
7496 | vpermq $139, %ymm2, %ymm2 |
7497 | vpand mask_keephigh(%rip), %ymm2, %ymm4 |
7498 | vpor %ymm4, %ymm5, %ymm5 |
7499 | vpaddw 2560(%rsp), %ymm7, %ymm7 |
7500 | vpaddw %ymm5, %ymm7, %ymm7 |
7501 | vmovdqa %xmm2, 2560(%rsp) |
7502 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
7503 | vmovdqu %xmm11, 64(%rdi) |
7504 | vextracti128 $1, %ymm11, %xmm11 |
7505 | vmovq %xmm11, 80(%rdi) |
7506 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
7507 | vmovdqu %xmm6, 416(%rdi) |
7508 | vextracti128 $1, %ymm6, %xmm6 |
7509 | vmovq %xmm6, 432(%rdi) |
7510 | vpand mask_mod8192(%rip), %ymm7, %ymm7 |
7511 | vmovdqu %xmm7, 768(%rdi) |
7512 | vextracti128 $1, %ymm7, %xmm7 |
7513 | vmovq %xmm7, 784(%rdi) |
7514 | vpand mask_mod8192(%rip), %ymm3, %ymm3 |
7515 | vmovdqu %xmm3, 1120(%rdi) |
7516 | vextracti128 $1, %ymm3, %xmm3 |
7517 | vmovq %xmm3, 1136(%rdi) |
7518 | vmovdqa 32(%rsp), %ymm5 |
7519 | vpunpcklwd const0(%rip), %ymm5, %ymm9 |
7520 | vpunpckhwd const0(%rip), %ymm5, %ymm8 |
7521 | vpslld $1, %ymm9, %ymm9 |
7522 | vpslld $1, %ymm8, %ymm8 |
7523 | vmovdqa 288(%rsp), %ymm3 |
7524 | vpunpcklwd const0(%rip), %ymm3, %ymm7 |
7525 | vpunpckhwd const0(%rip), %ymm3, %ymm3 |
7526 | vmovdqa 544(%rsp), %ymm6 |
7527 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
7528 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
7529 | vpaddd %ymm11, %ymm7, %ymm2 |
7530 | vpaddd %ymm6, %ymm3, %ymm4 |
7531 | vpsubd %ymm9, %ymm2, %ymm2 |
7532 | vpsubd %ymm8, %ymm4, %ymm4 |
7533 | vpsubd %ymm11, %ymm7, %ymm11 |
7534 | vpsubd %ymm6, %ymm3, %ymm6 |
7535 | vpsrld $1, %ymm11, %ymm11 |
7536 | vpsrld $1, %ymm6, %ymm6 |
7537 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
7538 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
7539 | vpackusdw %ymm6, %ymm11, %ymm6 |
7540 | vmovdqa 1568(%rsp), %ymm11 |
7541 | vpunpcklwd const0(%rip), %ymm11, %ymm3 |
7542 | vpunpckhwd const0(%rip), %ymm11, %ymm7 |
7543 | vpslld $1, %ymm3, %ymm3 |
7544 | vpslld $1, %ymm7, %ymm7 |
7545 | vpsubd %ymm3, %ymm2, %ymm2 |
7546 | vpsubd %ymm7, %ymm4, %ymm4 |
7547 | vpsrld $1, %ymm2, %ymm2 |
7548 | vpsrld $1, %ymm4, %ymm4 |
7549 | vpand mask32_to_16(%rip), %ymm2, %ymm2 |
7550 | vpand mask32_to_16(%rip), %ymm4, %ymm4 |
7551 | vpackusdw %ymm4, %ymm2, %ymm4 |
7552 | vmovdqa 800(%rsp), %ymm2 |
7553 | vpaddw 1056(%rsp), %ymm2, %ymm7 |
7554 | vpsubw 1056(%rsp), %ymm2, %ymm2 |
7555 | vpsrlw $2, %ymm2, %ymm2 |
7556 | vpsubw %ymm6, %ymm2, %ymm2 |
7557 | vpmullw %ymm14, %ymm2, %ymm2 |
7558 | vpsllw $1, %ymm5, %ymm3 |
7559 | vpsubw %ymm3, %ymm7, %ymm3 |
7560 | vpsllw $7, %ymm11, %ymm7 |
7561 | vpsubw %ymm7, %ymm3, %ymm7 |
7562 | vpsrlw $3, %ymm7, %ymm7 |
7563 | vpsubw %ymm4, %ymm7, %ymm7 |
7564 | vmovdqa 1312(%rsp), %ymm3 |
7565 | vpsubw %ymm5, %ymm3, %ymm3 |
7566 | vpmullw %ymm15, %ymm11, %ymm8 |
7567 | vpsubw %ymm8, %ymm3, %ymm8 |
7568 | vpmullw %ymm14, %ymm7, %ymm7 |
7569 | vpsubw %ymm7, %ymm4, %ymm4 |
7570 | vpmullw %ymm12, %ymm7, %ymm3 |
7571 | vpaddw %ymm3, %ymm4, %ymm3 |
7572 | vpmullw %ymm12, %ymm3, %ymm3 |
7573 | vpsubw %ymm3, %ymm8, %ymm3 |
7574 | vpmullw %ymm14, %ymm3, %ymm3 |
7575 | vpsubw %ymm6, %ymm3, %ymm3 |
7576 | vpsrlw $3, %ymm3, %ymm3 |
7577 | vpsubw %ymm2, %ymm3, %ymm3 |
7578 | vpsubw %ymm3, %ymm2, %ymm2 |
7579 | vpsubw %ymm2, %ymm6, %ymm6 |
7580 | vpmullw %ymm13, %ymm3, %ymm3 |
7581 | vpsubw %ymm3, %ymm6, %ymm6 |
7582 | vpshufb shuf48_16(%rip), %ymm7, %ymm7 |
7583 | vpand mask3_5_4_3_1(%rip), %ymm7, %ymm8 |
7584 | vpand mask5_3_5_3(%rip), %ymm7, %ymm7 |
7585 | vpermq $139, %ymm8, %ymm8 |
7586 | vpand mask_keephigh(%rip), %ymm8, %ymm9 |
7587 | vpor %ymm9, %ymm7, %ymm7 |
7588 | vpaddw 2080(%rsp), %ymm5, %ymm5 |
7589 | vpaddw %ymm7, %ymm5, %ymm5 |
7590 | vmovdqa %xmm8, 2080(%rsp) |
7591 | vpshufb shuf48_16(%rip), %ymm3, %ymm3 |
7592 | vpand mask3_5_4_3_1(%rip), %ymm3, %ymm8 |
7593 | vpand mask5_3_5_3(%rip), %ymm3, %ymm3 |
7594 | vpermq $139, %ymm8, %ymm8 |
7595 | vpand mask_keephigh(%rip), %ymm8, %ymm9 |
7596 | vpor %ymm9, %ymm3, %ymm3 |
7597 | vpaddw 2336(%rsp), %ymm6, %ymm6 |
7598 | vpaddw %ymm3, %ymm6, %ymm6 |
7599 | vmovdqa %xmm8, 2336(%rsp) |
7600 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
7601 | vpand mask3_5_4_3_1(%rip), %ymm11, %ymm8 |
7602 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
7603 | vpermq $139, %ymm8, %ymm8 |
7604 | vpand mask_keephigh(%rip), %ymm8, %ymm9 |
7605 | vpor %ymm9, %ymm11, %ymm11 |
7606 | vpaddw 2592(%rsp), %ymm4, %ymm4 |
7607 | vpaddw %ymm11, %ymm4, %ymm4 |
7608 | vmovdqa %xmm8, 2592(%rsp) |
7609 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
7610 | vmovdqu %xmm5, 152(%rdi) |
7611 | vextracti128 $1, %ymm5, %xmm5 |
7612 | vmovq %xmm5, 168(%rdi) |
7613 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
7614 | vmovdqu %xmm6, 504(%rdi) |
7615 | vextracti128 $1, %ymm6, %xmm6 |
7616 | vmovq %xmm6, 520(%rdi) |
7617 | vpand mask_mod8192(%rip), %ymm4, %ymm4 |
7618 | vmovdqu %xmm4, 856(%rdi) |
7619 | vextracti128 $1, %ymm4, %xmm4 |
7620 | vmovq %xmm4, 872(%rdi) |
7621 | vpand mask_mod8192(%rip), %ymm2, %ymm2 |
7622 | vmovdqu %xmm2, 1208(%rdi) |
7623 | vextracti128 $1, %ymm2, %xmm2 |
7624 | vmovq %xmm2, 1224(%rdi) |
7625 | vmovdqa 64(%rsp), %ymm11 |
7626 | vpunpcklwd const0(%rip), %ymm11, %ymm3 |
7627 | vpunpckhwd const0(%rip), %ymm11, %ymm7 |
7628 | vpslld $1, %ymm3, %ymm3 |
7629 | vpslld $1, %ymm7, %ymm7 |
7630 | vmovdqa 320(%rsp), %ymm2 |
7631 | vpunpcklwd const0(%rip), %ymm2, %ymm4 |
7632 | vpunpckhwd const0(%rip), %ymm2, %ymm2 |
7633 | vmovdqa 576(%rsp), %ymm6 |
7634 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
7635 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
7636 | vpaddd %ymm5, %ymm4, %ymm8 |
7637 | vpaddd %ymm6, %ymm2, %ymm9 |
7638 | vpsubd %ymm3, %ymm8, %ymm8 |
7639 | vpsubd %ymm7, %ymm9, %ymm9 |
7640 | vpsubd %ymm5, %ymm4, %ymm5 |
7641 | vpsubd %ymm6, %ymm2, %ymm6 |
7642 | vpsrld $1, %ymm5, %ymm5 |
7643 | vpsrld $1, %ymm6, %ymm6 |
7644 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
7645 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
7646 | vpackusdw %ymm6, %ymm5, %ymm6 |
7647 | vmovdqa 1600(%rsp), %ymm5 |
7648 | vpunpcklwd const0(%rip), %ymm5, %ymm2 |
7649 | vpunpckhwd const0(%rip), %ymm5, %ymm4 |
7650 | vpslld $1, %ymm2, %ymm2 |
7651 | vpslld $1, %ymm4, %ymm4 |
7652 | vpsubd %ymm2, %ymm8, %ymm8 |
7653 | vpsubd %ymm4, %ymm9, %ymm9 |
7654 | vpsrld $1, %ymm8, %ymm8 |
7655 | vpsrld $1, %ymm9, %ymm9 |
7656 | vpand mask32_to_16(%rip), %ymm8, %ymm8 |
7657 | vpand mask32_to_16(%rip), %ymm9, %ymm9 |
7658 | vpackusdw %ymm9, %ymm8, %ymm9 |
7659 | vmovdqa 832(%rsp), %ymm8 |
7660 | vpaddw 1088(%rsp), %ymm8, %ymm4 |
7661 | vpsubw 1088(%rsp), %ymm8, %ymm8 |
7662 | vpsrlw $2, %ymm8, %ymm8 |
7663 | vpsubw %ymm6, %ymm8, %ymm8 |
7664 | vpmullw %ymm14, %ymm8, %ymm8 |
7665 | vpsllw $1, %ymm11, %ymm2 |
7666 | vpsubw %ymm2, %ymm4, %ymm2 |
7667 | vpsllw $7, %ymm5, %ymm4 |
7668 | vpsubw %ymm4, %ymm2, %ymm4 |
7669 | vpsrlw $3, %ymm4, %ymm4 |
7670 | vpsubw %ymm9, %ymm4, %ymm4 |
7671 | vmovdqa 1344(%rsp), %ymm2 |
7672 | vpsubw %ymm11, %ymm2, %ymm2 |
7673 | vpmullw %ymm15, %ymm5, %ymm7 |
7674 | vpsubw %ymm7, %ymm2, %ymm7 |
7675 | vpmullw %ymm14, %ymm4, %ymm4 |
7676 | vpsubw %ymm4, %ymm9, %ymm9 |
7677 | vpmullw %ymm12, %ymm4, %ymm2 |
7678 | vpaddw %ymm2, %ymm9, %ymm2 |
7679 | vpmullw %ymm12, %ymm2, %ymm2 |
7680 | vpsubw %ymm2, %ymm7, %ymm2 |
7681 | vpmullw %ymm14, %ymm2, %ymm2 |
7682 | vpsubw %ymm6, %ymm2, %ymm2 |
7683 | vpsrlw $3, %ymm2, %ymm2 |
7684 | vpsubw %ymm8, %ymm2, %ymm2 |
7685 | vpsubw %ymm2, %ymm8, %ymm8 |
7686 | vpsubw %ymm8, %ymm6, %ymm6 |
7687 | vpmullw %ymm13, %ymm2, %ymm2 |
7688 | vpsubw %ymm2, %ymm6, %ymm6 |
7689 | vpshufb shuf48_16(%rip), %ymm4, %ymm4 |
7690 | vpand mask3_5_4_3_1(%rip), %ymm4, %ymm7 |
7691 | vpand mask5_3_5_3(%rip), %ymm4, %ymm4 |
7692 | vpermq $139, %ymm7, %ymm7 |
7693 | vpand mask_keephigh(%rip), %ymm7, %ymm3 |
7694 | vpor %ymm3, %ymm4, %ymm4 |
7695 | vpaddw 2112(%rsp), %ymm11, %ymm11 |
7696 | vpaddw %ymm4, %ymm11, %ymm11 |
7697 | vmovdqa %xmm7, 2112(%rsp) |
7698 | vpshufb shuf48_16(%rip), %ymm2, %ymm2 |
7699 | vpand mask3_5_4_3_1(%rip), %ymm2, %ymm7 |
7700 | vpand mask5_3_5_3(%rip), %ymm2, %ymm2 |
7701 | vpermq $139, %ymm7, %ymm7 |
7702 | vpand mask_keephigh(%rip), %ymm7, %ymm3 |
7703 | vpor %ymm3, %ymm2, %ymm2 |
7704 | vpaddw 2368(%rsp), %ymm6, %ymm6 |
7705 | vpaddw %ymm2, %ymm6, %ymm6 |
7706 | vmovdqa %xmm7, 2368(%rsp) |
7707 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
7708 | vpand mask3_5_4_3_1(%rip), %ymm5, %ymm7 |
7709 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
7710 | vpermq $139, %ymm7, %ymm7 |
7711 | vpand mask_keephigh(%rip), %ymm7, %ymm3 |
7712 | vpor %ymm3, %ymm5, %ymm5 |
7713 | vpaddw 2624(%rsp), %ymm9, %ymm9 |
7714 | vpaddw %ymm5, %ymm9, %ymm9 |
7715 | vmovdqa %xmm7, 2624(%rsp) |
7716 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
7717 | vmovdqu %xmm11, 240(%rdi) |
7718 | vextracti128 $1, %ymm11, %xmm11 |
7719 | vmovq %xmm11, 256(%rdi) |
7720 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
7721 | vmovdqu %xmm6, 592(%rdi) |
7722 | vextracti128 $1, %ymm6, %xmm6 |
7723 | vmovq %xmm6, 608(%rdi) |
7724 | vpand mask_mod8192(%rip), %ymm9, %ymm9 |
7725 | vmovdqu %xmm9, 944(%rdi) |
7726 | vextracti128 $1, %ymm9, %xmm9 |
7727 | vmovq %xmm9, 960(%rdi) |
7728 | vpand mask_mod8192(%rip), %ymm8, %ymm8 |
7729 | vmovdqu %xmm8, 1296(%rdi) |
7730 | vextracti128 $1, %ymm8, %xmm8 |
7731 | vmovq %xmm8, 1312(%rdi) |
7732 | vmovdqa 96(%rsp), %ymm5 |
7733 | vpunpcklwd const0(%rip), %ymm5, %ymm2 |
7734 | vpunpckhwd const0(%rip), %ymm5, %ymm4 |
7735 | vpslld $1, %ymm2, %ymm2 |
7736 | vpslld $1, %ymm4, %ymm4 |
7737 | vmovdqa 352(%rsp), %ymm8 |
7738 | vpunpcklwd const0(%rip), %ymm8, %ymm9 |
7739 | vpunpckhwd const0(%rip), %ymm8, %ymm8 |
7740 | vmovdqa 608(%rsp), %ymm6 |
7741 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
7742 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
7743 | vpaddd %ymm11, %ymm9, %ymm7 |
7744 | vpaddd %ymm6, %ymm8, %ymm3 |
7745 | vpsubd %ymm2, %ymm7, %ymm7 |
7746 | vpsubd %ymm4, %ymm3, %ymm3 |
7747 | vpsubd %ymm11, %ymm9, %ymm11 |
7748 | vpsubd %ymm6, %ymm8, %ymm6 |
7749 | vpsrld $1, %ymm11, %ymm11 |
7750 | vpsrld $1, %ymm6, %ymm6 |
7751 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
7752 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
7753 | vpackusdw %ymm6, %ymm11, %ymm6 |
7754 | vmovdqa 1632(%rsp), %ymm11 |
7755 | vpunpcklwd const0(%rip), %ymm11, %ymm8 |
7756 | vpunpckhwd const0(%rip), %ymm11, %ymm9 |
7757 | vpslld $1, %ymm8, %ymm8 |
7758 | vpslld $1, %ymm9, %ymm9 |
7759 | vpsubd %ymm8, %ymm7, %ymm7 |
7760 | vpsubd %ymm9, %ymm3, %ymm3 |
7761 | vpsrld $1, %ymm7, %ymm7 |
7762 | vpsrld $1, %ymm3, %ymm3 |
7763 | vpand mask32_to_16(%rip), %ymm7, %ymm7 |
7764 | vpand mask32_to_16(%rip), %ymm3, %ymm3 |
7765 | vpackusdw %ymm3, %ymm7, %ymm3 |
7766 | vmovdqa 864(%rsp), %ymm7 |
7767 | vpaddw 1120(%rsp), %ymm7, %ymm9 |
7768 | vpsubw 1120(%rsp), %ymm7, %ymm7 |
7769 | vpsrlw $2, %ymm7, %ymm7 |
7770 | vpsubw %ymm6, %ymm7, %ymm7 |
7771 | vpmullw %ymm14, %ymm7, %ymm7 |
7772 | vpsllw $1, %ymm5, %ymm8 |
7773 | vpsubw %ymm8, %ymm9, %ymm8 |
7774 | vpsllw $7, %ymm11, %ymm9 |
7775 | vpsubw %ymm9, %ymm8, %ymm9 |
7776 | vpsrlw $3, %ymm9, %ymm9 |
7777 | vpsubw %ymm3, %ymm9, %ymm9 |
7778 | vmovdqa 1376(%rsp), %ymm8 |
7779 | vpsubw %ymm5, %ymm8, %ymm8 |
7780 | vpmullw %ymm15, %ymm11, %ymm4 |
7781 | vpsubw %ymm4, %ymm8, %ymm4 |
7782 | vpmullw %ymm14, %ymm9, %ymm9 |
7783 | vpsubw %ymm9, %ymm3, %ymm3 |
7784 | vpmullw %ymm12, %ymm9, %ymm8 |
7785 | vpaddw %ymm8, %ymm3, %ymm8 |
7786 | vpmullw %ymm12, %ymm8, %ymm8 |
7787 | vpsubw %ymm8, %ymm4, %ymm8 |
7788 | vpmullw %ymm14, %ymm8, %ymm8 |
7789 | vpsubw %ymm6, %ymm8, %ymm8 |
7790 | vpsrlw $3, %ymm8, %ymm8 |
7791 | vpsubw %ymm7, %ymm8, %ymm8 |
7792 | vpsubw %ymm8, %ymm7, %ymm7 |
7793 | vpsubw %ymm7, %ymm6, %ymm6 |
7794 | vpmullw %ymm13, %ymm8, %ymm8 |
7795 | vpsubw %ymm8, %ymm6, %ymm6 |
7796 | vpshufb shuf48_16(%rip), %ymm9, %ymm9 |
7797 | vpand mask3_5_4_3_1(%rip), %ymm9, %ymm4 |
7798 | vpand mask5_3_5_3(%rip), %ymm9, %ymm9 |
7799 | vpermq $139, %ymm4, %ymm4 |
7800 | vpand mask_keephigh(%rip), %ymm4, %ymm2 |
7801 | vpor %ymm2, %ymm9, %ymm9 |
7802 | vpaddw 2144(%rsp), %ymm5, %ymm5 |
7803 | vpaddw %ymm9, %ymm5, %ymm5 |
7804 | vmovdqa %xmm4, 2144(%rsp) |
7805 | vpshufb shuf48_16(%rip), %ymm8, %ymm8 |
7806 | vpand mask3_5_4_3_1(%rip), %ymm8, %ymm4 |
7807 | vpand mask5_3_5_3(%rip), %ymm8, %ymm8 |
7808 | vpermq $139, %ymm4, %ymm4 |
7809 | vpand mask_keephigh(%rip), %ymm4, %ymm2 |
7810 | vpor %ymm2, %ymm8, %ymm8 |
7811 | vpaddw 2400(%rsp), %ymm6, %ymm6 |
7812 | vpaddw %ymm8, %ymm6, %ymm6 |
7813 | vmovdqa %xmm4, 2400(%rsp) |
7814 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
7815 | vpand mask3_5_4_3_1(%rip), %ymm11, %ymm4 |
7816 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
7817 | vpermq $139, %ymm4, %ymm4 |
7818 | vpand mask_keephigh(%rip), %ymm4, %ymm2 |
7819 | vpor %ymm2, %ymm11, %ymm11 |
7820 | vpaddw 2656(%rsp), %ymm3, %ymm3 |
7821 | vpaddw %ymm11, %ymm3, %ymm3 |
7822 | vmovdqa %xmm4, 2656(%rsp) |
7823 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
7824 | vmovdqu %xmm5, 328(%rdi) |
7825 | vextracti128 $1, %ymm5, %xmm5 |
7826 | vmovq %xmm5, 344(%rdi) |
7827 | vpshufb shufmin1_mask3(%rip), %ymm5, %ymm5 |
7828 | vmovdqa %xmm5, 1792(%rsp) |
7829 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
7830 | vmovdqu %xmm6, 680(%rdi) |
7831 | vextracti128 $1, %ymm6, %xmm6 |
7832 | vmovq %xmm6, 696(%rdi) |
7833 | vpshufb shufmin1_mask3(%rip), %ymm6, %ymm6 |
7834 | vmovdqa %xmm6, 1824(%rsp) |
7835 | vpand mask_mod8192(%rip), %ymm3, %ymm3 |
7836 | vmovdqu %xmm3, 1032(%rdi) |
7837 | vextracti128 $1, %ymm3, %xmm3 |
7838 | vmovq %xmm3, 1048(%rdi) |
7839 | vpshufb shufmin1_mask3(%rip), %ymm3, %ymm3 |
7840 | vmovdqa %xmm3, 1856(%rsp) |
7841 | vpand mask_mod8192(%rip), %ymm7, %ymm7 |
7842 | vmovdqu %xmm7, 1384(%rdi) |
7843 | vextracti128 $1, %ymm7, %xmm7 |
7844 | vpextrw $0, %xmm7, 1400(%rdi) |
7845 | vpshufb shufmin1_mask3(%rip), %ymm7, %ymm7 |
7846 | vmovdqa %xmm7, 1888(%rsp) |
7847 | vmovdqa 128(%rsp), %ymm11 |
7848 | vpunpcklwd const0(%rip), %ymm11, %ymm8 |
7849 | vpunpckhwd const0(%rip), %ymm11, %ymm9 |
7850 | vpslld $1, %ymm8, %ymm8 |
7851 | vpslld $1, %ymm9, %ymm9 |
7852 | vmovdqa 384(%rsp), %ymm7 |
7853 | vpunpcklwd const0(%rip), %ymm7, %ymm3 |
7854 | vpunpckhwd const0(%rip), %ymm7, %ymm7 |
7855 | vmovdqa 640(%rsp), %ymm6 |
7856 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
7857 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
7858 | vpaddd %ymm5, %ymm3, %ymm4 |
7859 | vpaddd %ymm6, %ymm7, %ymm2 |
7860 | vpsubd %ymm8, %ymm4, %ymm4 |
7861 | vpsubd %ymm9, %ymm2, %ymm2 |
7862 | vpsubd %ymm5, %ymm3, %ymm5 |
7863 | vpsubd %ymm6, %ymm7, %ymm6 |
7864 | vpsrld $1, %ymm5, %ymm5 |
7865 | vpsrld $1, %ymm6, %ymm6 |
7866 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
7867 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
7868 | vpackusdw %ymm6, %ymm5, %ymm6 |
7869 | vmovdqa 1664(%rsp), %ymm5 |
7870 | vpunpcklwd const0(%rip), %ymm5, %ymm7 |
7871 | vpunpckhwd const0(%rip), %ymm5, %ymm3 |
7872 | vpslld $1, %ymm7, %ymm7 |
7873 | vpslld $1, %ymm3, %ymm3 |
7874 | vpsubd %ymm7, %ymm4, %ymm4 |
7875 | vpsubd %ymm3, %ymm2, %ymm2 |
7876 | vpsrld $1, %ymm4, %ymm4 |
7877 | vpsrld $1, %ymm2, %ymm2 |
7878 | vpand mask32_to_16(%rip), %ymm4, %ymm4 |
7879 | vpand mask32_to_16(%rip), %ymm2, %ymm2 |
7880 | vpackusdw %ymm2, %ymm4, %ymm2 |
7881 | vmovdqa 896(%rsp), %ymm4 |
7882 | vpaddw 1152(%rsp), %ymm4, %ymm3 |
7883 | vpsubw 1152(%rsp), %ymm4, %ymm4 |
7884 | vpsrlw $2, %ymm4, %ymm4 |
7885 | vpsubw %ymm6, %ymm4, %ymm4 |
7886 | vpmullw %ymm14, %ymm4, %ymm4 |
7887 | vpsllw $1, %ymm11, %ymm7 |
7888 | vpsubw %ymm7, %ymm3, %ymm7 |
7889 | vpsllw $7, %ymm5, %ymm3 |
7890 | vpsubw %ymm3, %ymm7, %ymm3 |
7891 | vpsrlw $3, %ymm3, %ymm3 |
7892 | vpsubw %ymm2, %ymm3, %ymm3 |
7893 | vmovdqa 1408(%rsp), %ymm7 |
7894 | vpsubw %ymm11, %ymm7, %ymm7 |
7895 | vpmullw %ymm15, %ymm5, %ymm9 |
7896 | vpsubw %ymm9, %ymm7, %ymm9 |
7897 | vpmullw %ymm14, %ymm3, %ymm3 |
7898 | vpsubw %ymm3, %ymm2, %ymm2 |
7899 | vpmullw %ymm12, %ymm3, %ymm7 |
7900 | vpaddw %ymm7, %ymm2, %ymm7 |
7901 | vpmullw %ymm12, %ymm7, %ymm7 |
7902 | vpsubw %ymm7, %ymm9, %ymm7 |
7903 | vpmullw %ymm14, %ymm7, %ymm7 |
7904 | vpsubw %ymm6, %ymm7, %ymm7 |
7905 | vpsrlw $3, %ymm7, %ymm7 |
7906 | vpsubw %ymm4, %ymm7, %ymm7 |
7907 | vpsubw %ymm7, %ymm4, %ymm4 |
7908 | vpsubw %ymm4, %ymm6, %ymm6 |
7909 | vpmullw %ymm13, %ymm7, %ymm7 |
7910 | vpsubw %ymm7, %ymm6, %ymm6 |
7911 | vmovdqu 416(%rdi), %ymm9 |
7912 | vmovdqu 768(%rdi), %ymm8 |
7913 | vmovdqu 1120(%rdi), %ymm10 |
7914 | vpaddw %ymm11, %ymm9, %ymm11 |
7915 | vpaddw %ymm6, %ymm8, %ymm6 |
7916 | vpaddw %ymm2, %ymm10, %ymm2 |
7917 | vpshufb shuf48_16(%rip), %ymm4, %ymm4 |
7918 | vpand mask3_5_4_3_1(%rip), %ymm4, %ymm10 |
7919 | vpand mask5_3_5_3(%rip), %ymm4, %ymm4 |
7920 | vpermq $139, %ymm10, %ymm10 |
7921 | vpand mask_keephigh(%rip), %ymm10, %ymm8 |
7922 | vpor %ymm8, %ymm4, %ymm4 |
7923 | vmovdqu 64(%rdi), %ymm8 |
7924 | vpaddw 1920(%rsp), %ymm8, %ymm8 |
7925 | vpaddw %ymm4, %ymm8, %ymm8 |
7926 | vpand mask_mod8192(%rip), %ymm8, %ymm8 |
7927 | vmovdqu %xmm8, 64(%rdi) |
7928 | vextracti128 $1, %ymm8, %xmm8 |
7929 | vmovq %xmm8, 80(%rdi) |
7930 | vmovdqa %xmm10, 1920(%rsp) |
7931 | vpshufb shuf48_16(%rip), %ymm3, %ymm3 |
7932 | vpand mask3_5_4_3_1(%rip), %ymm3, %ymm10 |
7933 | vpand mask5_3_5_3(%rip), %ymm3, %ymm3 |
7934 | vpermq $139, %ymm10, %ymm10 |
7935 | vpand mask_keephigh(%rip), %ymm10, %ymm8 |
7936 | vpor %ymm8, %ymm3, %ymm3 |
7937 | vpaddw 2176(%rsp), %ymm11, %ymm11 |
7938 | vpaddw %ymm3, %ymm11, %ymm11 |
7939 | vmovdqa %xmm10, 2176(%rsp) |
7940 | vpshufb shuf48_16(%rip), %ymm7, %ymm7 |
7941 | vpand mask3_5_4_3_1(%rip), %ymm7, %ymm10 |
7942 | vpand mask5_3_5_3(%rip), %ymm7, %ymm7 |
7943 | vpermq $139, %ymm10, %ymm10 |
7944 | vpand mask_keephigh(%rip), %ymm10, %ymm8 |
7945 | vpor %ymm8, %ymm7, %ymm7 |
7946 | vpaddw 2432(%rsp), %ymm6, %ymm6 |
7947 | vpaddw %ymm7, %ymm6, %ymm6 |
7948 | vmovdqa %xmm10, 2432(%rsp) |
7949 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
7950 | vpand mask3_5_4_3_1(%rip), %ymm5, %ymm10 |
7951 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
7952 | vpermq $139, %ymm10, %ymm10 |
7953 | vpand mask_keephigh(%rip), %ymm10, %ymm8 |
7954 | vpor %ymm8, %ymm5, %ymm5 |
7955 | vpaddw 2688(%rsp), %ymm2, %ymm2 |
7956 | vpaddw %ymm5, %ymm2, %ymm2 |
7957 | vmovdqa %xmm10, 2688(%rsp) |
7958 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
7959 | vmovdqu %xmm11, 416(%rdi) |
7960 | vextracti128 $1, %ymm11, %xmm11 |
7961 | vmovq %xmm11, 432(%rdi) |
7962 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
7963 | vmovdqu %xmm6, 768(%rdi) |
7964 | vextracti128 $1, %ymm6, %xmm6 |
7965 | vmovq %xmm6, 784(%rdi) |
7966 | vpand mask_mod8192(%rip), %ymm2, %ymm2 |
7967 | vmovdqu %xmm2, 1120(%rdi) |
7968 | vextracti128 $1, %ymm2, %xmm2 |
7969 | vmovq %xmm2, 1136(%rdi) |
7970 | vmovdqa 160(%rsp), %ymm5 |
7971 | vpunpcklwd const0(%rip), %ymm5, %ymm7 |
7972 | vpunpckhwd const0(%rip), %ymm5, %ymm3 |
7973 | vpslld $1, %ymm7, %ymm7 |
7974 | vpslld $1, %ymm3, %ymm3 |
7975 | vmovdqa 416(%rsp), %ymm4 |
7976 | vpunpcklwd const0(%rip), %ymm4, %ymm2 |
7977 | vpunpckhwd const0(%rip), %ymm4, %ymm4 |
7978 | vmovdqa 672(%rsp), %ymm6 |
7979 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
7980 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
7981 | vpaddd %ymm11, %ymm2, %ymm10 |
7982 | vpaddd %ymm6, %ymm4, %ymm8 |
7983 | vpsubd %ymm7, %ymm10, %ymm10 |
7984 | vpsubd %ymm3, %ymm8, %ymm8 |
7985 | vpsubd %ymm11, %ymm2, %ymm11 |
7986 | vpsubd %ymm6, %ymm4, %ymm6 |
7987 | vpsrld $1, %ymm11, %ymm11 |
7988 | vpsrld $1, %ymm6, %ymm6 |
7989 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
7990 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
7991 | vpackusdw %ymm6, %ymm11, %ymm6 |
7992 | vmovdqa 1696(%rsp), %ymm11 |
7993 | vpunpcklwd const0(%rip), %ymm11, %ymm4 |
7994 | vpunpckhwd const0(%rip), %ymm11, %ymm2 |
7995 | vpslld $1, %ymm4, %ymm4 |
7996 | vpslld $1, %ymm2, %ymm2 |
7997 | vpsubd %ymm4, %ymm10, %ymm10 |
7998 | vpsubd %ymm2, %ymm8, %ymm8 |
7999 | vpsrld $1, %ymm10, %ymm10 |
8000 | vpsrld $1, %ymm8, %ymm8 |
8001 | vpand mask32_to_16(%rip), %ymm10, %ymm10 |
8002 | vpand mask32_to_16(%rip), %ymm8, %ymm8 |
8003 | vpackusdw %ymm8, %ymm10, %ymm8 |
8004 | vmovdqa 928(%rsp), %ymm10 |
8005 | vpaddw 1184(%rsp), %ymm10, %ymm2 |
8006 | vpsubw 1184(%rsp), %ymm10, %ymm10 |
8007 | vpsrlw $2, %ymm10, %ymm10 |
8008 | vpsubw %ymm6, %ymm10, %ymm10 |
8009 | vpmullw %ymm14, %ymm10, %ymm10 |
8010 | vpsllw $1, %ymm5, %ymm4 |
8011 | vpsubw %ymm4, %ymm2, %ymm4 |
8012 | vpsllw $7, %ymm11, %ymm2 |
8013 | vpsubw %ymm2, %ymm4, %ymm2 |
8014 | vpsrlw $3, %ymm2, %ymm2 |
8015 | vpsubw %ymm8, %ymm2, %ymm2 |
8016 | vmovdqa 1440(%rsp), %ymm4 |
8017 | vpsubw %ymm5, %ymm4, %ymm4 |
8018 | vpmullw %ymm15, %ymm11, %ymm3 |
8019 | vpsubw %ymm3, %ymm4, %ymm3 |
8020 | vpmullw %ymm14, %ymm2, %ymm2 |
8021 | vpsubw %ymm2, %ymm8, %ymm8 |
8022 | vpmullw %ymm12, %ymm2, %ymm4 |
8023 | vpaddw %ymm4, %ymm8, %ymm4 |
8024 | vpmullw %ymm12, %ymm4, %ymm4 |
8025 | vpsubw %ymm4, %ymm3, %ymm4 |
8026 | vpmullw %ymm14, %ymm4, %ymm4 |
8027 | vpsubw %ymm6, %ymm4, %ymm4 |
8028 | vpsrlw $3, %ymm4, %ymm4 |
8029 | vpsubw %ymm10, %ymm4, %ymm4 |
8030 | vpsubw %ymm4, %ymm10, %ymm10 |
8031 | vpsubw %ymm10, %ymm6, %ymm6 |
8032 | vpmullw %ymm13, %ymm4, %ymm4 |
8033 | vpsubw %ymm4, %ymm6, %ymm6 |
8034 | vmovdqu 504(%rdi), %ymm3 |
8035 | vmovdqu 856(%rdi), %ymm7 |
8036 | vmovdqu 1208(%rdi), %ymm9 |
8037 | vpaddw %ymm5, %ymm3, %ymm5 |
8038 | vpaddw %ymm6, %ymm7, %ymm6 |
8039 | vpaddw %ymm8, %ymm9, %ymm8 |
8040 | vpshufb shuf48_16(%rip), %ymm10, %ymm10 |
8041 | vpand mask3_5_4_3_1(%rip), %ymm10, %ymm9 |
8042 | vpand mask5_3_5_3(%rip), %ymm10, %ymm10 |
8043 | vpermq $139, %ymm9, %ymm9 |
8044 | vpand mask_keephigh(%rip), %ymm9, %ymm7 |
8045 | vpor %ymm7, %ymm10, %ymm10 |
8046 | vmovdqu 152(%rdi), %ymm7 |
8047 | vpaddw 1952(%rsp), %ymm7, %ymm7 |
8048 | vpaddw %ymm10, %ymm7, %ymm7 |
8049 | vpand mask_mod8192(%rip), %ymm7, %ymm7 |
8050 | vmovdqu %xmm7, 152(%rdi) |
8051 | vextracti128 $1, %ymm7, %xmm7 |
8052 | vmovq %xmm7, 168(%rdi) |
8053 | vmovdqa %xmm9, 1952(%rsp) |
8054 | vpshufb shuf48_16(%rip), %ymm2, %ymm2 |
8055 | vpand mask3_5_4_3_1(%rip), %ymm2, %ymm9 |
8056 | vpand mask5_3_5_3(%rip), %ymm2, %ymm2 |
8057 | vpermq $139, %ymm9, %ymm9 |
8058 | vpand mask_keephigh(%rip), %ymm9, %ymm7 |
8059 | vpor %ymm7, %ymm2, %ymm2 |
8060 | vpaddw 2208(%rsp), %ymm5, %ymm5 |
8061 | vpaddw %ymm2, %ymm5, %ymm5 |
8062 | vmovdqa %xmm9, 2208(%rsp) |
8063 | vpshufb shuf48_16(%rip), %ymm4, %ymm4 |
8064 | vpand mask3_5_4_3_1(%rip), %ymm4, %ymm9 |
8065 | vpand mask5_3_5_3(%rip), %ymm4, %ymm4 |
8066 | vpermq $139, %ymm9, %ymm9 |
8067 | vpand mask_keephigh(%rip), %ymm9, %ymm7 |
8068 | vpor %ymm7, %ymm4, %ymm4 |
8069 | vpaddw 2464(%rsp), %ymm6, %ymm6 |
8070 | vpaddw %ymm4, %ymm6, %ymm6 |
8071 | vmovdqa %xmm9, 2464(%rsp) |
8072 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
8073 | vpand mask3_5_4_3_1(%rip), %ymm11, %ymm9 |
8074 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
8075 | vpermq $139, %ymm9, %ymm9 |
8076 | vpand mask_keephigh(%rip), %ymm9, %ymm7 |
8077 | vpor %ymm7, %ymm11, %ymm11 |
8078 | vpaddw 2720(%rsp), %ymm8, %ymm8 |
8079 | vpaddw %ymm11, %ymm8, %ymm8 |
8080 | vmovdqa %xmm9, 2720(%rsp) |
8081 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
8082 | vmovdqu %xmm5, 504(%rdi) |
8083 | vextracti128 $1, %ymm5, %xmm5 |
8084 | vmovq %xmm5, 520(%rdi) |
8085 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
8086 | vmovdqu %xmm6, 856(%rdi) |
8087 | vextracti128 $1, %ymm6, %xmm6 |
8088 | vmovq %xmm6, 872(%rdi) |
8089 | vpand mask_mod8192(%rip), %ymm8, %ymm8 |
8090 | vmovdqu %xmm8, 1208(%rdi) |
8091 | vextracti128 $1, %ymm8, %xmm8 |
8092 | vmovq %xmm8, 1224(%rdi) |
8093 | vmovdqa 192(%rsp), %ymm11 |
8094 | vpunpcklwd const0(%rip), %ymm11, %ymm4 |
8095 | vpunpckhwd const0(%rip), %ymm11, %ymm2 |
8096 | vpslld $1, %ymm4, %ymm4 |
8097 | vpslld $1, %ymm2, %ymm2 |
8098 | vmovdqa 448(%rsp), %ymm10 |
8099 | vpunpcklwd const0(%rip), %ymm10, %ymm8 |
8100 | vpunpckhwd const0(%rip), %ymm10, %ymm10 |
8101 | vmovdqa 704(%rsp), %ymm6 |
8102 | vpunpcklwd const0(%rip), %ymm6, %ymm5 |
8103 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
8104 | vpaddd %ymm5, %ymm8, %ymm9 |
8105 | vpaddd %ymm6, %ymm10, %ymm7 |
8106 | vpsubd %ymm4, %ymm9, %ymm9 |
8107 | vpsubd %ymm2, %ymm7, %ymm7 |
8108 | vpsubd %ymm5, %ymm8, %ymm5 |
8109 | vpsubd %ymm6, %ymm10, %ymm6 |
8110 | vpsrld $1, %ymm5, %ymm5 |
8111 | vpsrld $1, %ymm6, %ymm6 |
8112 | vpand mask32_to_16(%rip), %ymm5, %ymm5 |
8113 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
8114 | vpackusdw %ymm6, %ymm5, %ymm6 |
8115 | vmovdqa 1728(%rsp), %ymm5 |
8116 | vpunpcklwd const0(%rip), %ymm5, %ymm10 |
8117 | vpunpckhwd const0(%rip), %ymm5, %ymm8 |
8118 | vpslld $1, %ymm10, %ymm10 |
8119 | vpslld $1, %ymm8, %ymm8 |
8120 | vpsubd %ymm10, %ymm9, %ymm9 |
8121 | vpsubd %ymm8, %ymm7, %ymm7 |
8122 | vpsrld $1, %ymm9, %ymm9 |
8123 | vpsrld $1, %ymm7, %ymm7 |
8124 | vpand mask32_to_16(%rip), %ymm9, %ymm9 |
8125 | vpand mask32_to_16(%rip), %ymm7, %ymm7 |
8126 | vpackusdw %ymm7, %ymm9, %ymm7 |
8127 | vmovdqa 960(%rsp), %ymm9 |
8128 | vpaddw 1216(%rsp), %ymm9, %ymm8 |
8129 | vpsubw 1216(%rsp), %ymm9, %ymm9 |
8130 | vpsrlw $2, %ymm9, %ymm9 |
8131 | vpsubw %ymm6, %ymm9, %ymm9 |
8132 | vpmullw %ymm14, %ymm9, %ymm9 |
8133 | vpsllw $1, %ymm11, %ymm10 |
8134 | vpsubw %ymm10, %ymm8, %ymm10 |
8135 | vpsllw $7, %ymm5, %ymm8 |
8136 | vpsubw %ymm8, %ymm10, %ymm8 |
8137 | vpsrlw $3, %ymm8, %ymm8 |
8138 | vpsubw %ymm7, %ymm8, %ymm8 |
8139 | vmovdqa 1472(%rsp), %ymm10 |
8140 | vpsubw %ymm11, %ymm10, %ymm10 |
8141 | vpmullw %ymm15, %ymm5, %ymm2 |
8142 | vpsubw %ymm2, %ymm10, %ymm2 |
8143 | vpmullw %ymm14, %ymm8, %ymm8 |
8144 | vpsubw %ymm8, %ymm7, %ymm7 |
8145 | vpmullw %ymm12, %ymm8, %ymm10 |
8146 | vpaddw %ymm10, %ymm7, %ymm10 |
8147 | vpmullw %ymm12, %ymm10, %ymm10 |
8148 | vpsubw %ymm10, %ymm2, %ymm10 |
8149 | vpmullw %ymm14, %ymm10, %ymm10 |
8150 | vpsubw %ymm6, %ymm10, %ymm10 |
8151 | vpsrlw $3, %ymm10, %ymm10 |
8152 | vpsubw %ymm9, %ymm10, %ymm10 |
8153 | vpsubw %ymm10, %ymm9, %ymm9 |
8154 | vpsubw %ymm9, %ymm6, %ymm6 |
8155 | vpmullw %ymm13, %ymm10, %ymm10 |
8156 | vpsubw %ymm10, %ymm6, %ymm6 |
8157 | vmovdqu 592(%rdi), %ymm2 |
8158 | vmovdqu 944(%rdi), %ymm4 |
8159 | vmovdqu 1296(%rdi), %ymm3 |
8160 | vpaddw %ymm11, %ymm2, %ymm11 |
8161 | vpaddw %ymm6, %ymm4, %ymm6 |
8162 | vpaddw %ymm7, %ymm3, %ymm7 |
8163 | vpshufb shuf48_16(%rip), %ymm9, %ymm9 |
8164 | vpand mask3_5_4_3_1(%rip), %ymm9, %ymm3 |
8165 | vpand mask5_3_5_3(%rip), %ymm9, %ymm9 |
8166 | vpermq $139, %ymm3, %ymm3 |
8167 | vpand mask_keephigh(%rip), %ymm3, %ymm4 |
8168 | vpor %ymm4, %ymm9, %ymm9 |
8169 | vmovdqu 240(%rdi), %ymm4 |
8170 | vpaddw 1984(%rsp), %ymm4, %ymm4 |
8171 | vpaddw %ymm9, %ymm4, %ymm4 |
8172 | vpand mask_mod8192(%rip), %ymm4, %ymm4 |
8173 | vmovdqu %xmm4, 240(%rdi) |
8174 | vextracti128 $1, %ymm4, %xmm4 |
8175 | vmovq %xmm4, 256(%rdi) |
8176 | vmovdqa %xmm3, 1984(%rsp) |
8177 | vpshufb shuf48_16(%rip), %ymm8, %ymm8 |
8178 | vpand mask3_5_4_3_1(%rip), %ymm8, %ymm3 |
8179 | vpand mask5_3_5_3(%rip), %ymm8, %ymm8 |
8180 | vpermq $139, %ymm3, %ymm3 |
8181 | vpand mask_keephigh(%rip), %ymm3, %ymm4 |
8182 | vpor %ymm4, %ymm8, %ymm8 |
8183 | vpaddw 2240(%rsp), %ymm11, %ymm11 |
8184 | vpaddw %ymm8, %ymm11, %ymm11 |
8185 | vmovdqa %xmm3, 2240(%rsp) |
8186 | vpshufb shuf48_16(%rip), %ymm10, %ymm10 |
8187 | vpand mask3_5_4_3_1(%rip), %ymm10, %ymm3 |
8188 | vpand mask5_3_5_3(%rip), %ymm10, %ymm10 |
8189 | vpermq $139, %ymm3, %ymm3 |
8190 | vpand mask_keephigh(%rip), %ymm3, %ymm4 |
8191 | vpor %ymm4, %ymm10, %ymm10 |
8192 | vpaddw 2496(%rsp), %ymm6, %ymm6 |
8193 | vpaddw %ymm10, %ymm6, %ymm6 |
8194 | vmovdqa %xmm3, 2496(%rsp) |
8195 | vpshufb shuf48_16(%rip), %ymm5, %ymm5 |
8196 | vpand mask3_5_4_3_1(%rip), %ymm5, %ymm3 |
8197 | vpand mask5_3_5_3(%rip), %ymm5, %ymm5 |
8198 | vpermq $139, %ymm3, %ymm3 |
8199 | vpand mask_keephigh(%rip), %ymm3, %ymm4 |
8200 | vpor %ymm4, %ymm5, %ymm5 |
8201 | vpaddw 2752(%rsp), %ymm7, %ymm7 |
8202 | vpaddw %ymm5, %ymm7, %ymm7 |
8203 | vmovdqa %xmm3, 2752(%rsp) |
8204 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8205 | vmovdqu %xmm11, 592(%rdi) |
8206 | vextracti128 $1, %ymm11, %xmm11 |
8207 | vmovq %xmm11, 608(%rdi) |
8208 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
8209 | vmovdqu %xmm6, 944(%rdi) |
8210 | vextracti128 $1, %ymm6, %xmm6 |
8211 | vmovq %xmm6, 960(%rdi) |
8212 | vpand mask_mod8192(%rip), %ymm7, %ymm7 |
8213 | vmovdqu %xmm7, 1296(%rdi) |
8214 | vextracti128 $1, %ymm7, %xmm7 |
8215 | vmovq %xmm7, 1312(%rdi) |
8216 | vmovdqa 224(%rsp), %ymm5 |
8217 | vpunpcklwd const0(%rip), %ymm5, %ymm10 |
8218 | vpunpckhwd const0(%rip), %ymm5, %ymm8 |
8219 | vpslld $1, %ymm10, %ymm10 |
8220 | vpslld $1, %ymm8, %ymm8 |
8221 | vmovdqa 480(%rsp), %ymm9 |
8222 | vpunpcklwd const0(%rip), %ymm9, %ymm7 |
8223 | vpunpckhwd const0(%rip), %ymm9, %ymm9 |
8224 | vmovdqa 736(%rsp), %ymm6 |
8225 | vpunpcklwd const0(%rip), %ymm6, %ymm11 |
8226 | vpunpckhwd const0(%rip), %ymm6, %ymm6 |
8227 | vpaddd %ymm11, %ymm7, %ymm3 |
8228 | vpaddd %ymm6, %ymm9, %ymm4 |
8229 | vpsubd %ymm10, %ymm3, %ymm3 |
8230 | vpsubd %ymm8, %ymm4, %ymm4 |
8231 | vpsubd %ymm11, %ymm7, %ymm11 |
8232 | vpsubd %ymm6, %ymm9, %ymm6 |
8233 | vpsrld $1, %ymm11, %ymm11 |
8234 | vpsrld $1, %ymm6, %ymm6 |
8235 | vpand mask32_to_16(%rip), %ymm11, %ymm11 |
8236 | vpand mask32_to_16(%rip), %ymm6, %ymm6 |
8237 | vpackusdw %ymm6, %ymm11, %ymm6 |
8238 | vmovdqa 1760(%rsp), %ymm11 |
8239 | vpunpcklwd const0(%rip), %ymm11, %ymm9 |
8240 | vpunpckhwd const0(%rip), %ymm11, %ymm7 |
8241 | vpslld $1, %ymm9, %ymm9 |
8242 | vpslld $1, %ymm7, %ymm7 |
8243 | vpsubd %ymm9, %ymm3, %ymm3 |
8244 | vpsubd %ymm7, %ymm4, %ymm4 |
8245 | vpsrld $1, %ymm3, %ymm3 |
8246 | vpsrld $1, %ymm4, %ymm4 |
8247 | vpand mask32_to_16(%rip), %ymm3, %ymm3 |
8248 | vpand mask32_to_16(%rip), %ymm4, %ymm4 |
8249 | vpackusdw %ymm4, %ymm3, %ymm4 |
8250 | vmovdqa 992(%rsp), %ymm3 |
8251 | vpaddw 1248(%rsp), %ymm3, %ymm7 |
8252 | vpsubw 1248(%rsp), %ymm3, %ymm3 |
8253 | vpsrlw $2, %ymm3, %ymm3 |
8254 | vpsubw %ymm6, %ymm3, %ymm3 |
8255 | vpmullw %ymm14, %ymm3, %ymm3 |
8256 | vpsllw $1, %ymm5, %ymm9 |
8257 | vpsubw %ymm9, %ymm7, %ymm9 |
8258 | vpsllw $7, %ymm11, %ymm7 |
8259 | vpsubw %ymm7, %ymm9, %ymm7 |
8260 | vpsrlw $3, %ymm7, %ymm7 |
8261 | vpsubw %ymm4, %ymm7, %ymm7 |
8262 | vmovdqa 1504(%rsp), %ymm9 |
8263 | vpsubw %ymm5, %ymm9, %ymm9 |
8264 | vpmullw %ymm15, %ymm11, %ymm8 |
8265 | vpsubw %ymm8, %ymm9, %ymm8 |
8266 | vpmullw %ymm14, %ymm7, %ymm7 |
8267 | vpsubw %ymm7, %ymm4, %ymm4 |
8268 | vpmullw %ymm12, %ymm7, %ymm9 |
8269 | vpaddw %ymm9, %ymm4, %ymm9 |
8270 | vpmullw %ymm12, %ymm9, %ymm9 |
8271 | vpsubw %ymm9, %ymm8, %ymm9 |
8272 | vpmullw %ymm14, %ymm9, %ymm9 |
8273 | vpsubw %ymm6, %ymm9, %ymm9 |
8274 | vpsrlw $3, %ymm9, %ymm9 |
8275 | vpsubw %ymm3, %ymm9, %ymm9 |
8276 | vpsubw %ymm9, %ymm3, %ymm3 |
8277 | vpsubw %ymm3, %ymm6, %ymm6 |
8278 | vpmullw %ymm13, %ymm9, %ymm9 |
8279 | vpsubw %ymm9, %ymm6, %ymm6 |
8280 | vextracti128 $1, %ymm4, %xmm8 |
8281 | vpshufb shufmin1_mask3(%rip), %ymm8, %ymm8 |
8282 | vmovdqa %ymm8, 2816(%rsp) |
8283 | vextracti128 $1, %ymm3, %xmm8 |
8284 | vpshufb shufmin1_mask3(%rip), %ymm8, %ymm8 |
8285 | vmovdqa %ymm8, 2848(%rsp) |
8286 | vextracti128 $1, %ymm7, %xmm8 |
8287 | vpshufb shufmin1_mask3(%rip), %ymm8, %ymm8 |
8288 | vmovdqa %ymm8, 2880(%rsp) |
8289 | vmovdqu 680(%rdi), %ymm8 |
8290 | vmovdqu 1032(%rdi), %ymm10 |
8291 | vmovdqu 1384(%rdi), %ymm2 |
8292 | vpaddw %ymm5, %ymm8, %ymm5 |
8293 | vpaddw %ymm6, %ymm10, %ymm6 |
8294 | vpaddw %ymm4, %ymm2, %ymm4 |
8295 | vpshufb shuf48_16(%rip), %ymm3, %ymm3 |
8296 | vpand mask3_5_4_3_1(%rip), %ymm3, %ymm2 |
8297 | vpand mask5_3_5_3(%rip), %ymm3, %ymm3 |
8298 | vpermq $139, %ymm2, %ymm2 |
8299 | vpand mask_keephigh(%rip), %ymm2, %ymm10 |
8300 | vpor %ymm10, %ymm3, %ymm3 |
8301 | vmovdqu 328(%rdi), %ymm10 |
8302 | vpaddw 2016(%rsp), %ymm10, %ymm10 |
8303 | vpaddw %ymm3, %ymm10, %ymm10 |
8304 | vpand mask_mod8192(%rip), %ymm10, %ymm10 |
8305 | vmovdqu %xmm10, 328(%rdi) |
8306 | vextracti128 $1, %ymm10, %xmm10 |
8307 | vmovq %xmm10, 344(%rdi) |
8308 | vpshufb shufmin1_mask3(%rip), %ymm10, %ymm10 |
8309 | vmovdqa %xmm10, 1792(%rsp) |
8310 | vmovdqa %xmm2, 2016(%rsp) |
8311 | vpshufb shuf48_16(%rip), %ymm7, %ymm7 |
8312 | vpand mask3_5_4_3_1(%rip), %ymm7, %ymm2 |
8313 | vpand mask5_3_5_3(%rip), %ymm7, %ymm7 |
8314 | vpermq $139, %ymm2, %ymm2 |
8315 | vpand mask_keephigh(%rip), %ymm2, %ymm10 |
8316 | vpor %ymm10, %ymm7, %ymm7 |
8317 | vpaddw 2272(%rsp), %ymm5, %ymm5 |
8318 | vpaddw %ymm7, %ymm5, %ymm5 |
8319 | vmovdqa %xmm2, 2272(%rsp) |
8320 | vpshufb shuf48_16(%rip), %ymm9, %ymm9 |
8321 | vpand mask3_5_4_3_1(%rip), %ymm9, %ymm2 |
8322 | vpand mask5_3_5_3(%rip), %ymm9, %ymm9 |
8323 | vpermq $139, %ymm2, %ymm2 |
8324 | vpand mask_keephigh(%rip), %ymm2, %ymm10 |
8325 | vpor %ymm10, %ymm9, %ymm9 |
8326 | vpaddw 2528(%rsp), %ymm6, %ymm6 |
8327 | vpaddw %ymm9, %ymm6, %ymm6 |
8328 | vmovdqa %xmm2, 2528(%rsp) |
8329 | vpshufb shuf48_16(%rip), %ymm11, %ymm11 |
8330 | vpand mask3_5_4_3_1(%rip), %ymm11, %ymm2 |
8331 | vpand mask5_3_5_3(%rip), %ymm11, %ymm11 |
8332 | vpermq $139, %ymm2, %ymm2 |
8333 | vpand mask_keephigh(%rip), %ymm2, %ymm10 |
8334 | vpor %ymm10, %ymm11, %ymm11 |
8335 | vpaddw 2784(%rsp), %ymm4, %ymm4 |
8336 | vpaddw %ymm11, %ymm4, %ymm4 |
8337 | vmovdqa %xmm2, 2784(%rsp) |
8338 | vpand mask_mod8192(%rip), %ymm5, %ymm5 |
8339 | vmovdqu %xmm5, 680(%rdi) |
8340 | vextracti128 $1, %ymm5, %xmm5 |
8341 | vmovq %xmm5, 696(%rdi) |
8342 | vpand mask_mod8192(%rip), %ymm6, %ymm6 |
8343 | vmovdqu %xmm6, 1032(%rdi) |
8344 | vextracti128 $1, %ymm6, %xmm6 |
8345 | vmovq %xmm6, 1048(%rdi) |
8346 | vpand mask_mod8192(%rip), %ymm4, %ymm4 |
8347 | vmovdqu %xmm4, 1384(%rdi) |
8348 | vextracti128 $1, %ymm4, %xmm4 |
8349 | vpextrw $0, %xmm4, 1400(%rdi) |
8350 | vmovdqu 0(%rdi), %ymm11 |
8351 | vpaddw 1888(%rsp), %ymm11, %ymm11 |
8352 | vpaddw 2816(%rsp), %ymm11, %ymm11 |
8353 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8354 | vmovdqu %ymm11, 0(%rdi) |
8355 | vmovdqu 352(%rdi), %ymm11 |
8356 | vpaddw 2528(%rsp), %ymm11, %ymm11 |
8357 | vpaddw 2848(%rsp), %ymm11, %ymm11 |
8358 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8359 | vmovdqu %ymm11, 352(%rdi) |
8360 | vmovdqu 704(%rdi), %ymm11 |
8361 | vpaddw 2784(%rsp), %ymm11, %ymm11 |
8362 | vpaddw 2880(%rsp), %ymm11, %ymm11 |
8363 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8364 | vmovdqu %ymm11, 704(%rdi) |
8365 | vmovdqu 88(%rdi), %ymm11 |
8366 | vpaddw 2048(%rsp), %ymm11, %ymm11 |
8367 | vpaddw 1920(%rsp), %ymm11, %ymm11 |
8368 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8369 | vmovdqu %ymm11, 88(%rdi) |
8370 | vmovdqu 440(%rdi), %ymm11 |
8371 | vpaddw 2304(%rsp), %ymm11, %ymm11 |
8372 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8373 | vmovdqu %ymm11, 440(%rdi) |
8374 | vmovdqu 792(%rdi), %ymm11 |
8375 | vpaddw 2560(%rsp), %ymm11, %ymm11 |
8376 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8377 | vmovdqu %ymm11, 792(%rdi) |
8378 | vmovdqu 176(%rdi), %ymm11 |
8379 | vpaddw 2080(%rsp), %ymm11, %ymm11 |
8380 | vpaddw 1952(%rsp), %ymm11, %ymm11 |
8381 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8382 | vmovdqu %ymm11, 176(%rdi) |
8383 | vmovdqu 528(%rdi), %ymm11 |
8384 | vpaddw 2336(%rsp), %ymm11, %ymm11 |
8385 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8386 | vmovdqu %ymm11, 528(%rdi) |
8387 | vmovdqu 880(%rdi), %ymm11 |
8388 | vpaddw 2592(%rsp), %ymm11, %ymm11 |
8389 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8390 | vmovdqu %ymm11, 880(%rdi) |
8391 | vmovdqu 264(%rdi), %ymm11 |
8392 | vpaddw 2112(%rsp), %ymm11, %ymm11 |
8393 | vpaddw 1984(%rsp), %ymm11, %ymm11 |
8394 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8395 | vmovdqu %ymm11, 264(%rdi) |
8396 | vmovdqu 616(%rdi), %ymm11 |
8397 | vpaddw 2368(%rsp), %ymm11, %ymm11 |
8398 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8399 | vmovdqu %ymm11, 616(%rdi) |
8400 | vmovdqu 968(%rdi), %ymm11 |
8401 | vpaddw 2624(%rsp), %ymm11, %ymm11 |
8402 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8403 | vmovdqu %ymm11, 968(%rdi) |
8404 | vmovdqu 352(%rdi), %ymm11 |
8405 | vpaddw 2144(%rsp), %ymm11, %ymm11 |
8406 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8407 | vmovdqu %ymm11, 352(%rdi) |
8408 | vmovdqu 704(%rdi), %ymm11 |
8409 | vpaddw 2400(%rsp), %ymm11, %ymm11 |
8410 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8411 | vmovdqu %ymm11, 704(%rdi) |
8412 | vmovdqu 1056(%rdi), %ymm11 |
8413 | vpaddw 2656(%rsp), %ymm11, %ymm11 |
8414 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8415 | vmovdqu %ymm11, 1056(%rdi) |
8416 | vmovdqu 440(%rdi), %ymm11 |
8417 | vpaddw 2176(%rsp), %ymm11, %ymm11 |
8418 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8419 | vmovdqu %ymm11, 440(%rdi) |
8420 | vmovdqu 792(%rdi), %ymm11 |
8421 | vpaddw 2432(%rsp), %ymm11, %ymm11 |
8422 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8423 | vmovdqu %ymm11, 792(%rdi) |
8424 | vmovdqu 1144(%rdi), %ymm11 |
8425 | vpaddw 2688(%rsp), %ymm11, %ymm11 |
8426 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8427 | vmovdqu %ymm11, 1144(%rdi) |
8428 | vmovdqu 528(%rdi), %ymm11 |
8429 | vpaddw 2208(%rsp), %ymm11, %ymm11 |
8430 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8431 | vmovdqu %ymm11, 528(%rdi) |
8432 | vmovdqu 880(%rdi), %ymm11 |
8433 | vpaddw 2464(%rsp), %ymm11, %ymm11 |
8434 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8435 | vmovdqu %ymm11, 880(%rdi) |
8436 | vmovdqu 1232(%rdi), %ymm11 |
8437 | vpaddw 2720(%rsp), %ymm11, %ymm11 |
8438 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8439 | vmovdqu %ymm11, 1232(%rdi) |
8440 | vmovdqu 616(%rdi), %ymm11 |
8441 | vpaddw 2240(%rsp), %ymm11, %ymm11 |
8442 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8443 | vmovdqu %ymm11, 616(%rdi) |
8444 | vmovdqu 968(%rdi), %ymm11 |
8445 | vpaddw 2496(%rsp), %ymm11, %ymm11 |
8446 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8447 | vmovdqu %ymm11, 968(%rdi) |
8448 | vmovdqu 1320(%rdi), %ymm11 |
8449 | vpaddw 2752(%rsp), %ymm11, %ymm11 |
8450 | vpand mask_mod8192(%rip), %ymm11, %ymm11 |
8451 | vmovdqu %ymm11, 1320(%rdi) |
8452 | mov %r8, %rsp |
8453 | pop %r12 |
8454 | .cfi_restore r12 |
8455 | pop %rbp |
8456 | .cfi_restore rbp |
8457 | .cfi_def_cfa_register rsp |
8458 | .cfi_adjust_cfa_offset -8 |
8459 | ret |
8460 | .cfi_endproc |
8461 | .size poly_Rq_mul,.-poly_Rq_mul |
8462 | |
8463 | #endif |
8464 | |