1 | |
2 | |
3 | |
4 | |
5 | |
6 | |
7 | |
8 | |
9 | |
10 | |
11 | |
12 | |
13 | |
14 | |
15 | |
16 | |
17 | |
18 | |
19 | |
20 | |
21 | |
22 | |
23 | |
24 | #ifndef __IMMINTRIN_H |
25 | #error "Never use <avx512vnniintrin.h> directly; include <immintrin.h> instead." |
26 | #endif |
27 | |
28 | #ifndef __AVX512VNNIINTRIN_H |
29 | #define __AVX512VNNIINTRIN_H |
30 | |
31 | |
32 | #define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vnni"), __min_vector_width__(512))) |
33 | |
34 | |
35 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
36 | _mm512_dpbusd_epi32(__m512i __S, __m512i __A, __m512i __B) |
37 | { |
38 | return (__m512i)__builtin_ia32_vpdpbusd512((__v16si)__S, (__v16si)__A, |
39 | (__v16si)__B); |
40 | } |
41 | |
42 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
43 | _mm512_mask_dpbusd_epi32(__m512i __S, __mmask16 __U, __m512i __A, __m512i __B) |
44 | { |
45 | return (__m512i)__builtin_ia32_selectd_512(__U, |
46 | (__v16si)_mm512_dpbusd_epi32(__S, __A, __B), |
47 | (__v16si)__S); |
48 | } |
49 | |
50 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
51 | _mm512_maskz_dpbusd_epi32(__mmask16 __U, __m512i __S, __m512i __A, __m512i __B) |
52 | { |
53 | return (__m512i)__builtin_ia32_selectd_512(__U, |
54 | (__v16si)_mm512_dpbusd_epi32(__S, __A, __B), |
55 | (__v16si)_mm512_setzero_si512()); |
56 | } |
57 | |
58 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
59 | _mm512_dpbusds_epi32(__m512i __S, __m512i __A, __m512i __B) |
60 | { |
61 | return (__m512i)__builtin_ia32_vpdpbusds512((__v16si)__S, (__v16si)__A, |
62 | (__v16si)__B); |
63 | } |
64 | |
65 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
66 | _mm512_mask_dpbusds_epi32(__m512i __S, __mmask16 __U, __m512i __A, __m512i __B) |
67 | { |
68 | return (__m512i)__builtin_ia32_selectd_512(__U, |
69 | (__v16si)_mm512_dpbusds_epi32(__S, __A, __B), |
70 | (__v16si)__S); |
71 | } |
72 | |
73 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
74 | _mm512_maskz_dpbusds_epi32(__mmask16 __U, __m512i __S, __m512i __A, __m512i __B) |
75 | { |
76 | return (__m512i)__builtin_ia32_selectd_512(__U, |
77 | (__v16si)_mm512_dpbusds_epi32(__S, __A, __B), |
78 | (__v16si)_mm512_setzero_si512()); |
79 | } |
80 | |
81 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
82 | _mm512_dpwssd_epi32(__m512i __S, __m512i __A, __m512i __B) |
83 | { |
84 | return (__m512i)__builtin_ia32_vpdpwssd512((__v16si)__S, (__v16si)__A, |
85 | (__v16si)__B); |
86 | } |
87 | |
88 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
89 | _mm512_mask_dpwssd_epi32(__m512i __S, __mmask16 __U, __m512i __A, __m512i __B) |
90 | { |
91 | return (__m512i)__builtin_ia32_selectd_512(__U, |
92 | (__v16si)_mm512_dpwssd_epi32(__S, __A, __B), |
93 | (__v16si)__S); |
94 | } |
95 | |
96 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
97 | _mm512_maskz_dpwssd_epi32(__mmask16 __U, __m512i __S, __m512i __A, __m512i __B) |
98 | { |
99 | return (__m512i)__builtin_ia32_selectd_512(__U, |
100 | (__v16si)_mm512_dpwssd_epi32(__S, __A, __B), |
101 | (__v16si)_mm512_setzero_si512()); |
102 | } |
103 | |
104 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
105 | _mm512_dpwssds_epi32(__m512i __S, __m512i __A, __m512i __B) |
106 | { |
107 | return (__m512i)__builtin_ia32_vpdpwssds512((__v16si)__S, (__v16si)__A, |
108 | (__v16si)__B); |
109 | } |
110 | |
111 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
112 | _mm512_mask_dpwssds_epi32(__m512i __S, __mmask16 __U, __m512i __A, __m512i __B) |
113 | { |
114 | return (__m512i)__builtin_ia32_selectd_512(__U, |
115 | (__v16si)_mm512_dpwssds_epi32(__S, __A, __B), |
116 | (__v16si)__S); |
117 | } |
118 | |
119 | static __inline__ __m512i __DEFAULT_FN_ATTRS |
120 | _mm512_maskz_dpwssds_epi32(__mmask16 __U, __m512i __S, __m512i __A, __m512i __B) |
121 | { |
122 | return (__m512i)__builtin_ia32_selectd_512(__U, |
123 | (__v16si)_mm512_dpwssds_epi32(__S, __A, __B), |
124 | (__v16si)_mm512_setzero_si512()); |
125 | } |
126 | |
127 | #undef __DEFAULT_FN_ATTRS |
128 | |
129 | #endif |
130 | |