Clang Project

clang_source_code/test/OpenMP/for_private_codegen.cpp
1// RUN: %clang_cc1 -verify -fopenmp -x c++ -triple x86_64-unknown-unknown -emit-llvm %s -o - | FileCheck %s
2// RUN: %clang_cc1 -fopenmp -x c++ -std=c++11 -triple x86_64-unknown-unknown -emit-pch -o %t %s
3// RUN: %clang_cc1 -fopenmp -x c++ -triple x86_64-unknown-unknown -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s
4// RUN: %clang_cc1 -verify -fopenmp -x c++ -std=c++11 -DLAMBDA -triple %itanium_abi_triple -emit-llvm %s -o - | FileCheck -check-prefix=LAMBDA %s
5// RUN: %clang_cc1 -verify -fopenmp -x c++ -fblocks -DBLOCKS -triple %itanium_abi_triple -emit-llvm %s -o - | FileCheck -check-prefix=BLOCKS %s
6
7// RUN: %clang_cc1 -verify -fopenmp-simd -x c++ -triple x86_64-unknown-unknown -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY0 %s
8// RUN: %clang_cc1 -fopenmp-simd -x c++ -std=c++11 -triple x86_64-unknown-unknown -emit-pch -o %t %s
9// RUN: %clang_cc1 -fopenmp-simd -x c++ -triple x86_64-unknown-unknown -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck --check-prefix SIMD-ONLY0 %s
10// RUN: %clang_cc1 -verify -fopenmp-simd -x c++ -std=c++11 -DLAMBDA -triple %itanium_abi_triple -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY0 %s
11// RUN: %clang_cc1 -verify -fopenmp-simd -x c++ -fblocks -DBLOCKS -triple %itanium_abi_triple -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY0 %s
12// SIMD-ONLY0-NOT: {{__kmpc|__tgt}}
13// expected-no-diagnostics
14#ifndef HEADER
15#define HEADER
16
17template <class T>
18struct S {
19  T f;
20  S(T a) : f(a) {}
21  S() : f() {}
22  operator T() { return T(); }
23  ~S() {}
24};
25
26volatile double g;
27volatile double &g1 = g;
28
29// CHECK: [[S_FLOAT_TY:%.+]] = type { float }
30// CHECK: [[S_INT_TY:%.+]] = type { i{{[0-9]+}} }
31template <typename T>
32T tmain() {
33  S<T> test;
34  T t_var = T();
35  T vec[] = {1, 2};
36  S<T> s_arr[] = {1, 2};
37  S<T> &var = test;
38#pragma omp parallel
39#pragma omp for private(t_var, vec, s_arr, s_arr, var, var)
40  for (int i = 0; i < 2; ++i) {
41    vec[i] = t_var;
42    s_arr[i] = var;
43  }
44  return T();
45}
46
47int main() {
48  static int svar;
49#ifdef LAMBDA
50  // LAMBDA: [[G:@.+]] = {{(dso_local )?}}global double
51  // LAMBDA-LABEL: @main
52  // LAMBDA: call{{.*}} void [[OUTER_LAMBDA:@.+]](
53  [&]() {
54  static float sfvar;
55  // LAMBDA: define{{.*}} internal{{.*}} void [[OUTER_LAMBDA]](
56  // LAMBDA: call {{.*}}void {{.+}} @__kmpc_fork_call({{.+}}, i32 0, {{.+}}* [[OMP_REGION:@.+]] to {{.+}})
57#pragma omp parallel
58#pragma omp for private(g, g1, svar, sfvar)
59  for (int i = 0; i < 2; ++i) {
60    // LAMBDA: define{{.*}} internal{{.*}} void [[OMP_REGION]](i32* noalias %{{.+}}, i32* noalias %{{.+}})
61    // LAMBDA: [[G_PRIVATE_ADDR:%.+]] = alloca double,
62    // LAMBDA: [[G1_PRIVATE_ADDR:%.+]] = alloca double,
63    // LAMBDA: [[G1_PRIVATE_REF:%.+]] = alloca double*,
64    // LAMBDA: [[SVAR_PRIVATE_ADDR:%.+]] = alloca i{{[0-9]+}},
65    // LAMBDA: [[SFVAR_PRIVATE_ADDR:%.+]] = alloca float,
66    g = 1;
67    g1 = 1;
68    svar = 3;
69    sfvar = 4.0;
70    // LAMBDA: call {{.*}}void @__kmpc_for_static_init_4(
71    // LAMBDA: store double 1.0{{.+}}, double* [[G_PRIVATE_ADDR]],
72    // LAMBDA: [[G1_PRIVATE_ADDR:%.+]] = load double*, double** [[G1_PRIVATE_REF]],
73    // LAMBDA: store volatile double 1.0{{.+}}, double* [[G1_PRIVATE_ADDR]],
74    // LAMBDA: store i{{[0-9]+}} 3, i{{[0-9]+}}* [[SVAR_PRIVATE_ADDR]],
75    // LAMBDA: store float 4.0{{.+}}, float* [[SFVAR_PRIVATE_ADDR]],
76    // LAMBDA: [[G_PRIVATE_ADDR_REF:%.+]] = getelementptr inbounds %{{.+}}, %{{.+}}* [[ARG:%.+]], i{{[0-9]+}} 0, i{{[0-9]+}} 0
77    // LAMBDA: store double* [[G_PRIVATE_ADDR]], double** [[G_PRIVATE_ADDR_REF]]
78    // LAMBDA: [[G1_PRIVATE_ADDR_REF:%.+]] = getelementptr inbounds %{{.+}}, %{{.+}}* [[ARG:%.+]], i{{[0-9]+}} 0, i{{[0-9]+}} 1
79    // LAMBDA: [[G1_PRIVATE_ADDR:%.+]] = load double*, double** [[G1_PRIVATE_REF]],
80    // LAMBDA: store double* [[G1_PRIVATE_ADDR]], double** [[G1_PRIVATE_ADDR_REF]]
81    // LAMBDA: [[SVAR_PRIVATE_ADDR_REF:%.+]] = getelementptr inbounds %{{.+}}, %{{.+}}* [[ARG:%.+]], i{{[0-9]+}} 0, i{{[0-9]+}} 2
82    // LAMBDA: store i{{[0-9]+}}* [[SVAR_PRIVATE_ADDR]], i{{[0-9]+}}** [[SVAR_PRIVATE_ADDR_REF]]
83    // LAMBDA: [[SFVAR_PRIVATE_ADDR_REF:%.+]] = getelementptr inbounds %{{.+}}, %{{.+}}* [[ARG:%.+]], i{{[0-9]+}} 0, i{{[0-9]+}} 3
84    // LAMBDA: store float* [[SFVAR_PRIVATE_ADDR]], float** [[SFVAR_PRIVATE_ADDR_REF]]
85    // LAMBDA: call{{.*}} void [[INNER_LAMBDA:@.+]](%{{.+}}* [[ARG]])
86    // LAMBDA: call {{.*}}void @__kmpc_for_static_fini(
87    [&]() {
88      // LAMBDA: define {{.+}} void [[INNER_LAMBDA]](%{{.+}}* [[ARG_PTR:%.+]])
89      // LAMBDA: store %{{.+}}* [[ARG_PTR]], %{{.+}}** [[ARG_PTR_REF:%.+]],
90      g = 2;
91      g1 = 2;
92      svar = 4;
93      sfvar = 8.0;
94      // LAMBDA: [[ARG_PTR:%.+]] = load %{{.+}}*, %{{.+}}** [[ARG_PTR_REF]]
95      // LAMBDA: [[G_PTR_REF:%.+]] = getelementptr inbounds %{{.+}}, %{{.+}}* [[ARG_PTR]], i{{[0-9]+}} 0, i{{[0-9]+}} 0
96      // LAMBDA: [[G_REF:%.+]] = load double*, double** [[G_PTR_REF]]
97      // LAMBDA: store double 2.0{{.+}}, double* [[G_REF]]
98      // LAMBDA: [[G1_PTR_REF:%.+]] = getelementptr inbounds %{{.+}}, %{{.+}}* [[ARG_PTR]], i{{[0-9]+}} 0, i{{[0-9]+}} 1
99      // LAMBDA: [[G1_REF:%.+]] = load double*, double** [[G1_PTR_REF]]
100      // LAMBDA: store double 2.0{{.+}}, double* [[G1_REF]]
101      // LAMBDA: [[SVAR_PTR_REF:%.+]] = getelementptr inbounds %{{.+}}, %{{.+}}* [[ARG_PTR]], i{{[0-9]+}} 0, i{{[0-9]+}} 2
102      // LAMBDA: [[SVAR_REF:%.+]] = load i{{[0-9]+}}*, i{{[0-9]+}}** [[SVAR_PTR_REF]]
103      // LAMBDA: store i{{[0-9]+}} 4, i{{[0-9]+}}* [[SVAR_REF]]
104      // LAMBDA: [[SFVAR_PTR_REF:%.+]] = getelementptr inbounds %{{.+}}, %{{.+}}* [[ARG_PTR]], i{{[0-9]+}} 0, i{{[0-9]+}} 3
105      // LAMBDA: [[SFVAR_REF:%.+]] = load float*, float** [[SFVAR_PTR_REF]]
106      // LAMBDA: store float 8.0{{.+}}, float* [[SFVAR_REF]]
107    }();
108  }
109  }();
110  return 0;
111#elif defined(BLOCKS)
112  // BLOCKS: [[G:@.+]] = {{(dso_local )?}}global double
113  // BLOCKS-LABEL: @main
114  // BLOCKS: call {{.*}}void {{%.+}}(i8
115  ^{
116  static float sfvar;
117  // BLOCKS: define{{.*}} internal{{.*}} void {{.+}}(i8*
118  // BLOCKS: call {{.*}}void {{.+}} @__kmpc_fork_call({{.+}}, i32 0, {{.+}}* [[OMP_REGION:@.+]] to {{.+}})
119#pragma omp parallel
120#pragma omp for private(g, g1, svar, sfvar)
121  for (int i = 0; i < 2; ++i) {
122    // BLOCKS: define{{.*}} internal{{.*}} void [[OMP_REGION]](i32* noalias %{{.+}}, i32* noalias %{{.+}})
123    // BLOCKS: [[G_PRIVATE_ADDR:%.+]] = alloca double,
124    // BLOCKS: [[SVAR_PRIVATE_ADDR:%.+]] = alloca i{{[0-9]+}},
125    // BLOCKS: [[SFVAR_PRIVATE_ADDR:%.+]] = alloca float,
126    g = 1;
127    g1 = 1;
128    svar = 2;
129    sfvar = 3.0;
130    // BLOCKS: call {{.*}}void @__kmpc_for_static_init_4(
131    // BLOCKS: store double 1.0{{.+}}, double* [[G_PRIVATE_ADDR]],
132    // BLOCKS-NOT: [[G]]{{[[^:word:]]}}
133    // BLOCKS: store i{{[0-9]+}} 2, i{{[0-9]+}}* [[SVAR_PRIVATE_ADDR]],
134    // BLOCKS-NOT: [[SVAR]]{{[[^:word:]]}}
135    // BLOCKS: store float 3.0{{.+}}, float* [[SFVAR_PRIVATE_ADDR]],
136    // BLOCKS-NOT: [[SFVAR]]{{[[^:word:]]}}
137    // BLOCKS: double* [[G_PRIVATE_ADDR]]
138    // BLOCKS-NOT: [[G]]{{[[^:word:]]}}
139    // BLOCKS: i{{[0-9]+}}* [[SVAR_PRIVATE_ADDR]]
140    // BLOCKS-NOT: [[SVAR]]{{[[^:word:]]}}
141    // BLOCKS: float* [[SFVAR_PRIVATE_ADDR]]
142    // BLOCKS-NOT: [[SFVAR]]{{[[^:word:]]}}
143    // BLOCKS: call {{.*}}void {{%.+}}(i8
144    // BLOCKS: call {{.*}}void @__kmpc_for_static_fini(
145    ^{
146      // BLOCKS: define {{.+}} void {{@.+}}(i8*
147      g = 2;
148      g1 = 2;
149      svar = 4;
150      sfvar = 9.0;
151      // BLOCKS-NOT: [[G]]{{[[^:word:]]}}
152      // BLOCKS: store double 2.0{{.+}}, double*
153      // BLOCKS-NOT: [[G]]{{[[^:word:]]}}
154      // BLOCKS-NOT: [[SVAR]]{{[[^:word:]]}}
155      // BLOCKS: store i{{[0-9]+}} 4, i{{[0-9]+}}*
156      // BLOCKS-NOT: [[SVAR]]{{[[^:word:]]}}
157      // BLOCKS-NOT: [[SFVAR]]{{[[^:word:]]}}
158      // BLOCKS: store float 9.0{{.+}}, float*
159      // BLOCKS-NOT: [[SFVAR]]{{[[^:word:]]}}
160      // BLOCKS: ret
161    }();
162  }
163  }();
164  return 0;
165#else
166  S<float> test;
167  int t_var = 0;
168  int vec[] = {1, 2};
169  S<float> s_arr[] = {1, 2};
170  S<float> &var = test;
171#pragma omp parallel
172#pragma omp for private(t_var, vec, s_arr, s_arr, var, var, svar)
173  for (int i = 0; i < 2; ++i) {
174    vec[i] = t_var;
175    s_arr[i] = var;
176  }
177  int i;
178#pragma omp parallel
179#pragma omp for private(i)
180  for (i = 0; i < 2; ++i) {
181    ;
182  }
183  return tmain<int>();
184#endif
185}
186
187// CHECK: define i{{[0-9]+}} @main()
188// CHECK: [[TEST:%.+]] = alloca [[S_FLOAT_TY]],
189// CHECK: call {{.*}} [[S_FLOAT_TY_DEF_CONSTR:@.+]]([[S_FLOAT_TY]]* [[TEST]])
190// CHECK: call void (%{{.+}}*, i{{[0-9]+}}, void (i{{[0-9]+}}*, i{{[0-9]+}}*, ...)*, ...) @__kmpc_fork_call(%{{.+}}* @{{.+}}, i{{[0-9]+}} 0, void (i{{[0-9]+}}*, i{{[0-9]+}}*, ...)* bitcast (void (i{{[0-9]+}}*, i{{[0-9]+}}*)* [[MAIN_MICROTASK:@.+]] to void
191// CHECK: = call i{{.+}} [[TMAIN_INT:@.+]]()
192// CHECK: call void [[S_FLOAT_TY_DESTR:@.+]]([[S_FLOAT_TY]]*
193// CHECK: ret
194//
195// CHECK: define internal void [[MAIN_MICROTASK]](i{{[0-9]+}}* noalias [[GTID_ADDR:%.+]], i{{[0-9]+}}* noalias %{{.+}})
196// CHECK: [[T_VAR_PRIV:%.+]] = alloca i{{[0-9]+}},
197// CHECK: [[VEC_PRIV:%.+]] = alloca [2 x i{{[0-9]+}}],
198// CHECK: [[S_ARR_PRIV:%.+]] = alloca [2 x [[S_FLOAT_TY]]],
199// CHECK-NOT: alloca [2 x [[S_FLOAT_TY]]],
200// CHECK: [[VAR_PRIV:%.+]] = alloca [[S_FLOAT_TY]],
201// CHECK-NOT: alloca [[S_FLOAT_TY]],
202// CHECK: [[S_VAR_PRIV:%.+]] = alloca i{{[0-9]+}},
203// CHECK: store i{{[0-9]+}}* [[GTID_ADDR]], i{{[0-9]+}}** [[GTID_ADDR_REF:%.+]]
204// CHECK-NOT: [[T_VAR_PRIV]]
205// CHECK-NOT: [[VEC_PRIV]]
206// CHECK: {{.+}}:
207// CHECK: [[S_ARR_PRIV_ITEM:%.+]] = phi [[S_FLOAT_TY]]*
208// CHECK: call {{.*}} [[S_FLOAT_TY_DEF_CONSTR]]([[S_FLOAT_TY]]* [[S_ARR_PRIV_ITEM]])
209// CHECK-NOT: [[T_VAR_PRIV]]
210// CHECK-NOT: [[VEC_PRIV]]
211// CHECK: call {{.*}} [[S_FLOAT_TY_DEF_CONSTR]]([[S_FLOAT_TY]]* [[VAR_PRIV]])
212// CHECK: call void @__kmpc_for_static_init_4(
213// CHECK: call void @__kmpc_for_static_fini(
214// CHECK-DAG: call void [[S_FLOAT_TY_DESTR]]([[S_FLOAT_TY]]* [[VAR_PRIV]])
215// CHECK-DAG: call void [[S_FLOAT_TY_DESTR]]([[S_FLOAT_TY]]*
216// CHECK: ret void
217
218// CHECK: define {{.*}} i{{[0-9]+}} [[TMAIN_INT]]()
219// CHECK: [[TEST:%.+]] = alloca [[S_INT_TY]],
220// CHECK: call {{.*}} [[S_INT_TY_DEF_CONSTR:@.+]]([[S_INT_TY]]* [[TEST]])
221// CHECK: call void (%{{.+}}*, i{{[0-9]+}}, void (i{{[0-9]+}}*, i{{[0-9]+}}*, ...)*, ...) @__kmpc_fork_call(%{{.+}}* @{{.+}}, i{{[0-9]+}} 0, void (i{{[0-9]+}}*, i{{[0-9]+}}*, ...)* bitcast (void (i{{[0-9]+}}*, i{{[0-9]+}}*)* [[TMAIN_MICROTASK:@.+]] to void
222// CHECK: call void [[S_INT_TY_DESTR:@.+]]([[S_INT_TY]]*
223// CHECK: ret
224//
225// CHECK: define internal void [[TMAIN_MICROTASK]](i{{[0-9]+}}* noalias [[GTID_ADDR:%.+]], i{{[0-9]+}}* noalias %{{.+}})
226// CHECK: [[T_VAR_PRIV:%.+]] = alloca i{{[0-9]+}},
227// CHECK: [[VEC_PRIV:%.+]] = alloca [2 x i{{[0-9]+}}],
228// CHECK: [[S_ARR_PRIV:%.+]] = alloca [2 x [[S_INT_TY]]],
229// CHECK-NOT: alloca [2 x [[S_INT_TY]]],
230// CHECK: [[VAR_PRIV:%.+]] = alloca [[S_INT_TY]],
231// CHECK-NOT: alloca [[S_INT_TY]],
232// CHECK: store i{{[0-9]+}}* [[GTID_ADDR]], i{{[0-9]+}}** [[GTID_ADDR_REF:%.+]]
233// CHECK-NOT: [[T_VAR_PRIV]]
234// CHECK-NOT: [[VEC_PRIV]]
235// CHECK: {{.+}}:
236// CHECK: [[S_ARR_PRIV_ITEM:%.+]] = phi [[S_INT_TY]]*
237// CHECK: call {{.*}} [[S_INT_TY_DEF_CONSTR]]([[S_INT_TY]]* [[S_ARR_PRIV_ITEM]])
238// CHECK-NOT: [[T_VAR_PRIV]]
239// CHECK-NOT: [[VEC_PRIV]]
240// CHECK: call {{.*}} [[S_INT_TY_DEF_CONSTR]]([[S_INT_TY]]* [[VAR_PRIV]])
241// CHECK: call void @__kmpc_for_static_init_4(
242// CHECK: call void @__kmpc_for_static_fini(
243// CHECK-DAG: call void [[S_INT_TY_DESTR]]([[S_INT_TY]]* [[VAR_PRIV]])
244// CHECK-DAG: call void [[S_INT_TY_DESTR]]([[S_INT_TY]]*
245// CHECK: ret void
246#endif
247
248