Clang Project

clang_source_code/test/OpenMP/teams_distribute_parallel_for_simd_collapse_codegen.cpp
1// expected-no-diagnostics
2#ifndef HEADER
3#define HEADER
4
5// Test host codegen.
6// RUN: %clang_cc1 -DCK1 -verify -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck %s --check-prefix CK1 --check-prefix CK1-64
7// RUN: %clang_cc1 -DCK1 -fopenmp -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s
8// RUN: %clang_cc1 -DCK1 -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix CK1 --check-prefix CK1-64
9// RUN: %clang_cc1 -DCK1 -verify -fopenmp -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-llvm %s -o - | FileCheck %s --check-prefix CK1 --check-prefix CK1-32
10// RUN: %clang_cc1 -DCK1 -fopenmp -x c++ -std=c++11 -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-pch -o %t %s
11// RUN: %clang_cc1 -DCK1 -fopenmp -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix CK1 --check-prefix CK1-32
12
13// RUN: %clang_cc1 -DCK1 -verify -fopenmp-simd -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY0 %s
14// RUN: %clang_cc1 -DCK1 -fopenmp-simd -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s
15// RUN: %clang_cc1 -DCK1 -fopenmp-simd -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck --check-prefix SIMD-ONLY0 %s
16// RUN: %clang_cc1 -DCK1 -verify -fopenmp-simd -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY0 %s
17// RUN: %clang_cc1 -DCK1 -fopenmp-simd -x c++ -std=c++11 -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-pch -o %t %s
18// RUN: %clang_cc1 -DCK1 -fopenmp-simd -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck --check-prefix SIMD-ONLY0 %s
19// SIMD-ONLY0-NOT: {{__kmpc|__tgt}}
20#ifdef CK1
21
22template <typename T, int X, long long Y>
23struct SS{
24  T a[X][Y];
25
26  // CK1: define {{.*}}i32 @{{.+}}foo{{.+}}(
27  int foo(void) {
28
29    // CK1: call i32 @__tgt_target_teams(
30    // CK1: call void @[[OFFL1:.+]](
31    #pragma omp target
32    #pragma omp teams distribute parallel for simd collapse(2)
33    for(int i = 0; i < X; i++) {
34      for(int j = 0; j < Y; j++) {
35 a[i][j] = (T)0;
36      }
37    }
38    // CK1: define internal void @[[OFFL1]](
39    // CK1: call void {{.+}} @__kmpc_fork_teams({{.+}}, i32 1, {{.+}} @[[OUTL1:.+]] to {{.+}},
40    // CK1: ret void
41
42    // CK1: define internal void @[[OUTL1]]({{.+}})
43    // discard loop variables not needed here
44    // CK1: [[OMP_UB:%.omp.comb.ub]] = alloca i32,
45    // CK1: store i32 56087, i32* [[OMP_UB]],
46    // CK1: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, i32 92, {{.+}}, {{.+}}, i32* [[OMP_UB]],
47    // CK1: call void {{.*}} @__kmpc_fork_call({{.+}}, {{.+}}, {{.+}} @[[PAR_OUTL1:.+]] to
48    // CK1: call void @__kmpc_for_static_fini(
49    // CK1: ret void
50
51    // CK1: define internal void @[[PAR_OUTL1]]({{.+}})
52    // CK1: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, i32 34, {{.+}}, {{.+}},
53    // CK1: call void @__kmpc_for_static_fini(
54    // CK1: ret void
55
56    return a[0][0];
57  }
58};
59
60int teams_template_struct(void) {
61  SS<int, 123, 456> V;
62  return V.foo();
63
64}
65
66// CK4: !{!"llvm.loop.vectorize.enable", i1 true}
67
68#endif // CK1
69
70// Test host codegen.
71// RUN: %clang_cc1 -DCK2 -verify -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck %s --check-prefix CK2 --check-prefix CK2-64
72// RUN: %clang_cc1 -DCK2 -fopenmp -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s
73// RUN: %clang_cc1 -DCK2 -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix CK2 --check-prefix CK2-64
74// RUN: %clang_cc1 -DCK2 -verify -fopenmp -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-llvm %s -o - | FileCheck %s --check-prefix CK2 --check-prefix CK2-32
75// RUN: %clang_cc1 -DCK2 -fopenmp -x c++ -std=c++11 -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-pch -o %t %s
76// RUN: %clang_cc1 -DCK2 -fopenmp -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix CK2 --check-prefix CK2-32
77
78// RUN: %clang_cc1 -DCK2 -verify -fopenmp-simd -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY1 %s
79// RUN: %clang_cc1 -DCK2 -fopenmp-simd -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s
80// RUN: %clang_cc1 -DCK2 -fopenmp-simd -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck --check-prefix SIMD-ONLY1 %s
81// RUN: %clang_cc1 -DCK2 -verify -fopenmp-simd -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY1 %s
82// RUN: %clang_cc1 -DCK2 -fopenmp-simd -x c++ -std=c++11 -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-pch -o %t %s
83// RUN: %clang_cc1 -DCK2 -fopenmp-simd -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck --check-prefix SIMD-ONLY1 %s
84// SIMD-ONLY1-NOT: {{__kmpc|__tgt}}
85#ifdef CK2
86
87template <typename T, int n, int m>
88int tmain(T argc) {
89  T a[n][m];
90  #pragma omp target
91  #pragma omp teams distribute parallel for simd collapse(2)
92  for(int i = 0; i < n; i++) {
93    for(int j = 0; j < m; j++) {
94      a[i][j] = (T)0;
95    }
96  }
97  return 0;
98}
99
100int main (int argc, char **argv) {
101  int n = 100;
102  int m = 2;
103  int a[n][m];
104  #pragma omp target
105  #pragma omp teams distribute parallel for simd collapse(2)
106  for(int i = 0; i < n; i++) {
107    for(int j = 0; j < m; j++) {
108      a[i][j] = 0;
109    }
110  }
111  return tmain<int, 10, 2>(argc);
112}
113
114// CK2: define {{.*}}i32 @{{[^,]+}}(i{{.+}}{{.+}} %[[ARGC:.+]], {{.+}})
115// CK2: call i32 @__tgt_target_teams(
116// CK2: call void @[[OFFL1:.+]]({{.+}})
117// CK2: {{%.+}} = call{{.*}} i32 @[[TMAIN:.+]]({{.+}})
118// CK2: ret
119
120// CK2:  define {{.*}}void @[[OFFL1]]({{.+}})
121// CK2: call void {{.+}} @__kmpc_fork_teams({{.+}}, i32 5, {{.+}} @[[OUTL1:.+]] to {{.+}},
122// CK2: ret void
123
124// CK2: define internal void @[[OUTL1]]({{.+}})
125// CK2: [[OMP_UB:%.omp.comb.ub]] = alloca i64,
126// CK2: store i64 {{.+}}, i64* [[OMP_UB]],
127// CK2: call void @__kmpc_for_static_init_8({{.+}}, {{.+}}, i32 92, {{.+}}, {{.+}}, i64* [[OMP_UB]],
128// CK2: call void {{.*}} @__kmpc_fork_call({{.+}}, {{.+}}, {{.+}} @[[PAR_OUTL1:.+]] to
129// CK2: call void @__kmpc_for_static_fini(
130// CK2: ret void
131
132// CK2: define internal void @[[PAR_OUTL1]]({{.+}})
133// CK2: call void @__kmpc_for_static_init_{{[4|8]}}({{.+}}, {{.+}}, i32 34, {{.+}}, {{.+}},
134// CK2: call void @__kmpc_for_static_fini(
135// CK2: ret void
136
137
138// CK2: define {{.*}}i32 @[[TMAIN]]({{.+}})
139// CK2: call i32 @__tgt_target_teams(
140// CK2: call void @[[OFFLT1:.+]]({{.+}})
141// CK2:  ret
142// CK2-NEXT: }
143
144// CK2:  define {{.*}}void @[[OFFLT1]]({{.+}})
145// CK2: call void {{.+}} @__kmpc_fork_teams({{.+}}, i32 1, {{.+}} @[[OUTLT1:.+]] to {{.+}},
146// CK2: ret void
147
148// CK2: define internal void @[[OUTLT1]]({{.+}})
149// discard loop variables not needed here
150// CK2: [[OMP_UB:%.omp.comb.ub]] = alloca i32,
151// CK2: store i32 {{.+}}, i32* [[OMP_UB]],
152// CK2: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, i32 92, {{.+}}, {{.+}}, i32* [[OMP_UB]],
153// CK2: call void {{.*}} @__kmpc_fork_call({{.+}}, {{.+}}, {{.+}} @[[TPAR_OUTL1:.+]] to
154// CK2: call void @__kmpc_for_static_fini(
155// CK2: ret void
156
157// CK2: define internal void @[[TPAR_OUTL1]]({{.+}})
158// CK2: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, i32 34, {{.+}}, {{.+}},
159// CK2: call void @__kmpc_for_static_fini(
160// CK2: ret void
161
162// CK4: !{!"llvm.loop.vectorize.enable", i1 true}
163
164#endif // CK2
165#endif // #ifndef HEADER
166