ineqmath
v1.0This adapter brings IneqMath, the dev set of the first inequality-proof Q\&A benchmark for LLMs, into Harbor, enabling standardized evaluation of models on mathematical reasoning and proof construction.
harbor run -d ineqmath@1.0Tasks (100)
0
harbor run -d ineqmath@1.0 -t 0cc647b2
1
harbor run -d ineqmath@1.0 -t 1cc647b2
10
harbor run -d ineqmath@1.0 -t 10cc647b2
11
harbor run -d ineqmath@1.0 -t 11cc647b2
12
harbor run -d ineqmath@1.0 -t 12cc647b2
13
harbor run -d ineqmath@1.0 -t 13cc647b2
14
harbor run -d ineqmath@1.0 -t 14cc647b2
15
harbor run -d ineqmath@1.0 -t 15cc647b2
16
harbor run -d ineqmath@1.0 -t 16cc647b2
17
harbor run -d ineqmath@1.0 -t 17cc647b2
18
harbor run -d ineqmath@1.0 -t 18cc647b2
19
harbor run -d ineqmath@1.0 -t 19cc647b2
2
harbor run -d ineqmath@1.0 -t 2cc647b2
20
harbor run -d ineqmath@1.0 -t 20cc647b2
21
harbor run -d ineqmath@1.0 -t 21cc647b2
22
harbor run -d ineqmath@1.0 -t 22cc647b2
23
harbor run -d ineqmath@1.0 -t 23cc647b2
24
harbor run -d ineqmath@1.0 -t 24cc647b2
25
harbor run -d ineqmath@1.0 -t 25cc647b2
26
harbor run -d ineqmath@1.0 -t 26cc647b2
27
harbor run -d ineqmath@1.0 -t 27cc647b2
28
harbor run -d ineqmath@1.0 -t 28cc647b2
29
harbor run -d ineqmath@1.0 -t 29cc647b2
3
harbor run -d ineqmath@1.0 -t 3cc647b2
30
harbor run -d ineqmath@1.0 -t 30cc647b2
31
harbor run -d ineqmath@1.0 -t 31cc647b2
32
harbor run -d ineqmath@1.0 -t 32cc647b2
33
harbor run -d ineqmath@1.0 -t 33cc647b2
34
harbor run -d ineqmath@1.0 -t 34cc647b2
35
harbor run -d ineqmath@1.0 -t 35cc647b2
36
harbor run -d ineqmath@1.0 -t 36cc647b2
37
harbor run -d ineqmath@1.0 -t 37cc647b2
38
harbor run -d ineqmath@1.0 -t 38cc647b2
39
harbor run -d ineqmath@1.0 -t 39cc647b2
4
harbor run -d ineqmath@1.0 -t 4cc647b2
40
harbor run -d ineqmath@1.0 -t 40cc647b2
41
harbor run -d ineqmath@1.0 -t 41cc647b2
42
harbor run -d ineqmath@1.0 -t 42cc647b2
43
harbor run -d ineqmath@1.0 -t 43cc647b2
44
harbor run -d ineqmath@1.0 -t 44cc647b2
45
harbor run -d ineqmath@1.0 -t 45cc647b2
46
harbor run -d ineqmath@1.0 -t 46cc647b2
47
harbor run -d ineqmath@1.0 -t 47cc647b2
48
harbor run -d ineqmath@1.0 -t 48cc647b2
49
harbor run -d ineqmath@1.0 -t 49cc647b2
5
harbor run -d ineqmath@1.0 -t 5cc647b2
50
harbor run -d ineqmath@1.0 -t 50cc647b2
51
harbor run -d ineqmath@1.0 -t 51cc647b2
52
harbor run -d ineqmath@1.0 -t 52cc647b2
53
harbor run -d ineqmath@1.0 -t 53cc647b2
54
harbor run -d ineqmath@1.0 -t 54cc647b2
55
harbor run -d ineqmath@1.0 -t 55cc647b2
56
harbor run -d ineqmath@1.0 -t 56cc647b2
57
harbor run -d ineqmath@1.0 -t 57cc647b2
58
harbor run -d ineqmath@1.0 -t 58cc647b2
59
harbor run -d ineqmath@1.0 -t 59cc647b2
6
harbor run -d ineqmath@1.0 -t 6cc647b2
60
harbor run -d ineqmath@1.0 -t 60cc647b2
61
harbor run -d ineqmath@1.0 -t 61cc647b2
62
harbor run -d ineqmath@1.0 -t 62cc647b2
63
harbor run -d ineqmath@1.0 -t 63cc647b2
64
harbor run -d ineqmath@1.0 -t 64cc647b2
65
harbor run -d ineqmath@1.0 -t 65cc647b2
66
harbor run -d ineqmath@1.0 -t 66cc647b2
67
harbor run -d ineqmath@1.0 -t 67cc647b2
68
harbor run -d ineqmath@1.0 -t 68cc647b2
69
harbor run -d ineqmath@1.0 -t 69cc647b2
7
harbor run -d ineqmath@1.0 -t 7cc647b2
70
harbor run -d ineqmath@1.0 -t 70cc647b2
71
harbor run -d ineqmath@1.0 -t 71cc647b2
72
harbor run -d ineqmath@1.0 -t 72cc647b2
73
harbor run -d ineqmath@1.0 -t 73cc647b2
74
harbor run -d ineqmath@1.0 -t 74cc647b2
75
harbor run -d ineqmath@1.0 -t 75cc647b2
76
harbor run -d ineqmath@1.0 -t 76cc647b2
77
harbor run -d ineqmath@1.0 -t 77cc647b2
78
harbor run -d ineqmath@1.0 -t 78cc647b2
79
harbor run -d ineqmath@1.0 -t 79cc647b2
8
harbor run -d ineqmath@1.0 -t 8cc647b2
80
harbor run -d ineqmath@1.0 -t 80cc647b2
81
harbor run -d ineqmath@1.0 -t 81cc647b2
82
harbor run -d ineqmath@1.0 -t 82cc647b2
83
harbor run -d ineqmath@1.0 -t 83cc647b2
84
harbor run -d ineqmath@1.0 -t 84cc647b2
85
harbor run -d ineqmath@1.0 -t 85cc647b2
86
harbor run -d ineqmath@1.0 -t 86cc647b2
87
harbor run -d ineqmath@1.0 -t 87cc647b2
88
harbor run -d ineqmath@1.0 -t 88cc647b2
89
harbor run -d ineqmath@1.0 -t 89cc647b2
9
harbor run -d ineqmath@1.0 -t 9cc647b2
90
harbor run -d ineqmath@1.0 -t 90cc647b2
91
harbor run -d ineqmath@1.0 -t 91cc647b2
92
harbor run -d ineqmath@1.0 -t 92cc647b2
93
harbor run -d ineqmath@1.0 -t 93cc647b2
94
harbor run -d ineqmath@1.0 -t 94cc647b2
95
harbor run -d ineqmath@1.0 -t 95cc647b2
96
harbor run -d ineqmath@1.0 -t 96cc647b2
97
harbor run -d ineqmath@1.0 -t 97cc647b2
98
harbor run -d ineqmath@1.0 -t 98cc647b2
99
harbor run -d ineqmath@1.0 -t 99cc647b2