arc_agi_2

v1.0

ARC-AGI-2: A benchmark measuring abstract reasoning through visual grid puzzles requiring rule inference and generalization.

harbor run -d arc_agi_2@1.0

Tasks (167)

0934a4d8_0
harbor run -d arc_agi_2@1.0 -t 0934a4d8_0
cd46908
135a2760_0
harbor run -d arc_agi_2@1.0 -t 135a2760_0
cd46908
136b0064_0
harbor run -d arc_agi_2@1.0 -t 136b0064_0
cd46908
13e47133_0
harbor run -d arc_agi_2@1.0 -t 13e47133_0
cd46908
13e47133_1
harbor run -d arc_agi_2@1.0 -t 13e47133_1
cd46908
142ca369_0
harbor run -d arc_agi_2@1.0 -t 142ca369_0
cd46908
142ca369_1
harbor run -d arc_agi_2@1.0 -t 142ca369_1
cd46908
16b78196_0
harbor run -d arc_agi_2@1.0 -t 16b78196_0
cd46908
16de56c4_0
harbor run -d arc_agi_2@1.0 -t 16de56c4_0
cd46908
16de56c4_1
harbor run -d arc_agi_2@1.0 -t 16de56c4_1
cd46908
1818057f_0
harbor run -d arc_agi_2@1.0 -t 1818057f_0
cd46908
195c6913_0
harbor run -d arc_agi_2@1.0 -t 195c6913_0
cd46908
195c6913_1
harbor run -d arc_agi_2@1.0 -t 195c6913_1
cd46908
1ae2feb7_0
harbor run -d arc_agi_2@1.0 -t 1ae2feb7_0
cd46908
1ae2feb7_1
harbor run -d arc_agi_2@1.0 -t 1ae2feb7_1
cd46908
1ae2feb7_2
harbor run -d arc_agi_2@1.0 -t 1ae2feb7_2
cd46908
20270e3b_0
harbor run -d arc_agi_2@1.0 -t 20270e3b_0
cd46908
20270e3b_1
harbor run -d arc_agi_2@1.0 -t 20270e3b_1
cd46908
20a9e565_0
harbor run -d arc_agi_2@1.0 -t 20a9e565_0
cd46908
20a9e565_1
harbor run -d arc_agi_2@1.0 -t 20a9e565_1
cd46908
21897d95_0
harbor run -d arc_agi_2@1.0 -t 21897d95_0
cd46908
21897d95_1
harbor run -d arc_agi_2@1.0 -t 21897d95_1
cd46908
221dfab4_0
harbor run -d arc_agi_2@1.0 -t 221dfab4_0
cd46908
221dfab4_1
harbor run -d arc_agi_2@1.0 -t 221dfab4_1
cd46908
247ef758_0
harbor run -d arc_agi_2@1.0 -t 247ef758_0
cd46908
247ef758_1
harbor run -d arc_agi_2@1.0 -t 247ef758_1
cd46908
269e22fb_0
harbor run -d arc_agi_2@1.0 -t 269e22fb_0
cd46908
269e22fb_1
harbor run -d arc_agi_2@1.0 -t 269e22fb_1
cd46908
271d71e2_0
harbor run -d arc_agi_2@1.0 -t 271d71e2_0
cd46908
28a6681f_0
harbor run -d arc_agi_2@1.0 -t 28a6681f_0
cd46908
291dc1e1_0
harbor run -d arc_agi_2@1.0 -t 291dc1e1_0
cd46908
2b83f449_0
harbor run -d arc_agi_2@1.0 -t 2b83f449_0
cd46908
2ba387bc_0
harbor run -d arc_agi_2@1.0 -t 2ba387bc_0
cd46908
2c181942_0
harbor run -d arc_agi_2@1.0 -t 2c181942_0
cd46908
2d0172a1_0
harbor run -d arc_agi_2@1.0 -t 2d0172a1_0
cd46908
2d0172a1_1
harbor run -d arc_agi_2@1.0 -t 2d0172a1_1
cd46908
31f7f899_0
harbor run -d arc_agi_2@1.0 -t 31f7f899_0
cd46908
332f06d7_0
harbor run -d arc_agi_2@1.0 -t 332f06d7_0
cd46908
35ab12c3_0
harbor run -d arc_agi_2@1.0 -t 35ab12c3_0
cd46908
36a08778_0
harbor run -d arc_agi_2@1.0 -t 36a08778_0
cd46908
36a08778_1
harbor run -d arc_agi_2@1.0 -t 36a08778_1
cd46908
38007db0_0
harbor run -d arc_agi_2@1.0 -t 38007db0_0
cd46908
38007db0_1
harbor run -d arc_agi_2@1.0 -t 38007db0_1
cd46908
3a25b0d8_0
harbor run -d arc_agi_2@1.0 -t 3a25b0d8_0
cd46908
3a25b0d8_1
harbor run -d arc_agi_2@1.0 -t 3a25b0d8_1
cd46908
3dc255db_0
harbor run -d arc_agi_2@1.0 -t 3dc255db_0
cd46908
3e6067c3_0
harbor run -d arc_agi_2@1.0 -t 3e6067c3_0
cd46908
3e6067c3_1
harbor run -d arc_agi_2@1.0 -t 3e6067c3_1
cd46908
409aa875_0
harbor run -d arc_agi_2@1.0 -t 409aa875_0
cd46908
446ef5d2_0
harbor run -d arc_agi_2@1.0 -t 446ef5d2_0
cd46908
446ef5d2_1
harbor run -d arc_agi_2@1.0 -t 446ef5d2_1
cd46908
45a5af55_0
harbor run -d arc_agi_2@1.0 -t 45a5af55_0
cd46908
4a21e3da_0
harbor run -d arc_agi_2@1.0 -t 4a21e3da_0
cd46908
4c3d4a41_0
harbor run -d arc_agi_2@1.0 -t 4c3d4a41_0
cd46908
4c3d4a41_1
harbor run -d arc_agi_2@1.0 -t 4c3d4a41_1
cd46908
4c416de3_0
harbor run -d arc_agi_2@1.0 -t 4c416de3_0
cd46908
4c7dc4dd_0
harbor run -d arc_agi_2@1.0 -t 4c7dc4dd_0
cd46908
4c7dc4dd_1
harbor run -d arc_agi_2@1.0 -t 4c7dc4dd_1
cd46908
4e34c42c_0
harbor run -d arc_agi_2@1.0 -t 4e34c42c_0
cd46908
4e34c42c_1
harbor run -d arc_agi_2@1.0 -t 4e34c42c_1
cd46908
53fb4810_0
harbor run -d arc_agi_2@1.0 -t 53fb4810_0
cd46908
5545f144_0
harbor run -d arc_agi_2@1.0 -t 5545f144_0
cd46908
581f7754_0
harbor run -d arc_agi_2@1.0 -t 581f7754_0
cd46908
581f7754_1
harbor run -d arc_agi_2@1.0 -t 581f7754_1
cd46908
58490d8a_0
harbor run -d arc_agi_2@1.0 -t 58490d8a_0
cd46908
58f5dbd5_0
harbor run -d arc_agi_2@1.0 -t 58f5dbd5_0
cd46908
5961cc34_0
harbor run -d arc_agi_2@1.0 -t 5961cc34_0
cd46908
5dbc8537_0
harbor run -d arc_agi_2@1.0 -t 5dbc8537_0
cd46908
5dbc8537_1
harbor run -d arc_agi_2@1.0 -t 5dbc8537_1
cd46908
62593bfd_0
harbor run -d arc_agi_2@1.0 -t 62593bfd_0
cd46908
62593bfd_1
harbor run -d arc_agi_2@1.0 -t 62593bfd_1
cd46908
64efde09_0
harbor run -d arc_agi_2@1.0 -t 64efde09_0
cd46908
65b59efc_0
harbor run -d arc_agi_2@1.0 -t 65b59efc_0
cd46908
65b59efc_1
harbor run -d arc_agi_2@1.0 -t 65b59efc_1
cd46908
67e490f4_0
harbor run -d arc_agi_2@1.0 -t 67e490f4_0
cd46908
6e453dd6_0
harbor run -d arc_agi_2@1.0 -t 6e453dd6_0
cd46908
6e4f6532_0
harbor run -d arc_agi_2@1.0 -t 6e4f6532_0
cd46908
6e4f6532_1
harbor run -d arc_agi_2@1.0 -t 6e4f6532_1
cd46908
6ffbe589_0
harbor run -d arc_agi_2@1.0 -t 6ffbe589_0
cd46908
71e489b6_0
harbor run -d arc_agi_2@1.0 -t 71e489b6_0
cd46908
71e489b6_1
harbor run -d arc_agi_2@1.0 -t 71e489b6_1
cd46908
7491f3cf_0
harbor run -d arc_agi_2@1.0 -t 7491f3cf_0
cd46908
7666fa5d_0
harbor run -d arc_agi_2@1.0 -t 7666fa5d_0
cd46908
78332cb0_0
harbor run -d arc_agi_2@1.0 -t 78332cb0_0
cd46908
78332cb0_1
harbor run -d arc_agi_2@1.0 -t 78332cb0_1
cd46908
7b0280bc_0
harbor run -d arc_agi_2@1.0 -t 7b0280bc_0
cd46908
7b3084d4_0
harbor run -d arc_agi_2@1.0 -t 7b3084d4_0
cd46908
7b5033c1_0
harbor run -d arc_agi_2@1.0 -t 7b5033c1_0
cd46908
7b80bb43_0
harbor run -d arc_agi_2@1.0 -t 7b80bb43_0
cd46908
7c66cb00_0
harbor run -d arc_agi_2@1.0 -t 7c66cb00_0
cd46908
7ed72f31_0
harbor run -d arc_agi_2@1.0 -t 7ed72f31_0
cd46908
7ed72f31_1
harbor run -d arc_agi_2@1.0 -t 7ed72f31_1
cd46908
800d221b_0
harbor run -d arc_agi_2@1.0 -t 800d221b_0
cd46908
80a900e0_0
harbor run -d arc_agi_2@1.0 -t 80a900e0_0
cd46908
8698868d_0
harbor run -d arc_agi_2@1.0 -t 8698868d_0
cd46908
88bcf3b4_0
harbor run -d arc_agi_2@1.0 -t 88bcf3b4_0
cd46908
88bcf3b4_1
harbor run -d arc_agi_2@1.0 -t 88bcf3b4_1
cd46908
88e364bc_0
harbor run -d arc_agi_2@1.0 -t 88e364bc_0
cd46908
88e364bc_1
harbor run -d arc_agi_2@1.0 -t 88e364bc_1
cd46908
89565ca0_0
harbor run -d arc_agi_2@1.0 -t 89565ca0_0
cd46908