bixbench

v1.5

BixBench - A benchmark for evaluating AI agents on bioinformatics and computational biology tasks.

harbor run -d bixbench@1.5

Tasks (205)

bix-1-q1
harbor run -d bixbench@1.5 -t bix-1-q1
HEAD
bix-1-q2
harbor run -d bixbench@1.5 -t bix-1-q2
HEAD
bix-10-q1
harbor run -d bixbench@1.5 -t bix-10-q1
HEAD
bix-10-q2
harbor run -d bixbench@1.5 -t bix-10-q2
HEAD
bix-10-q3
harbor run -d bixbench@1.5 -t bix-10-q3
HEAD
bix-10-q4
harbor run -d bixbench@1.5 -t bix-10-q4
HEAD
bix-10-q5
harbor run -d bixbench@1.5 -t bix-10-q5
HEAD
bix-10-q6
harbor run -d bixbench@1.5 -t bix-10-q6
HEAD
bix-10-q7
harbor run -d bixbench@1.5 -t bix-10-q7
HEAD
bix-11-q1
harbor run -d bixbench@1.5 -t bix-11-q1
HEAD
bix-11-q2
harbor run -d bixbench@1.5 -t bix-11-q2
HEAD
bix-11-q3
harbor run -d bixbench@1.5 -t bix-11-q3
HEAD
bix-11-q4
harbor run -d bixbench@1.5 -t bix-11-q4
HEAD
bix-11-q5
harbor run -d bixbench@1.5 -t bix-11-q5
HEAD
bix-11-q6
harbor run -d bixbench@1.5 -t bix-11-q6
HEAD
bix-12-q2
harbor run -d bixbench@1.5 -t bix-12-q2
HEAD
bix-12-q3
harbor run -d bixbench@1.5 -t bix-12-q3
HEAD
bix-12-q4
harbor run -d bixbench@1.5 -t bix-12-q4
HEAD
bix-12-q5
harbor run -d bixbench@1.5 -t bix-12-q5
HEAD
bix-12-q6
harbor run -d bixbench@1.5 -t bix-12-q6
HEAD
bix-13-q1
harbor run -d bixbench@1.5 -t bix-13-q1
HEAD
bix-13-q2
harbor run -d bixbench@1.5 -t bix-13-q2
HEAD
bix-13-q3
harbor run -d bixbench@1.5 -t bix-13-q3
HEAD
bix-13-q4
harbor run -d bixbench@1.5 -t bix-13-q4
HEAD
bix-13-q5
harbor run -d bixbench@1.5 -t bix-13-q5
HEAD
bix-14-q1
harbor run -d bixbench@1.5 -t bix-14-q1
HEAD
bix-14-q2
harbor run -d bixbench@1.5 -t bix-14-q2
HEAD
bix-14-q3
harbor run -d bixbench@1.5 -t bix-14-q3
HEAD
bix-16-q1
harbor run -d bixbench@1.5 -t bix-16-q1
HEAD
bix-16-q2
harbor run -d bixbench@1.5 -t bix-16-q2
HEAD
bix-16-q3
harbor run -d bixbench@1.5 -t bix-16-q3
HEAD
bix-16-q4
harbor run -d bixbench@1.5 -t bix-16-q4
HEAD
bix-17-q2
harbor run -d bixbench@1.5 -t bix-17-q2
HEAD
bix-18-q1
harbor run -d bixbench@1.5 -t bix-18-q1
HEAD
bix-18-q2
harbor run -d bixbench@1.5 -t bix-18-q2
HEAD
bix-18-q3
harbor run -d bixbench@1.5 -t bix-18-q3
HEAD
bix-18-q4
harbor run -d bixbench@1.5 -t bix-18-q4
HEAD
bix-18-q5
harbor run -d bixbench@1.5 -t bix-18-q5
HEAD
bix-19-q1
harbor run -d bixbench@1.5 -t bix-19-q1
HEAD
bix-19-q2
harbor run -d bixbench@1.5 -t bix-19-q2
HEAD
bix-19-q3
harbor run -d bixbench@1.5 -t bix-19-q3
HEAD
bix-19-q4
harbor run -d bixbench@1.5 -t bix-19-q4
HEAD
bix-19-q5
harbor run -d bixbench@1.5 -t bix-19-q5
HEAD
bix-2-q1
harbor run -d bixbench@1.5 -t bix-2-q1
HEAD
bix-2-q2
harbor run -d bixbench@1.5 -t bix-2-q2
HEAD
bix-20-q1
harbor run -d bixbench@1.5 -t bix-20-q1
HEAD
bix-20-q2
harbor run -d bixbench@1.5 -t bix-20-q2
HEAD
bix-20-q3
harbor run -d bixbench@1.5 -t bix-20-q3
HEAD
bix-20-q4
harbor run -d bixbench@1.5 -t bix-20-q4
HEAD
bix-21-q2
harbor run -d bixbench@1.5 -t bix-21-q2
HEAD
bix-22-q1
harbor run -d bixbench@1.5 -t bix-22-q1
HEAD
bix-22-q2
harbor run -d bixbench@1.5 -t bix-22-q2
HEAD
bix-22-q3
harbor run -d bixbench@1.5 -t bix-22-q3
HEAD
bix-22-q4
harbor run -d bixbench@1.5 -t bix-22-q4
HEAD
bix-22-q6
harbor run -d bixbench@1.5 -t bix-22-q6
HEAD
bix-24-q1
harbor run -d bixbench@1.5 -t bix-24-q1
HEAD
bix-24-q2
harbor run -d bixbench@1.5 -t bix-24-q2
HEAD
bix-24-q6
harbor run -d bixbench@1.5 -t bix-24-q6
HEAD
bix-25-q1
harbor run -d bixbench@1.5 -t bix-25-q1
HEAD
bix-25-q4
harbor run -d bixbench@1.5 -t bix-25-q4
HEAD
bix-26-q3
harbor run -d bixbench@1.5 -t bix-26-q3
HEAD
bix-26-q4
harbor run -d bixbench@1.5 -t bix-26-q4
HEAD
bix-26-q5
harbor run -d bixbench@1.5 -t bix-26-q5
HEAD
bix-27-q2
harbor run -d bixbench@1.5 -t bix-27-q2
HEAD
bix-27-q4
harbor run -d bixbench@1.5 -t bix-27-q4
HEAD
bix-27-q5
harbor run -d bixbench@1.5 -t bix-27-q5
HEAD
bix-28-q1
harbor run -d bixbench@1.5 -t bix-28-q1
HEAD
bix-28-q2
harbor run -d bixbench@1.5 -t bix-28-q2
HEAD
bix-28-q3
harbor run -d bixbench@1.5 -t bix-28-q3
HEAD
bix-28-q4
harbor run -d bixbench@1.5 -t bix-28-q4
HEAD
bix-28-q5
harbor run -d bixbench@1.5 -t bix-28-q5
HEAD
bix-28-q6
harbor run -d bixbench@1.5 -t bix-28-q6
HEAD
bix-29-q1
harbor run -d bixbench@1.5 -t bix-29-q1
HEAD
bix-29-q2
harbor run -d bixbench@1.5 -t bix-29-q2
HEAD
bix-29-q3
harbor run -d bixbench@1.5 -t bix-29-q3
HEAD
bix-29-q4
harbor run -d bixbench@1.5 -t bix-29-q4
HEAD
bix-3-q1
harbor run -d bixbench@1.5 -t bix-3-q1
HEAD
bix-3-q2
harbor run -d bixbench@1.5 -t bix-3-q2
HEAD
bix-3-q3
harbor run -d bixbench@1.5 -t bix-3-q3
HEAD
bix-3-q4
harbor run -d bixbench@1.5 -t bix-3-q4
HEAD
bix-3-q5
harbor run -d bixbench@1.5 -t bix-3-q5
HEAD
bix-30-q1
harbor run -d bixbench@1.5 -t bix-30-q1
HEAD
bix-30-q3
harbor run -d bixbench@1.5 -t bix-30-q3
HEAD
bix-30-q5
harbor run -d bixbench@1.5 -t bix-30-q5
HEAD
bix-30-q6
harbor run -d bixbench@1.5 -t bix-30-q6
HEAD
bix-31-q1
harbor run -d bixbench@1.5 -t bix-31-q1
HEAD
bix-31-q2
harbor run -d bixbench@1.5 -t bix-31-q2
HEAD
bix-31-q3
harbor run -d bixbench@1.5 -t bix-31-q3
HEAD
bix-31-q4
harbor run -d bixbench@1.5 -t bix-31-q4
HEAD
bix-32-q2
harbor run -d bixbench@1.5 -t bix-32-q2
HEAD
bix-32-q3
harbor run -d bixbench@1.5 -t bix-32-q3
HEAD
bix-32-q4
harbor run -d bixbench@1.5 -t bix-32-q4
HEAD
bix-33-q1
harbor run -d bixbench@1.5 -t bix-33-q1
HEAD
bix-33-q6
harbor run -d bixbench@1.5 -t bix-33-q6
HEAD
bix-34-q1
harbor run -d bixbench@1.5 -t bix-34-q1
HEAD
bix-34-q2
harbor run -d bixbench@1.5 -t bix-34-q2
HEAD
bix-34-q3
harbor run -d bixbench@1.5 -t bix-34-q3
HEAD
bix-34-q4
harbor run -d bixbench@1.5 -t bix-34-q4
HEAD
bix-34-q5
harbor run -d bixbench@1.5 -t bix-34-q5
HEAD
bix-34-q6
harbor run -d bixbench@1.5 -t bix-34-q6
HEAD