Samples · lm_eval_harness.ifeval

Run #65 · Adapter v1.0.0+humaneval-unsafe-flag · 0/0 Samples angezeigt

KI-Auswertung

Keine KI-Auswertung verfügbar.

0 Samples

Verteilung

Score-Histogramm

0.0 ────── 1.0

	Frage-ID	Status	Score	Prompt	Latenz	Tokens/s	TTFT
Keine Samples Dieser Benchmark hat keine persistierten Samples (etwa weil der Adapter im Health-Check failed ist).