Samples · lm_eval_harness.ifeval
Run #66 · Adapter v1.0.0+humaneval-unsafe-flag · 0/0 Samples angezeigt
KI-Auswertung
Keine KI-Auswertung verfügbar.
Übersicht
0 SamplesVerteilung
Score-Histogramm
0.0 ────── 1.0
| Frage-ID | Status | Score | Prompt | Latenz | Tokens/s | TTFT | |
|---|---|---|---|---|---|---|---|
|
Keine Samples
Dieser Benchmark hat keine persistierten Samples (etwa weil der Adapter im Health-Check failed ist).
| |||||||