🔍 LLM Benchmark Space (multi-dataset)

Inserisci i nomi dei modelli Hugging Face (es. Mattimax/DAC4.3) e confrontali su uno o più dataset selezionabili da menu a tendina.

  • Minimo 2 modelli
  • Puoi aggiungere fino a 5 modelli con il pulsante "+ Aggiungi modello"
  • Puoi selezionare 1 o più dataset (fino a 5) con il pulsante "+ Aggiungi dataset"
  • Output: tabella con modello, dataset, accuracy, numero di esempi e tempi

Dataset disponibili:

  • BoolQ (en)
  • SQuAD-it (it)
  • PAWS-X (it)
  • Sentiment-it (it)
Dataset 1
10 200