🔍 LLM Benchmark Space (multi-dataset)
Inserisci i nomi dei modelli Hugging Face (es. Mattimax/DAC4.3)
e confrontali su uno o più dataset selezionabili da menu a tendina.
- Minimo 2 modelli
- Puoi aggiungere fino a 5 modelli con il pulsante "+ Aggiungi modello"
- Puoi selezionare 1 o più dataset (fino a 5) con il pulsante "+ Aggiungi dataset"
- Output: tabella con modello, dataset, accuracy, numero di esempi e tempi
Dataset disponibili:
- BoolQ (en)
- SQuAD-it (it)
- PAWS-X (it)
- Sentiment-it (it)
Dataset 1
10 200