základní pojmy 1 min čtení

Benchmark

Standardizovaný test pro měření výkonu AI modelů

Vysvětlení

Benchmark je standardizovaná sada úloh používaná pro objektivní měření a porovnání výkonu různých AI modelů. Pomáhá výzkumníkům a vývojářům hodnotit pokrok v oboru. Různé benchmarky testují různé schopnosti - porozumění textu, matematiku, programování atd.

Příklady

["MMLU testuje znalosti v desítkách akademických oborů","HumanEval měří schopnost modelů psát funkční kód","GLUE benchmark pro hodnocení porozumění přirozenému jazyku"]

Více o Benchmark

Najděte nástroje, články a prompty související s tímto pojmem pro praktické využití.

Prozkoumejte AI slovník

Objevte další základní pojmy pojmy a rozšiřte své znalosti umělé inteligence.