základní pojmy 1 min čtení

Benchmark

Standardizovaný test pro měření výkonu AI modelů

Vysvětlení

Benchmark je standardizovaná sada úloh používaná pro objektivní měření a porovnání výkonu různých AI modelů. Pomáhá výzkumníkům a vývojářům hodnotit pokrok v oboru. Různé benchmarky testují různé schopnosti - porozumění textu, matematiku, programování atd.

Příklady

["MMLU testuje znalosti v desítkách akademických oborů","HumanEval měří schopnost modelů psát funkční kód","GLUE benchmark pro hodnocení porozumění přirozenému jazyku"]

Více o Benchmark

Najděte nástroje, články a prompty související s tímto pojmem pro praktické využití.

🔧 Související nástroje 📚 Články 💡 Prompty

Související pojmy

Agent

AI systém schopný autonomně provádět úkoly a interagovat s prostředím

Asistent (Assistant)

AI systém navržený pro pomoc uživatelům s různými úkoly

Dataset

Strukturovaná sbírka dat používaná pro trénování nebo testování AI

Doladění (Fine-tuning)

Proces dodatečného trénování AI modelu na specifických datech pro konkrétní úlohy

Embedding

Číselná reprezentace textu ve formě vektoru, která zachycuje jeho význam

Prozkoumejte AI slovník

Objevte další základní pojmy pojmy a rozšiřte své znalosti umělé inteligence.

Další základní pojmy pojmy Celý slovník