základní pojmy
1 min čtení
Benchmark
Standardizovaný test pro měření výkonu AI modelů
Vysvětlení
Benchmark je standardizovaná sada úloh používaná pro objektivní měření a porovnání výkonu různých AI modelů. Pomáhá výzkumníkům a vývojářům hodnotit pokrok v oboru. Různé benchmarky testují různé schopnosti - porozumění textu, matematiku, programování atd.
Příklady
["MMLU testuje znalosti v desítkách akademických oborů","HumanEval měří schopnost modelů psát funkční kód","GLUE benchmark pro hodnocení porozumění přirozenému jazyku"]
Více o Benchmark
Najděte nástroje, články a prompty související s tímto pojmem pro praktické využití.
Související pojmy
Agent
AI systém schopný autonomně provádět úkoly a interagovat s prostředím
Asistent (Assistant)
AI systém navržený pro pomoc uživatelům s různými úkoly
Dataset
Strukturovaná sbírka dat používaná pro trénování nebo testování AI
Doladění (Fine-tuning)
Proces dodatečného trénování AI modelu na specifických datech pro konkrétní úlohy
Embedding
Číselná reprezentace textu ve formě vektoru, která zachycuje jeho význam
Prozkoumejte AI slovník
Objevte další základní pojmy pojmy a rozšiřte své znalosti umělé inteligence.