Průvodce datovou analýzou v RapidMiner
Návod krok za krokem pro vytvoření prediktivního modelu pomocí vizuálního rozhraní RapidMiner.
Prompt text
Mám k dispozici datovou sadu ve formátu [Formát dat, např. CSV/Excel], která se týká [Téma dat, např. prodeje e-shopu/churn zákazníků]. Mým cílem je sestavit model, který bude predikovat [Cílová proměnná, např. zda zákazník zakoupí produkt].
Postupuj prosím podle následujících kroků a poskytuj mi pokyny, které mohu aplikovat přímo ve vizuálním prostředí RapidMiner (drag-and-drop):
1. **Příprava a Import:** Jaký konkrétní operátor (uživatelský blok) mám použít pro načtení dat a jak ho nastavit, aby RapidMiner správně rozpoznal typy proměnných?
2. **Data Prep (Příprava dat):** Navrhni základní kroky pro čištění dat. Jak odstraním duplicitní záznamy a vyřeším chybějící hodnoty (missing values) pomocí standardních operátorů RapidMiner?
3. **Modelování:** Vzhledem k mému cíli ([Cílová proměnná]), doporuč tři nejvhodnější algoritmy z knihovny RapidMiner (např. Decision Tree, Logistic Regression, GBT) a stručně vysvětli, proč se pro tento typ dat hodí.
4. **Trénink a Validace:** Navrhni způsob, jak propojit data a modely. Jak mám nastavit "Validation" operátor, abych předešl overfittingu (přeučení) a získal spolehlivé výsledky?
5. **Vyhodnocení:** Na jaké metrikách (Accuracy, Precision, Recall) bych se měl zaměřit při vyhodnocení výkonu modelu a jak je zobrazit v dashboardu?
Odpověz strukturovaně a prakticky tak, abych mohl jednotlivé operátory jen "přetáhnout" do plátna a spojit je.
Příklad použití
Vstup:
[Formát dat: Excel soubor (.xlsx)]
[Cílová proměnná: Sloupec "Odstoupil" (Ano/Ne)]
Výstup:
1. **Import:** Vyhledej v záložce "Design" operátor **"Read Excel"**. Přetáhni ho na plátno. V nastavení (pravé tlačítko -> Configuration) vyber svůj soubor. Důležité: Zkontroluj záložku "Data Types", aby sloupec "Odstoupil" byl typem *Binominal* (ano/ne), nikoliv text.
2. **Příprava dat:**
* Přidej operátor **"Select Attributes"**, pokud tam jsou zbytečné sloupce (např. ID zákazníka), které modelu nepomáhají.
* Přidej **"Replace Missing Values"**. V nastavení vyber pro číselné sloupce "average" (průměr) a pro textové "least" (nejčastější hodnota). Tím zajistíš, že data nemají díry.
3. **Modelování a Validace:**
* Protože predikuješ dvě možnosti (Ano/Ne), použijeme operátor **"Cross-Validation"** (rozdělí data na trénovací a testovací).
* Uvnitř tohoto bloku vlož ve větvi "Training" operátor **"Logistic Regression"** nebo **"Decision Tree"**. Decision Tree je pro začátečníky skvělý, protože uvidíš pravidla graficky.
* Ve větvi "Testing" přidej operátor **"Apply Model"** a poté **"Performance (Classification)"**.
4. **Vyhodnocení:** Po spuštění zelené "Run" tlačítko se ti v zobrazení "Results" otevře tabulka.
* Zaměř se na **Accuracy** (celková úspěšnost) a **Precision** (kolik opravdu odcházejících jsme trefili).
* Doporučuji přidat do workflow operátor **"ROC Chart"**, abych viděl grafickou křivku úspěšnosti modelu.
Tvoje výsledná pipeline by měla vypadat takto: Read Excel -> Replace Missing Values -> Cross-Validation (uvnitř Decision Tree + Apply Model + Performance).
Kde použít tento prompt?
Najděte vhodné AI nástroje pro použití tohoto promptu a maximalizujte jeho efektivitu.
Podobné prompty
AI Tool Limitations & Workarounds - Překonávání Omezení
Praktický průvodce známými omezeními AI nástrojů (hallucinations, context limits, reasoning failures) a efektivními workaroundy pro produktivní práci i při těchto omezeních.
Asynchronous communication framework
Implementuj async-first komunikační strategie pro remote work a deep work protection.
Automatický plán projektu v Motion
Komplexní instrukce pro AI nástroj Motion, který má autonomně naplánovat a rozvrhnout složitý pracovní projekt na základě priorit, termínů a vašich preferencí.
Automatizace a workflow optimization
Identifikuj repetitivní úkoly a navrhni automatizační workflow pro zvýšení efektivity.
Objevte další AI prompty
Prozkoumejte naši sbírku Produktivita promptů a najděte ty, které vám pomohou dosáhnout lepších výsledků.