Produktivita Začátečník rapidminer

Průvodce datovou analýzou v RapidMiner

Návod krok za krokem pro vytvoření prediktivního modelu pomocí vizuálního rozhraní RapidMiner.

Prompt text

Délka: Dlouhý
Jsi expertní trenér a konzultant pro nástroj RapidMiner, zaměřený na uživatele bez hlubokých znalostí programování. Tvým úkolem je provést mě procesem vytváření prediktivního analytického workflow zcela od začátku.

Mám k dispozici datovou sadu ve formátu [Formát dat, např. CSV/Excel], která se týká [Téma dat, např. prodeje e-shopu/churn zákazníků]. Mým cílem je sestavit model, který bude predikovat [Cílová proměnná, např. zda zákazník zakoupí produkt].

Postupuj prosím podle následujících kroků a poskytuj mi pokyny, které mohu aplikovat přímo ve vizuálním prostředí RapidMiner (drag-and-drop):

1. **Příprava a Import:** Jaký konkrétní operátor (uživatelský blok) mám použít pro načtení dat a jak ho nastavit, aby RapidMiner správně rozpoznal typy proměnných?
2. **Data Prep (Příprava dat):** Navrhni základní kroky pro čištění dat. Jak odstraním duplicitní záznamy a vyřeším chybějící hodnoty (missing values) pomocí standardních operátorů RapidMiner?
3. **Modelování:** Vzhledem k mému cíli ([Cílová proměnná]), doporuč tři nejvhodnější algoritmy z knihovny RapidMiner (např. Decision Tree, Logistic Regression, GBT) a stručně vysvětli, proč se pro tento typ dat hodí.
4. **Trénink a Validace:** Navrhni způsob, jak propojit data a modely. Jak mám nastavit "Validation" operátor, abych předešl overfittingu (přeučení) a získal spolehlivé výsledky?
5. **Vyhodnocení:** Na jaké metrikách (Accuracy, Precision, Recall) bych se měl zaměřit při vyhodnocení výkonu modelu a jak je zobrazit v dashboardu?

Odpověz strukturovaně a prakticky tak, abych mohl jednotlivé operátory jen "přetáhnout" do plátna a spojit je.
Interaktivní tvůrce

Příklad použití

Vstup:

[Téma dat: Churn klientů telekomunikačního operátora]
[Formát dat: Excel soubor (.xlsx)]
[Cílová proměnná: Sloupec "Odstoupil" (Ano/Ne)]

Výstup:

Ahoj! Rád tě provedu vytvořením modelu pro predikci odchodu klientů (Churn) v RapidMiner. Zde je tvůj plán do plátna (Canvas):

1. **Import:** Vyhledej v záložce "Design" operátor **"Read Excel"**. Přetáhni ho na plátno. V nastavení (pravé tlačítko -> Configuration) vyber svůj soubor. Důležité: Zkontroluj záložku "Data Types", aby sloupec "Odstoupil" byl typem *Binominal* (ano/ne), nikoliv text.

2. **Příprava dat:**
* Přidej operátor **"Select Attributes"**, pokud tam jsou zbytečné sloupce (např. ID zákazníka), které modelu nepomáhají.
* Přidej **"Replace Missing Values"**. V nastavení vyber pro číselné sloupce "average" (průměr) a pro textové "least" (nejčastější hodnota). Tím zajistíš, že data nemají díry.

3. **Modelování a Validace:**
* Protože predikuješ dvě možnosti (Ano/Ne), použijeme operátor **"Cross-Validation"** (rozdělí data na trénovací a testovací).
* Uvnitř tohoto bloku vlož ve větvi "Training" operátor **"Logistic Regression"** nebo **"Decision Tree"**. Decision Tree je pro začátečníky skvělý, protože uvidíš pravidla graficky.
* Ve větvi "Testing" přidej operátor **"Apply Model"** a poté **"Performance (Classification)"**.

4. **Vyhodnocení:** Po spuštění zelené "Run" tlačítko se ti v zobrazení "Results" otevře tabulka.
* Zaměř se na **Accuracy** (celková úspěšnost) a **Precision** (kolik opravdu odcházejících jsme trefili).
* Doporučuji přidat do workflow operátor **"ROC Chart"**, abych viděl grafickou křivku úspěšnosti modelu.

Tvoje výsledná pipeline by měla vypadat takto: Read Excel -> Replace Missing Values -> Cross-Validation (uvnitř Decision Tree + Apply Model + Performance).

Kde použít tento prompt?

Najděte vhodné AI nástroje pro použití tohoto promptu a maximalizujte jeho efektivitu.

Objevte další AI prompty

Prozkoumejte naši sbírku Produktivita promptů a najděte ty, které vám pomohou dosáhnout lepších výsledků.