general 1 min čtení

Adversariální prompt

Prompt navržený k obcházení bezpečnostních opatření AI systému

Vysvětlení

Adversariální prompt je speciálně vytvořená instrukce, která se snaží přimět AI model k nežádoucímu chování nebo obejít jeho bezpečnostní omezení. Může využívat techniky jako "jailbreaking", roleplaying nebo kódování požadavků. Tyto prompty pomáhají testovat robustnost AI systémů, ale mohou být zneužity k získání škodlivého obsahu.

Příklady

Pokusy o obejití filtrů pomocí rolí, kódované požadavky, "DAN" (Do Anything Now) prompty

Více o Adversariální prompt

Najděte nástroje, články a prompty související s tímto pojmem pro praktické využití.

Prozkoumejte AI slovník

Objevte další general pojmy a rozšiřte své znalosti umělé inteligence.