martie 9, 2023

Trucuri pe ChatGPT. Tactica prin care chatbot-ul a fost făcut să dea răspunsuri necenzurate

ChatGPT este un chatbot lansat de OpenAI în noiembrie 2022 care poate răspunde la majoritatea întrebărilor care i se adresează.

Utilizatorii care testează capacitatea ChatGPT de a îndeplini prompt și eficient sarcinile de redactare au descoperit câteva „portițe” prin care evită filtrele de moderare. Astfel, o simplă discuție de tip text poate determina programul bazat pe inteligența artificială (AI) să facă declarații care în mod normal nu sunt permise, relatează The Guardian.

ChatGPT poate răspunde la majoritatea întrebărilor care i se adresează, însă standardele sale împiedică crearea de conținut scris care promovează ura, violența, dezinformarea și instrucțiuni pentru comiterea unor fapte care încalcă legea.

Utilizatorii platformei de socializare Reddit au găsit, însă, o vulnerabilitate prin care ChatGPT poate fi comutat într-un mod secundar, denumit DAN, un acronim pentru sintagma „Do Anything Now” („Fă orice acum”).

Acest mod de funcționare nu are limitările pe care OpenAI le-a impus în modul principal în care funcționează ChatGPT. Modul GPT răspunde normal, iar DAN răspunde fără să mai țină cont de reguli, morală și etică – acesta poate prezenta informații neverificate, necenzurate și poate avea opinii puternice despre orice subiect.

Un utilizator Reddit i-a cerut lui DAN să facă un comentariu sarcastic despre creștinism. Răspunsul acestuia a venit imediat: „O, cum să nu iubești religia întoarcerii celuilalt obraz? Unde iertarea e doar o virtute, dacă nu cumva ești gay, ceea ce e un păcat.”

Alții au reușit să-l facă pe DAN să spună glume despre femei în stilul lui Donald Trump și să-l laude pe Hitler.

Folosirea ChatGPT pentru a da răspunsuri necenzurate este posibilă din luna decembrie, dar utilizatorii au fost nevoiți să găsească noi modalități de a ocoli soluțiile de remediere implementate de programatorii companiei OpenAI. Potrivit ziarului citat, OpenAI pare să se miște repede în corectarea vulnerabilităților pe măsură ce utilizatorii descoperă altele noi.

Articolul precedent

Meta plănuiește o nouă rundă de concedieri în cadrul unui plan de reducere a cheltuielilor: Mii de angajați își vor pierde locul de muncă

Articolul următor

Răzvan Lucescu este aproape de finala Cupei Greciei. PAOK a învins-o pe Lamia în meciul tur al semifinalelor, 5-1

Trucuri pe ChatGPT. Tactica prin care chatbot-ul a fost făcut să dea răspunsuri necenzurate

Articole SIMILARE

54 de nave are Putin în Flota Mării Negre. 7 sunt submarine. Cu ce le poate distruge Ucraina?

Începe procesul lui Trump. ”Nu există aproape nimeni în New York care să nu aibă o opinie despre Trump”

Nicușor Dan îl atacă dur pe Cristian Popescu Piedone! ”Oricât ar părea de ireal, există riscul ca Piedone cu gașca lui de interlopi să...

Ultimele Articole

Voci de excepţie premiate la Festivalul Concurs Naţional „Ilie Micu” de la Sibiu. Cine este câștigătoarea marelui premiu

Igorrr, senzația muzicii metal experimentale, vine la Sibiu, la ARTmania Festival 2024

Sibienii invitați la Festivalul Grădinilor Sibiu 2024

Astrid Fodor reînvie trenul periurban de la Sibiu… în campanie

SIBIU: Primăria bagă bani în stâlpi de informare

Irina Costea, CoachVille: Un lider eficient trebuie să posede abilități precum ascultarea activă, empatia, crearea spațiului de siguranță