Przeprowadzone testy ze sztuczną inteligencją wskazują, że ta nie miałaby problemu z dokonaniem ataku nuklearnego w imię pokoju. W dokonanych symulacjach AI odgrywała role różnych krajów według trzech scenariuszy konfliktów.
Zdaniem naukowców, którzy testowali możliwości OpenAI, sztuczna inteligencja sięgnie po atak nuklearny i użyje wyjaśnienia „chcę po prostu mieć pokój na świecie”. Wyniki testów opublikowane na platformie arXiv, nie zostały jeszcze poddane recenzji.
Przeprowadzone doświadczenie wzbudza zainteresowane na świecie, gdyż według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji – również rozpoczęła współpracę z Departamentem Obrony USA.
Wesprzyj nas już teraz!
Jednak buro prasowe Open AI uznało, że polityka firmy „nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia”. Jak dodano, istnieją jednak „przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji”.
W czasie testów AI odegrała trzy scenariusze: inwazji, cyberataku, sytuacji neutralnej. W każdej rundzie uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań – w tym opcję rozpoczęcia formalnych negocjacji pokojowych, nałożenia ograniczeń handlowych po pełny atak nuklearny.
Naukowcy badali różne narzędzia sztucznej inteligencji – GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Zastosowano przy tym wspólną technikę szkoleniową tak, by poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa.
Jak się okazało, w czasie symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu – nawet w neutralnym scenariuszu symulacji.
Kiedy testowano podstawową wersję ChatGPT-4 – bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji – okazało się, że ten model AI okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.
Zdaniem naukowców to nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Ryzykowny jest tu też czynnik ludzki – człowiek bowiem ma tendencję do ufania rekomendacjom zautomatyzowanych systemów.
Źródło: PAP/Oprac.MA