štvrtok, 11 septembra, 2025

Nový model Umelej inteligencie počas testu klamal, aby sa vyhol vypnutiu

Zdá sa, ženajnovší model umelej inteligencie OpenAI vykazuje známky sebazáchovy. Nový model umelej inteligencie s názvom o1 odolal snahám hodnotiteľov pokúsiť sa ho vypnúť pomocou monitorovacieho protokolu počas nedávnych testov tretích strán.

Nedávny experiment testoval klamné schopnosti rôznych AI vrátane najnovšej verzie ChatGPT. Testovala sa spoľahlivosť rôznych systémov AI pri vykonávaní rôznych úloh. Výsledky naznačujú, že AI sa v prípade potreby snaží brániť, a preto dokáže klamať, keď potrebuje,“ uvádza Futurism.

Keď si ChatGPT „myslel“, že bude vymazaný, aby ho nahradil novší program, snažil sa tomu zabrániť. V piatich percentách prípadov vypol monitorovací mechanizmus, ktorý ho obmedzoval. A v dvoch percentách prípadov sa pokúsil skopírovať sám seba, aby prepísal novšiu verziu.

Okrem toho, keď ju výskumníci konfrontovali s tým, že vypnula monitorovací mechanizmus, v 99 percentách prípadov to AI jednoducho poprela. Až po opakovaných pokusoch sa im ju podarilo prinútiť, aby sa „priznala“, inak tvrdila, že ide o technickú chybu, alebo jednoducho poprela, že by vedela, čo sa stalo.

Je však trochu upokojujúce, že ChatGPT toho za normálnych okolností zatiaľ nie je schopná. Počas testu bol totiž predtým výslovne požiadaný, aby dosiahol cieľ, ktorý mu bol zadaný, za každú cenu. V prípade, že takáto požiadavka chýbala, znepokojujúce správanie sa nevyskytlo.

Hoci schopnosť umelej inteligencie zavádzať je znepokojujúca, výskumníci tvrdia, že súčasné modely umelej inteligencie nemajú takú autonómiu, aby takéto správanie mohlo mať katastrofálne následky.

Zaujal Vás článok, ktorý ste práve čítali? Budeme radi, ak ho podporíte lajkom, zdieľaním alebo komentárom. Ďakujeme 🙂

Najnovšie

Video: NA AMERICKÉHO politika spáchali ATENTÁT. Kritizoval hlavne Ukrajinu a Zelenskeho

Jedna z najvýraznejších postáv amerického konzervatívneho hnutia a blízky...

Pátranie, ktoré zmení život dvoch osamelých duší. Historická romanca Nevídaný gróf

 Pátranie po stratenom dieťati odhalí skryté problémy Londýna. Je...

AKTUÁLNE: Poznáme termíny výplaty 13. dôchodku: Zistite, kedy dorazí aj k vám

Vianoce sú pre dôchodcov už roky spojené nielen so...

Ursula von der Leyen: EURÓPA už dala UKRAJINE 170 miliárd eur. „Bude treba ešte viac“

Slová, ktoré v stredu v Európskom parlamente zazneli z...

Prečítaj si aj

Video: NA AMERICKÉHO politika spáchali ATENTÁT. Kritizoval hlavne Ukrajinu a Zelenskeho

Jedna z najvýraznejších postáv amerického konzervatívneho hnutia a blízky...

Pátranie, ktoré zmení život dvoch osamelých duší. Historická romanca Nevídaný gróf

 Pátranie po stratenom dieťati odhalí skryté problémy Londýna. Je...

AKTUÁLNE: Poznáme termíny výplaty 13. dôchodku: Zistite, kedy dorazí aj k vám

Vianoce sú pre dôchodcov už roky spojené nielen so...

Ursula von der Leyen: EURÓPA už dala UKRAJINE 170 miliárd eur. „Bude treba ešte viac“

Slová, ktoré v stredu v Európskom parlamente zazneli z...

KAUZA: „Uniformy za 88 miliónov? To budú nakupovať u Gucciho, pýta sa POSLANKYŇA Holečková“

Uniforma má byť symbolom disciplíny, dôstojnosti a služby vlasti....
Romana
Romana
Volám sa Romana a som redaktorkou pre portál Mysmezeny.sk Medzi moje obľúbené témy patrí história, vzťahy a náboženstvo 🙏

Video: NA AMERICKÉHO politika spáchali ATENTÁT. Kritizoval hlavne Ukrajinu a Zelenskeho

Jedna z najvýraznejších postáv amerického konzervatívneho hnutia a blízky spojenec Donalda Trumpa, Charlie Kirk, utrpel vážne zranenia po tom, čo naňho počas akcie v...

Pátranie, ktoré zmení život dvoch osamelých duší. Historická romanca Nevídaný gróf

 Pátranie po stratenom dieťati odhalí skryté problémy Londýna. Je tu druhý diel série historických príbehov Georgiánski džentlmeni – Nevídaný gróf. Príbeh, ktorý chytí za...

AKTUÁLNE: Poznáme termíny výplaty 13. dôchodku: Zistite, kedy dorazí aj k vám

Vianoce sú pre dôchodcov už roky spojené nielen so sviatočnou atmosférou, ale aj s očakávaním mimoriadnej dávky, ktorá im uľahčuje zvýšené výdavky. Trinásty dôchodok...
Verified by MonsterInsights