Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Niemiecki dziennik: Europa odpowie na plan USA i przedstawi własny projekt pokojowy ws. Ukrainy z ostatniej chwili
Niemiecki dziennik: Europa odpowie na plan USA i przedstawi własny projekt pokojowy ws. Ukrainy

Kraje europejskie pracują nad własnym dokumentem mediacyjnym - poinformował dziennik „Sueddeutsche Zeitung”, powołując się na źródło w niemieckim rządzie i potwierdzając wcześniejsze doniesienia agencji Reutera. Miałaby to odpowiedź na amerykański plan pokojowy dla Ukrainy.

Długie przerwy w dostawie prądu. Ważny komunikat dla mieszkańców Wielkopolski z ostatniej chwili
Długie przerwy w dostawie prądu. Ważny komunikat dla mieszkańców Wielkopolski

Mieszkańcy wielu miejscowości w Wielkopolsce muszą przygotować się na kolejne przerwy w dostawie energii. Enea Operator opublikowała rozbudowany harmonogram wyłączeń, które obejmą m.in. Poznań, Gniezno, Piłę, Leszno, Lubasz, Wieleń, Swarzędz, Czerwonak, Kicin oraz szereg mniejszych miejscowości. To ważna informacja dla mieszkańców planujących pracę zdalną, funkcjonowanie firm, a także codzienne obowiązki.

Trump: Zełenski musi polubić plan pokojowy. Nie ma kart z ostatniej chwili
Trump: Zełenski musi polubić plan pokojowy. Nie ma kart

Prezydent USA Donald Trump powiedział w piątek, że prezydent Ukrainy Wołodymyr Zełenski musi „polubić” przedstawiony przez niego plan pokojowy, a w przeciwnym wypadku powinien walczyć dalej. Trump dodał, że Ukraina „nie ma kart”.

Karol Nawrocki odniósł się do amerykańskiego planu pokojowego. Sprawdź, co powiedział Prezydent z ostatniej chwili
Karol Nawrocki odniósł się do amerykańskiego planu pokojowego. Sprawdź, co powiedział Prezydent

Prezydent Karol Nawrocki podkreślił w piątek, że to Ukraina padła ofiarą zbrodniczej agresji Putina i to Ukraińcy, przy wsparciu Stanów Zjednoczonych oraz krajów UE, muszą mieć decydujący głos w rozmowach pokojowych. Dodał, że agresorem była i jest Rosja.

Pilny komunikat prokuratury ws. dywersji na kolei. Stanisław Żaryn: Słabo to wygląda z ostatniej chwili
Pilny komunikat prokuratury ws. dywersji na kolei. Stanisław Żaryn: Słabo to wygląda

Dwóch podejrzanych o sabotaż na kolei uciekło z Polski, czterech okazało się niewinnych. „Słabo to wygląda” - skomentował „sukcesy” służb i Prokuratury Krajowej były rzecznik ministra koordynatora służb specjalnych Stanisław Żaryn.

Problemy na Podkarpaciu. IMGW wydał komunikat pogodowy Wiadomości
Problemy na Podkarpaciu. IMGW wydał komunikat pogodowy

Od rana Podkarpacie zmaga się z intensywnymi opadami śniegu, które powodują trudne warunki na drogach. Tworzy się błoto pośniegowe, a na niektórych odcinkach doszło już do kolizji i wypadków. Najpoważniejszy wypadek miał miejsce w Konieczkowej w powiecie strzyżowskim, gdzie trzy auta zderzyły się, a jedna osoba została ranna.

Tȟašúŋke Witkó: Analiza wsteczna zawsze skuteczna tylko u nas
Tȟašúŋke Witkó: Analiza wsteczna zawsze skuteczna

Całkowicie przypadkowo natrafiłem na krążącą w przestrzeni medialnej grafikę, w mej ocenie – czyli cynicznego i wyzutego z uczuć wyższych indywiduum – znakomitą. Przedstawia ona kobietę dzierżącą w dłoni wielki, plastikowy worek, na boku którego widnienie rosyjska flaga, a tuż obok stoi dziewczynka w wieku szkolnym, z tornistrem na plecach, i – patrząc na dorosłą niewiastę – mówi: „Mamo, tata wrócił!”.

Śmierć 7-letniej polskiej dziewczynki w Tarnopolu. Prezydent zabrał głos z ostatniej chwili
Śmierć 7-letniej polskiej dziewczynki w Tarnopolu. Prezydent zabrał głos

Prezydent Karol Nawrocki podkreślił w piątek, że z głębokim bólem przyjął informację o śmierci 7-letniej Amelki, obywatelki Polski, która zginęła w Tarnopolu wraz ze swoją mamą. Jak zaznaczył, stało się to w wyniku barbarzyńskiego rosyjskiego ostrzału ludności cywilnej.

Francuski generał ostrzega przed potencjalną wojną z Rosją. „Musimy być gotowi stracić swoje dzieci” gorące
Francuski generał ostrzega przed potencjalną wojną z Rosją. „Musimy być gotowi stracić swoje dzieci”

Gen. Fabien Mandon, który we wrześniu objął stanowisko szefa sztabu armii, powiedział we wtorek kongresowi burmistrzów, że największą słabością Francji w dzisiejszych niebezpiecznych czasach jest brak woli walki. Jego ostrzeżenie o potencjalnej wojnie z Rosją ostro podzieliło opinię polityczną.

Czysta klasa. Gest Williama przyciągnął uwagę całego świata Wiadomości
"Czysta klasa". Gest Williama przyciągnął uwagę całego świata

Książę William i księżna Kate uczestniczyli w środę wieczorem w londyńskiej gali charytatywnej Royal Variety Performance, wydarzeniu tradycyjnie wspieranemu przez członków brytyjskiej rodziny królewskiej. Obecność pary przyciągnęła uwagę mediów z całego świata.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane
Emerytury
Stażowe