Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Beata Szydło alarmuje: Czy polski rząd wie, co jest w umowie? z ostatniej chwili
Beata Szydło alarmuje: Czy polski rząd wie, co jest w umowie?

UE i Indie ogłosiły zakończenie negocjacji w sprawie umowy o wolnym handlu. "Czy polski rząd, a zwłaszcza minister rolnictwa, wiedzą, co jest w umowe UE-Indie?" – pyta na platformie X była premier Beata Szydło.

ZUS wydał ważny komunikat z ostatniej chwili
ZUS wydał ważny komunikat

Ponad 309 tys. wniosków o dodanie do stażu pracy okresów innych niż zatrudnienie na podstawie umowy o pracę wpłynęło do 26 stycznia 2026 r. – informuje w komunikacie Zakład Ubezpieczeń Społecznych.

Hiszpański rząd zalegalizuje pobyt nielegalnych migrantów. „To wezwanie do przyspieszenia inwazji” gorące
Hiszpański rząd zalegalizuje pobyt nielegalnych migrantów. „To wezwanie do przyspieszenia inwazji”

Jak poinformował portal El Confidencial, „wszystkie osoby, które przebywały w Hiszpanii przed dniem 31 grudnia 2025 r.” i udowodnią „co najmniej 5 miesięcy pobytu”, otrzymają legalizację pobytu.

13-letnia Polka porwana przez morze na Malcie. Trwa akcja poszukiwawcza z ostatniej chwili
13-letnia Polka porwana przez morze na Malcie. Trwa akcja poszukiwawcza

Na Malcie trwają poszukiwania 13-letniej Polki, która została porwana przez wzburzone morze w poniedziałek wieczorem. Miejscowe służby poinformowały, że we wtorek rano wznowiły poszukiwania dziecka, przerwane w nocy z powodu złych warunków pogodowych.

Wiadomości
Do jakich krajów Polacy najczęściej wysyłają przesyłki kurierskie?

Wysyłki paczek i przesyłek listowych za granicę nie są w dzisiejszych czasach niczym nadzwyczajnym – coraz więcej Polaków ma rodzinę, która wyjechała do pracy lub żyje na obczyźnie; prowadzi interesy z podmiotami zagranicznymi lub posiada inny powód, żeby wysłać coś poza granice naszego kraju. Gdzie najczęściej Polacy nadają paczki kurierskie? W dzisiejszym artykule przedstawiamy szybki ranking najpopularniejszych destynacji przesyłek dostarczanych przez kurierów poza Polską. Chcesz wiedzieć więcej? Przeczytaj nasz dzisiejszy tekst!

Szef NATO odrzucił pomysł stworzenia europejskiej armii. „UE sama się nie obroni” gorące
Szef NATO odrzucił pomysł stworzenia europejskiej armii. „UE sama się nie obroni”

Szef NATO Mark Rutte odrzucił apele niektórych czołowych europejskich polityków o utworzenie europejskiej armii. Pretekstem do forsowania pomysłu wspólnej armii UE były wątpliwości co do zaangażowania Donalda Trumpa w bezpieczeństwo kontynentu, spotęgowane napięciami wokół Grenlandii.

UE i Indie zawierają przełomową umowę o wolnym handlu. Wrażliwe sektory rolnictwa będą chronione pilne
UE i Indie zawierają przełomową umowę o wolnym handlu. "Wrażliwe sektory rolnictwa będą chronione"

UE i Indie zakończyły dziś negocjacje w sprawie umowy o wolnym handlu (FTA). To największa taka umowa, jaką kiedykolwiek zawarły obie strony.

Komunikat dla mieszkańców Warszawy z ostatniej chwili
Komunikat dla mieszkańców Warszawy

W sobotę 31 stycznia Punkty Obsługi Pasażerów będą nieczynne – wynika z komunikatu opublikowanego 26 stycznia 2026 r. przez Warszawski Transport Publiczny.

Wiadomości
Jak dobrać męską wodę perfumowaną do pory roku?

Odpowiednia męska woda perfumowana potrafi całkowicie odmienić samopoczucie i wizerunek, dostosowując się do temperatury oraz nastroju. Zrozumienie, jak poszczególne akordy reagują na aurę, ułatwia znalezienie ideału. Zapraszamy do przewodnika po sezonowych zapachach, które królują w tegorocznych trendach.

Adam Borowski w Kancelarii Prezydenta. Nie złamała go komuna i nie pozwolimy, by złamali go teraz z ostatniej chwili
Adam Borowski w Kancelarii Prezydenta. "Nie złamała go komuna i nie pozwolimy, by złamali go teraz"

Prezydencki minister Zbigniew Bogucki spotkał się w poniedziałek z legendarnym działaczem Solidarności Adamem Borowskim. "Nie złamała go komuna i nie pozwolimy by złamali go teraz" – oświadczył.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane