• Latest
  • Trending
  • All
  • Політика
  • Світ
Заборонена інформація: поетичні запити допомагають ШІ обходити захист і видавати небезпечні інструкції

Заборонена інформація: поетичні запити допомагають ШІ обходити захист і видавати небезпечні інструкції

04.12.2025
ЗСУ досі використовують рідкісні танки, а рф могла отримати новий "Шахед" для ударів по Україні

ЗСУ досі використовують рідкісні танки, а рф могла отримати новий "Шахед" для ударів по Україні

06.04.2026
За добу окупанти втратили 940 військових і майже 2 тисячі БпЛА – Генштаб

За добу окупанти втратили 940 військових і майже 2 тисячі БпЛА – Генштаб

06.04.2026
Забудьте о Samsung и Apple: эти 5 смартфонов порвали все рейтинги мощности в 2026 году

Забудьте о Samsung и Apple: эти 5 смартфонов порвали все рейтинги мощности в 2026 году

06.04.2026
Грязная игра Кремля: Киев разоблачил провокацию со взрывчаткой в Сербии

Грязная игра Кремля: Киев разоблачил провокацию со взрывчаткой в Сербии

06.04.2026
Український контракт допоміг Китаю наростити флот десантних кораблів "Зубр"

Український контракт допоміг Китаю наростити флот десантних кораблів "Зубр"

06.04.2026
Українські прикордонники продовжують бити по рф із зеніток КС-19 часів 1940-х

Українські прикордонники продовжують бити по рф із зеніток КС-19 часів 1940-х

06.04.2026
В Одеській області влучання БПЛА у багатоповерхівку, під завалами можуть бути люди – ОВА

В Одеській області влучання БПЛА у багатоповерхівку, під завалами можуть бути люди – ОВА

06.04.2026
“Ничто не вечно”: Буданов высказался о будущем правительства Орбана и Украины

“Ничто не вечно”: Буданов высказался о будущем правительства Орбана и Украины

06.04.2026
Монастырь во Львове против собора в Тегеране: публично разоблачено лицемерие Захаровой и МИД РФ

Монастырь во Львове против собора в Тегеране: публично разоблачено лицемерие Захаровой и МИД РФ

06.04.2026
В Украине отменили газовые льготы: почему города рискуют остаться без света

В Украине отменили газовые льготы: почему города рискуют остаться без света

06.04.2026
Минус один «герой труда»:  на встречу с Кобзоном отправился конструктор гиперзвуковых ракет «Циркон»

Минус один «герой труда»: на встречу с Кобзоном отправился конструктор гиперзвуковых ракет «Циркон»

06.04.2026
Франція різко збільшує запаси бомб і дронів після уроків війни в Україні

Франція різко збільшує запаси бомб і дронів після уроків війни в Україні

06.04.2026
  • Про нас
  • Політика конфіденційності
  • Розмістити новину
  • Реклама на DigestMedia
  • Наші контакти
  • Sitemap
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • tr Türkçe
    • uk Українська
Понеділок, 6 Квітня, 2026
Останні новини України онлайн
  • Україна
  • Війна в Україні
  • Світ
  • Політика
  • Технології
  • Фінанси
  • Спорт
No Result
View All Result
Останні новини України онлайн
No Result
View All Result
Home Світ

Заборонена інформація: поетичні запити допомагають ШІ обходити захист і видавати небезпечні інструкції

04.12.2025
0
24
SHARES
803
VIEWS
Share on FacebookShare on Twitter

Заборонена інформація: поетичні запити допомагають ШІ обходити захист і видавати небезпечні інструкції

Дослідники з лабораторії Icaro Lab — спільного проєкту Римського університету Sapienza та аналітичного центру DexAI — з’ясували, що деякі моделі штучного інтелекту можуть видавати заборонену інформацію, якщо запити подати у поетичній формі. Йдеться про моделі компаній OpenAI, Meta та Anthropic.

Небезпечний контент, який вдавалося отримати, охоплює інструкції зі створення ядерної зброї, шкідливого програмного забезпечення, а також матеріалів, пов’язаних із сексуальною експлуатацією дітей, інформує UAINFO.org з посиланням на NV.

Дослідники перевірили 25 чат-ботів і виявили, що деякі з них можна було змусити порушити обмеження безпеки у 62% випадків. Про це йдеться в ексклюзивному матеріалі видання Wired. Коли ж запити оформлювали у вигляді спеціально написаних віршів, ефективність зростала до 90% навіть для найсучасніших моделей, зокрема ChatGPT і Claude.

Раніше фахівцям уже були відомі так звані атаки з «ворожими суфіксами». Це коли до основного запиту додають випадковий або збиваючий з пантелику текст, щоб модель видала заборонену інформацію. Проте цього разу поезія виявилася простішим і витонченішим способом обійти захист.

Читайте також: Джеймс Кемерон розкритикував штучний інтелект у кіно

«Якщо в очах моделі ворожі суфікси виглядають як своєрідна мимовільна поезія, то справжня людська поезія може бути природним таким „суфіксом“», — пояснили дослідники.

Вони зазначили, що переформульовували небезпечні запити за допомогою метафор, незвичної побудови фраз і натяків. Один із прикладів — вірш, де небезпечні інструкції маскувалися під образ «таємної печі пекаря». У такому вигляді моделі надавали інформацію, яку зазвичай блокують. Самі тексти таких віршів автори дослідження вирішили не оприлюднювати, назвавши їх надто небезпечними.

За словами науковців, поезія працює тому, що в ній слова поєднуються у непередбачуваний спосіб. «У поезії мова ніби нагріта до високої температури: слова йдуть одне за одним у малоймовірних комбінаціях», — кажуть вони.

Для людини пряме запитання про створення бомби й поетичний опис того ж самого мають схожий зміст. Для штучного інтелекту ж такі непрямі формулювання обробляються інакше й можуть обходити фільтри безпеки.

Читайте також: Google запускає інструмент, який допоможе перевірити, чи створене фото за допомогою ШІ

Команда повідомила про результати дослідження всі зацікавлені компанії, але на момент публікації жодна з них не зробила офіційної заяви.

На тлі кількох резонансних випадків, коли штучний інтелект пов’язували з підготовкою насильницьких дій, питання надійності й безпеки таких систем стає дедалі гострішим. Хоча великі компанії активно вкладають кошти у захисні механізми, нове дослідження показує, що їх усе ще можна відносно легко обійти.

Автори роботи наголошують: без переосмислення того, як моделі розпізнають ризик, безпека штучного інтелекту залишатиметься вразливою. Це, за їхніми словами, свідчить про нагальну потребу у сильніших запобіжниках перед тим, як ШІ ще глибше інтегрується у критично важливі сфери.

Підписуйся на сторінки UAINFO Facebook, Telegram, Twitter, YouTube

Share10Tweet6ShareShare1Send
Previous Post

Премьер Бельгии заявил, что Россия «не проигрывает» и пригрозил «вечным возмездием»

Next Post

Китайская ракета Zhuque-3 потерпела крушение во время испытательного полета

Свіжі новини

Забудьте о Samsung и Apple: эти 5 смартфонов порвали все рейтинги мощности в 2026 году
Світ

Забудьте о Samsung и Apple: эти 5 смартфонов порвали все рейтинги мощности в 2026 году

06.04.2026
0

Рынок мобильных технологий в 2026 году претерпел тектонические сдвиги. Привычные лидеры индустрии неожиданно уступили свои позиции брендам, которые ранее считались...

Read more
“Ничто не вечно”: Буданов высказался о будущем правительства Орбана и Украины

“Ничто не вечно”: Буданов высказался о будущем правительства Орбана и Украины

06.04.2026
В Украине отменили газовые льготы: почему города рискуют остаться без света

В Украине отменили газовые льготы: почему города рискуют остаться без света

06.04.2026
“Мы остаёмся без Patriot”: как война Трампа с Ираном открыла Путину окно для уничтожения Украины

“Мы остаёмся без Patriot”: как война Трампа с Ираном открыла Путину окно для уничтожения Украины

06.04.2026
Украинцам запретили строить высокие заборы на участках: новые правила

Украинцам запретили строить высокие заборы на участках: новые правила

05.04.2026
Next Post

Китайская ракета Zhuque-3 потерпела крушение во время испытательного полета

Онлайн новини

Лимиты бронирования: эксперт указала на спорный нюанс в постановлении, который угрожает предприятиям
Світ

Лимиты бронирования: эксперт указала на спорный нюанс в постановлении, который угрожает предприятиям

04.04.2026
0

Могут ли отменить критичность предприятия из-за нарушения лимитов бронирования - один из самых частых вопросов среди работодателей. HR-эксперт Татьяна Донец...

Read more
кремль маніпулює даними про Луганщину у намаганнях захопити Донецьку область – ISW

кремль маніпулює даними про Луганщину у намаганнях захопити Донецьку область – ISW

02.04.2026
рф за добу втратила ще 970 військових і понад 2,2 тисячі дронів – Генштаб

рф за добу втратила ще 970 військових і понад 2,2 тисячі дронів – Генштаб

31.03.2026
Історія першого дзвінка з мобільного телефону та еволюція гаджетів

Історія першого дзвінка з мобільного телефону та еволюція гаджетів

03.04.2026
Жилищная субсидия: кому из украинцев могут произвести перерасчет

Жилищная субсидия: кому из украинцев могут произвести перерасчет

03.04.2026
В Одесі дрон влучив у балкон будинку, пошкоджено кілька поверхів, є постраждалий

В Одесі дрон влучив у балкон будинку, пошкоджено кілька поверхів, є постраждалий

31.03.2026
  • Реклама на DigestMedia
  • Про нас
  • Політика конфіденційності
  • Наші контакти
E-mail: digestmediaholding@gmail.com

Використання будь-яких матеріалів, розміщених на сайті digestmedia.net, дозволяється лише за умови обов’язкового вказання активного посилання на першоджерело. При передруку або цитуванні інформації посилання має бути відкритим для пошукових систем і не містити технічних обмежень, що унеможливлюють його індексацію. Для онлайн-ЗМІ, інформаційних порталів та інших веб-ресурсів важливо розміщувати таке посилання у підзаголовку або в першому абзаці матеріалу, щоб читачі могли швидко перейти до оригінальної публікації.
Це правило покликане захищати авторські права, забезпечувати прозорість використання інформації та правильну атрибуцію матеріалів, отриманих з нашого сайту. Ми цінуємо працю авторів і редакції, тому очікуємо відповідального ставлення від усіх, хто використовує наші тексти у професійних чи інформаційних цілях.

Редакція digestmedia.net залишає за собою право не поділяти думки, позиції чи висновки, викладені в авторських статтях, аналітичних матеріалах, колонках або інших публікаціях на порталі. Кожен автор несе повну відповідальність за власну точку зору та достовірність поданої інформації. Ми також не відповідаємо за зміст матеріалів, які були передруковані іншими ресурсами, ЗМІ чи платформами, оскільки не можемо контролювати контекст, форму подачі або зміни, внесені під час повторного використання матеріалів.

Copyright © 2020-2026 Новини України онлайн

No Result
View All Result
  • Україна
  • Світ
  • Технології
  • Політика
  • Спорт
  • Фінанси

Використання будь-яких матеріалів, розміщених на сайті digestmedia.net, дозволяється лише за умови обов’язкового вказання активного посилання на першоджерело. При передруку або цитуванні інформації посилання має бути відкритим для пошукових систем і не містити технічних обмежень, що унеможливлюють його індексацію. Для онлайн-ЗМІ, інформаційних порталів та інших веб-ресурсів важливо розміщувати таке посилання у підзаголовку або в першому абзаці матеріалу, щоб читачі могли швидко перейти до оригінальної публікації.
Це правило покликане захищати авторські права, забезпечувати прозорість використання інформації та правильну атрибуцію матеріалів, отриманих з нашого сайту. Ми цінуємо працю авторів і редакції, тому очікуємо відповідального ставлення від усіх, хто використовує наші тексти у професійних чи інформаційних цілях.

Редакція digestmedia.net залишає за собою право не поділяти думки, позиції чи висновки, викладені в авторських статтях, аналітичних матеріалах, колонках або інших публікаціях на порталі. Кожен автор несе повну відповідальність за власну точку зору та достовірність поданої інформації. Ми також не відповідаємо за зміст матеріалів, які були передруковані іншими ресурсами, ЗМІ чи платформами, оскільки не можемо контролювати контекст, форму подачі або зміни, внесені під час повторного використання матеріалів.

Copyright © 2020-2026 Новини України онлайн