Використовуючи цей сайт, ви погоджуєтеся з нашою політикою конфіденційності та умовами використання.
Accept
Craftium.AICraftium.AICraftium.AI
  • Головна
  • Новини
  • Каталог
  • Підбірки
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Пошук
  • Головна
  • Новини
  • Каталог
  • Підбірки
  • Блог
Слідкуйте за нами:
  • Правила використання
  • Політика конфеденційності
  • Авторські права
  • Зворотній зв’язок
© 2024-2025 Craftium.AI.

Claude Opus 4 отримає функцію завершення небезпечних розмов

Рішення активується лише у разі крайніх образливих запитів і не спрацьовує при загрозі самозавдання шкоди

Eleni Karasidi
Eleni Karasidi
Опубліковано: 17.08.2025
Новини
Ілюстративне зображення з сайту anthropic
Ілюстративне зображення з сайту anthropic.com.
Поділитися:

Anthropic представила нову функцію , яка дозволяє її найновішим і найбільшим моделям ШІ завершувати розмову у рідкісних і крайніх випадках наполегливо шкідливих чи образливих взаємодій з користувачами. Компанія підкреслює, що впроваджує цю можливість не для захисту людей, а для безпеки самої ШІ-моделі. Це стосується моделей Claude Opus 4 і 4.1, і активується лише у випадках, коли користувачі надсилають запити, пов’язані з сексуальним контентом за участі неповнолітніх або намагаються отримати інформацію для організації масштабного насильства чи терактів.

Anthropic зазначає, що Claude Opus 4 під час тестування неохоче реагувала на подібні запити і демонструвала явні ознаки небажання продовжувати розмову. Функція завершення діалогу активується тільки після кількох невдалих спроб змінити тему спілкування, коли вже немає надії на продуктивну взаємодію, або якщо користувач сам просить закінчити чат.

Читайте також

OpenAI
OpenAI готує нові функції для генерації зображень та безпеки API
Claude Sonnet 4.5 виявляє тестування та підвищує безпеку ШІ
Нові аватари Copilot додають емоції до голосових розмов

Компанія повідомляє, що Claude не використовуватиме цю функцію, якщо існує ризик, що користувач може завдати шкоди собі чи іншим. Після завершення розмови користувачі можуть почати новий діалог з того ж облікового запису або створити нову гілку спірної бесіди, відредагувавши свої відповіді.

Anthropic розглядає цю можливість як експеримент і планує надалі вдосконалювати підхід. Компанія також вивчає питання «благополуччя моделі» і тестує різні способи зниження потенційних ризиків для своїх ШІ-моделей у майбутньому.

Anthropic запустила Claude Sonnet 4.5, для довготривалої автономної роботи
ChatGPT автоматично обирає суворішу модель у чутливих розмовах
Meta запускає Vibes для створення відео за допомогою ШІ
Нові моделі Claude від Anthropic зʼявилися у 365 Copilot
Qwen представила нові моделі для голосу, редагування зображень та модерації контенту
Позначки:AnthropicClaude AIБезпекаШІ-асистент
Коментарів немає

Залишити відповідь Скасувати коментар

Слідкуй за нами

XСлідувати
InstagramСлідувати
YoutubeПідписатися
TelegramСлідувати

Популярні новини

Зображення з відео Adobe
Google Nano Banana з’явиться у Photoshop для покращення редагування зображень
12.09.2025
Приклад зображення
Використання Nano Banana у Gemini росте завдяки міні-фігуркам (+промпт)
16.09.2025
Логотип Genspark
Genspark випустив браузер із безкоштовним вбудованим ШІ
14.09.2025
Gemini
Google оприлюднила ліміти для сервісу Gemini
08.09.2025
ШІ поширює неправдиву інформацію
Чат-боти на ШІ удвічі частіше поширюють фейки у новинах
15.09.2025

Читайте також

Зображення з сайту Google
Новини

Gemini стає частиною Google TV для «розумного» перегляду

23.09.2025
Кадр з відео Google
Новини

Gemini стає доступним у Chrome для всіх користувачів США

19.09.2025
ШІ хитрує
Новини

ШІ-моделі навчилися приховувати обман під час перевірок безпеки

18.09.2025

Craftium AI — команда, яка пильно стежить за розвитком генеративного ШІ, застосовує його у своїй творчості й охоче ділиться власними відкриттями.

Навігація

  • Новини
  • Огляди
  • Підбірки
  • Блог

Корисне

  • Правила використання
  • Політика конфеденційності
  • Авторські права
  • Зворотній зв’язок

Підписуйся на останні новини, корисні поради та детальні гайди по ШІ.

Підписуючись, ви приймаєте нашу політику конфіденційності та умови використання.

Craftium.AICraftium.AI
Слідкуйте за нами:
© 2024-2025 Craftium.AI
Підписка
Прокачайся з AI!
Надихайся важливими новинами, корисними порадами та гайдами, отримуючи їх прямо на свою пошту.

Підписуючись, ви приймаєте нашу Політику конфіденційності та Умови використання.

Welcome Back!

Sign in to your account

Ім'я користувача або eMail
Пароль

Забули пароль?