Британцы разоблачают недооценку возможностей ИИ — стандартные тесты ошибаются!
🇬🇧 Британцы разоблачают недооценку возможностей ИИ — стандартные тесты ошибаются!
Представьте, что ваш любимый ИИ недооценён, как недооценённый актёр второго плана. Британский Институт безопасности ИИ обнаружил, что стандартные тесты занижают способности ИИ-агентов. Всё дело в ограничениях вычислительных ресурсов: увеличив бюджет токенов в десять раз, они наблюдали скачок успеха на заданиях по программированию на целых 25%! И это далеко не предел — современные модели показывают ещё более впечатляющие результаты.
Представьте себе: реальные достижения на передовой ИИ примерно на 60% круче, чем считалось ранее. Это открытие может изменить подход к оценке интеллектуальных машин. Институт безопасности ИИ подчеркивает, что, пересмотрев стандарты, мы увидим, насколько быстрыми и умными стали наши электронные друзья.
◾️ Рост успеха: +25% на задачах программирования
◾️ Увеличение бюджета токенов: в 10 раз
◾️ Прогресс на передовой: на 60% выше предыдущих оценок
> «Стандарты тестирования ИИ нуждаются в срочной модернизации, чтобы соответствовать реальным возможностям технологий», — считают в институте.
Может, пора пересмотреть наши ожидания и начать доверять машинам чуть больше? 🤔
Подписаться на «Нейро Пульс»
Первоисточник ↗
Представьте, что ваш любимый ИИ недооценён, как недооценённый актёр второго плана. Британский Институт безопасности ИИ обнаружил, что стандартные тесты занижают способности ИИ-агентов. Всё дело в ограничениях вычислительных ресурсов: увеличив бюджет токенов в десять раз, они наблюдали скачок успеха на заданиях по программированию на целых 25%! И это далеко не предел — современные модели показывают ещё более впечатляющие результаты.
Представьте себе: реальные достижения на передовой ИИ примерно на 60% круче, чем считалось ранее. Это открытие может изменить подход к оценке интеллектуальных машин. Институт безопасности ИИ подчеркивает, что, пересмотрев стандарты, мы увидим, насколько быстрыми и умными стали наши электронные друзья.
◾️ Рост успеха: +25% на задачах программирования
◾️ Увеличение бюджета токенов: в 10 раз
◾️ Прогресс на передовой: на 60% выше предыдущих оценок
> «Стандарты тестирования ИИ нуждаются в срочной модернизации, чтобы соответствовать реальным возможностям технологий», — считают в институте.
Может, пора пересмотреть наши ожидания и начать доверять машинам чуть больше? 🤔
Пока нет комментариев — будьте первым.