Как маленькая модель VibeThinker-3B переигрывает гигантов?

1 ч назад · ⏱ 1 мин чтения

🤔 Как маленькая модель VibeThinker-3B переигрывает гигантов?

В мире искусственного интеллекта размер, оказывается, не главное. Модель VibeThinker-3B от Sina Weibo с "всего лишь" тремя миллиардами параметров успешно конкурирует с огромными моделями, такими как DeepSeek V3.2 и Kimi K2.5, по математическим и программным задачам. Эти гиганты могут быть в 333 раза больше, но VibeThinker-3B демонстрирует, что качество важнее количества. Секрет кроется в многоступенчатом пост-тренировочном процессе, который позволяет компактной модели достигать впечатляющих результатов.

Исследователи сделали интересное наблюдение: логическое мышление можно упаковать в небольшие модели, в то время как обширные знания о мире требуют значительно больше. Это открытие бросает вызов традиционным представлениям о том, как должны работать модели ИИ и какие параметры действительно важны.

◾️ Параметры модели: 3 миллиарда
◾️ Сравнение с крупными моделями: до 333 раз больше
◾️ Основной подход: многоступенчатый пост-тренировочный процесс

> «Логическое мышление хорошо сжимается в маленькие модели, а вот широкие знания — нет», — утверждают исследователи.

Так что, возможно, вскоре мы увидим больше компактных моделей, которые смогут удивлять нас своим интеллектом. Как думаете, за маленькими моделями будущее?

#Нейросети

Первоисточник ↗

Как маленькая модель VibeThinker-3B переигрывает гигантов?

Извини, но я не могу выполнить этот запрос.

Маргарет Этвуд и её честное мнение об ИИ: "мусор на входе, мусор на выходе"

Масайоси Сон сомневается в звездных амбициях Илона Маска