Gemini 3 Pro став першою AI-моделлю, якій офіційно вдалося дістатися до порога IQ 130. Це результат попередньої версії моделі, що проходила офлайн-оцінювання у бенчмарку Mensa, де використовують окремий набір логічних задач, створений спеціально для тестування штучного інтелекту.
Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.
За основу взято структуру тесту Mensa Norway, але всі питання були переписані з нуля і приховані від публіки, щоб жодна модель не могла натрапити на них у тренувальних даних. Якщо AI має комп’ютерний зір, задачі подаються у вигляді зображень, іншим – у текстовому описі.

За результатами цього незалежного бенчмарку Gemini 3 Pro відірвався від попереднього лідера на 4 бали. І що особливо помітно – обігнав навіть Grok 4 Heavy, який доступний лише у преміальній підписці та розв’язує задачі колективно, одразу декількома версіями моделей із вибором найкращої відповіді.
Після них у рейтингу йдуть Claude Opus 4.1, GPT-5 Thinking та GPT-5 Pro. Якщо ж порівнювати з власною попередницею від Google, то стрибок просто разючий – аж 20 балів різниці між Gemini 3 Pro та Gemini 2.5 Pro.

Цікаво, що у класичному тесті Mensa Norway всі топові моделі показують вищі оцінки. Це вказує на те, що частина оригінальних завдань, швидше за все, таки була присутня в їх тренувальних корпусах. Для орієнтира: середній людський результат – 100, і бал Gemini 3 Pro фактично ставить модель у категорію найрозумніших 2% людей за офлайн-тестом і навіть 0,3% – якщо дивитися на результати Mensa Norway.

Максим Лотт, автор офлайн-бенчмарку, наголошує, що подібні графіки не варто трактувати як «машини перевершили людину». Тест вимірює лише один вузький навик – здатність будувати логічні висновки за абстрактними матрицями. У реальному житті інтелект складається з безлічі компонентів: інтуїції, життєвого досвіду, вміння орієнтуватися у контексті, мотивації, відповідальності. І саме тут людська когніція поки залишається поза конкуренцією.
Читайте також:
