ИИ от DeepMind провалил школьный тест по математике

Научно-популярные и даже развлекательные СМИ в наше время переполнены новостями об успехе ИИ-проектов. То искусственный интеллект побеждает человека в го, то учится играть в StarCraft и выходит победителем из схватки с признанными чемпионами. И это только малая толика достижений, на самом деле их гораздо больше. Обычный человек (в смысле, не связанный с ИТ-сферой) может подумать, что вот-вот появится настоящий, «большой» искусственный интеллект, о котором пишу фантасты и снимают фильмы.

Но все далеко не так радужно. К примеру, на днях появилась информация о том, что ИИ попробовал сдать тест по высшей математике (школьный тест, стандартный для Великобритании) и не смог этого сделать.

В принципе, причины неудачи можно объяснить без особого труда. Так, человек при решении задач математического характера задействует следующие способности и возможности.

Модифицирует для себя символы в сущности, такие как числа, арифметические операторы, переменные (которые в комплексе образуют функции) и слова (определяющие вопрос, смысл задачи и т.п.).

Планирование (например, ранжируя функции в порядке, необходимом для решения математической задачи).
Использование вспомогательных алгоритмов для составления функций (сложение, умножение).
Использование кратковременной памяти для хранения промежуточных значений (например, h (f (x))).
Применение на практике полученных ранее знаний о правилах, преобразованиях, процессах и аксиомах.

DeepMind обучили и тестировали на подборке различных типов математических проблем и задач. Разработчики не использовали краудсорсинг, вместо этого они синтезировали набор данных для генерации большого количества тестовых задач, контроля уровня их сложности и т.п. Команда разработчиков использовала текстовый формат данных «произвольной формы».

Изначальные данные базировались на задачах из подборок заданий для учащихся школ Великобритании (возраст до 16 лет). Задания брались из таких направлений, как арифметика, алгебра, теория вероятностей и др.

Результат оказался не слишком хорошим. Лишь 35% ответов ИИ оказались правильными, это неудовлетворительная оценка по стандартам любой школы.

habr.ru

1	Smith	2552
2	Merlin	1739
3	Dr.Ri	977
4	Fatik	809
5	maleeka	751
6	Antara	746
7	nesievaa	532
8	mariam	479
9	brz	465
10	Detroit	438

ИИ от DeepMind провалил школьный тест по математике

Комментарии