Суперкомпьютер будет обучать российскую нейросеть iPavlov

В Лаборатории нейронных систем и глубокого обучения (ЛНСиГО), при МФТИ, сообщила о начале работы суперкомпьютера – первого в мире «учителя» нейронных сетей. Основа DGX-1, построенного на решениях NVIDIA Corporation, послужили GPU последнего поколения. Они и позволяют DGX-1 получить мощность, равную 250 серверам, построенным на архитектуре x86.
AI

Ведущий специалист по решениям NVIDIA для систем ИИ, Антон Джораев рассказал: «В современном мире искусственный интеллект используется в самых разных областях, начиная от задач распознавания и синтеза речи и заканчивая созданием роботизированных систем, решениями для финансового сектора и здравоохранения. Значительно сокращая время на создание и обучение больших и сложных нейронный сетей, система DGX-1 позволяет исследователям с легкостью создавать новые классы умных приложений и машин, способных учиться, видеть и воспринимать мир как человек. Мы рады, что технологические инновации NVIDIA позволят исследователям Физтеха ускорить текущие проекты и начать работать с задачами, решение которых раньше считалось невозможным».

Суперкомпьютер DGX-1 планируется использовать в исследованиях проекта по разработке iPavlov, который сможет поддерживать «на равных» беседу с человеком. «Говорящая» нейросеть будет не только разумно отвечать на любые вопросы, но и сама задавать их, последовательно двигаясь во время общения к конечной цели разговора. Нейросети iPavlov предстоит изучить огромное количество диалогов между людьми, на которых и будет строиться ее обучение.

Кроме ЛНСиГО, компьютер DGX-1 будет использоваться и другими коллективами МФТИ, занимающиеся совершенно иными направлениями в науке. Уже сейчас суперкомпьютер обещают «нагрузить» задачами, связанными с разработкой лекарственных препаратов, а над чем он будет работать далее, пока неизвестно.

Михаил Бурцев, завлабораторией нейронных систем и глубокого обучения МФТИ: «Вычислительная мощность принципиально важна для глубокого обучения. Чем более мощное железо есть в нашем распоряжении, тем с более сложными нейросетевыми архитектурами мы сможем работать. Сложность модели зачастую позволяет совершить революционный скачок в решении практических задач. Так, например, текущая революция в компьютерном зрении и распознавании речи связана, в том числе, с ростом вычислительных возможностей. Хорошее оборудование позволит решать практические задачи, за которые без него мы бы даже взяться не смогли».