Alibaba DAMO Academy создает крупнейшую в мире модель предварительного обучения ИИ с параметрами, намного превосходящими Google и Microsoft

В понедельник Alibaba DAMO Academy объявила о последней разработке мультимодальной большой модели M6, параметры которой подскочили с 1 триллиона до 10 триллионов, что намного превышает триллионную модель, ранее выпущенную Google и Microsoft. В итоге предтренировочная модель стала крупнейшей в мире ИИ.

По заявлению компании, M6 достигла высочайшего уровня низкоуглеродистости и высокой эффективности, благодаря использованию 512 графических процессоров для обучения 10 триллионов годных моделей в течение 10 дней. По сравнению с GPT-3, большой моделью, выпущенной в прошлом году, M6 имеет такой же масштаб параметров и потребляет всего 1% своей энергии.

M6 – это общая модель искусственного интеллекта, разработанная DAMO Academy, с мультимодальными и многозадачными функциями. Ее когнитивные и творческие способности превосходят традиционный искусственный интеллект, и она особенно хороша в дизайне, письме и вопросах и ответах. Ее можно широко использовать в областях электронной коммерции, производства, литературы и искусства, научных исследований и так далее. По сравнению с традиционным ИИ, большая модель имеет в сотни или тысячи раз больше «нейронов» и заранее вводит значительный объем данных, демонстрируя способность к обучению «делать выводы от других», как и у людей.

Согласно Alibaba, в качестве первой коммерческой мультимодальной большой модели, в Китае M6 применялась в более чем 40 сценариях с ежедневным объемом звонков – в сотни миллионов.

В то же время DAMO Academy запустила MUGE, крупнейший в настоящее время китайский набор мультимодальных оценочных данных, который охватывает задачи графического описания, генерации текста, изображений и кросс-модального поиска, заполняя пробелы, вызванные отсутствием соответствующих авторитетных китайских критериев оценки.

Чжоу Цзинжэнь, руководитель лаборатории аналитики данных и разведки в DAMO Academy, заявил: «Далее мы глубоко изучим когнитивные механизмы мозга и постараемся улучшить когнитивные способности M6 до уровня, близкого к человеческому. Например, моделируя межмодальное извлечение человеческих знаний и понимание людей, строится базовая структура общих алгоритмов ИИ. С другой стороны, креативность M6 в различных сценариях постоянно совершенствуется, чтобы обеспечить отличную прикладную ценность ».

Источник: Pandaily

You might also like