Китайская компания DeepSeek, занимающаяся разработкой искусственного интеллекта (ИИ), опубликовала информацию о том, что обучение их модели R1 обошлось всего в $294 тыс., что существенно меньше затрат, заявленных американскими конкурентами. Об этом 19 сентября сообщило агентство Reuters.
Фирма из Ханчжоу впервые раскрыла данные о расходах на обучение модели R1, презентация которой запланирована на январь 2025 года и которая уже привлекла внимание глобальных инвесторов. Успех относительно недорогих ИИ-систем вызвал у них желание избавиться от акций крупных технологических компаний, опасаясь, что новые китайские разработки могут составить конкуренцию таким лидерам, как Nvidia.
Согласно информации из журнала Nature, после обнародования сведений о расходах и достижениях компании и ее основатель Лян Вэньфэн почти пропали из общественного внимания, оставив лишь несколько обновлений по продуктам. Отмечается, что для обучения модели R1, нацеленной на рассуждения, применялось 512 чипов Nvidia H800. Ранее эта деталь не фигурировала в статье, опубликованной в январе.
1 июля агентство Bloomberg сообщило, что Марк Цукерберг, один из основателей корпорации Meta (признанной экстремистской и запрещенной в РФ), объявил о создании подразделения Meta Superintelligence Labs (MSL), которое будет заниматься разработкой искусственного «суперинтеллекта». Возглавит новое отделение бывший гендиректор стартапа Scale AI Александр Ван.