http://Top.Mail.Ru
DeepSeek и Qwen: в чем секрет китайских нейросетей и как они повлияют на ИИ | Ямал-Медиа
31 января 2025, 05:14 (обновлено: 31 января 2025, 09:14)

В интересах ИИ-революции: изменит ли будущее доступный искусственный интеллект из Китая

Китай вышел на рынок с очередной продвинутой языковой моделью искусственного интеллекта. По заявлению разработчиков, новая нейросеть превосходит все предыдущие версии. Эксперты говорят, что Qwen2.5-VL вместе с ранее выпущенной DeepSeek-V3 нанесли мощный удар западным технологическим компаниям. О революции в сфере ИИ и ее прогнозируемых последствиях — в материале «Ямал-Медиа».

Декабрьский сюрприз от китайского стартапа DeepSeek

Платформу DeepSeek разработала одноименная компания. Ее в 2023 году основал китайский инженер, выпускник Чжэцзянского университета Лян Вэньфэн. Он стал сооснователем хедж-фонда High-Flyer, который специализируется на применении ИИ в разработке алгоритмов для торговли ценными бумагами.

В декабре 2024 году волну интереса к проекту вызвал запуск модели DeepSeek-V3. СМИ писали, что потрачено на проект было всего 5,5 миллиона долларов, — затраты сравнивали с миллиардными финансовыми вложениями в ChatGPT и обращали внимание, что машинное обучение заняло всего 55 дней. При этом китайские разработчики в области ИИ находятся под санкциями США и ограничены в доступе к производительным чипам, которые получают конкуренты: OpenAI и Google.

Фактически небольшой китайский стартап совершил прорыв в мире ИИ. Но это был лишь первый удар: 20 января компания выпустила продвинутую модель DeepSeek-R1, которая оказалась еще более производительной, эффективной, с возможностью прослеживать логические цепочки рассуждений, а главное — открытым исходным кодом. Она доступна и бесплатна.

Но и это не всё. Китайские разработчики пошли дальше: выпущена мультимодальная нейросеть Janus-Pro-7B для работы с изображениями. Ее также можно использовать в коммерческих целях без ограничений.

Фото: DC Studio/Shutterstock/Fotodom
Фото: DC Studio/Shutterstock/Fotodom

Нейросеть Qwen 2.5-Max от Alibaba

В конце января китайская технологическая компания Alibaba заявила о выпуске новой версии своей модели искусственного интеллекта Qwen 2.5-Max. По словам разработчиков, она превосходит DeepSeek-V3 и представляет собой не только многофункциональный чат-бот, но и генератор фото и видео.

У двух продуктов китайских разработчиков есть отличия. Обе модели умеют искать информацию в интернет-источниках, генерировать изображения и видео, решать задачи и писать коды. В тестах Qwen 2.5-Max превзошла DeepSeek V3 по задачам на написание кода, логику и математику. Навыки поиска DeepSeek по интернету оказались сравнимы с ChatGPT.

В чем прорывная особенность китайских нейросетей? По мнению руководителя отдела разработки ПО Максима Гутина, она заключается в методике машинного обучения. В беседе с «Ямал-Медиа» он привел для сравнения работу над ChatGPT.

«ChatGPT обучали на всех знаниях в интернете, на всей информации. Это проверенные и непроверенные источники, там были как научные исследования, так и фейки. DeepSeek показала, что необязательно использовать огромный массив данных, для обработки которых нужен огромный объем памяти и вычислительные мощности. Они использовали для обучения своей нейросети только качественные, проверенные людьми данные, таких было в разы, в десятки, сотни и даже в тысячи раз меньше, поэтому соответственно и расходы меньше».

Максим Гутин

руководитель отдела разработки ПО

Фото: NicoElNino/Shutterstock/Fotodom
Фото: NicoElNino/Shutterstock/Fotodom

Директор и партнер компании «Интеллектуальный Резерв» Павел Мясоедов в комментарии для «Ямал-Медиа» отметил, что в известии о выходе новой версии языковой модели речь скорее идет не о глубокой фактуре, а о маркетинге. Продукт в первую очередь подготовлен для китайского рынка, и вся результативность нейросети показана на китайских же запросах.

«Тем не менее самое большое ноу-хау — то, что она была построена в короткие сроки с маленькими инвестициями. Вроде бы дает быстрые ответы. Но важнее не скорость ответов, а качество их. Модели, которые строились компаниями OpenAI и Nvidia, — это гораздо более продуманные продукты, которые массово используются в том числе и крупным бизнесом, соответственно — уже апробированы и вполне могут применяться и давать результаты. С высокой долей вероятности DeepSeek будет слабо применима, у нее будут слишком высокие погрешности, некорректные ответы. Мы знаем пока только о декларированных заявлениях и каких-то очень точечных тестах».

Павел Мясоедов

директор и партнер компании «Интеллектуальный Резерв» («ИТ-Резерв)

Нейросеть даст умный ответ на какой-то сложный вопрос, но все мысли, которые она выдает, существуют лишь по той причине, что их высказало бы и большинство людей, объяснил эксперт. «Поэтому она хорошо оттачивается под умные ответы на умные вопросы, но при этом технология ИИ не так эффективна в каких-то сторонниках вопросах. Но самое главное — что применимость текущих моделей уже существует в медицине, в производстве, в работе крупных компаний, и мы пока ничего не знаем о том, как DeepSeek в этом плане будет функционировать», — отметил Мясоедов.

Фото: Gorodenkoff/Shutterstock/Fotodom
Фото: Gorodenkoff/Shutterstock/Fotodom

В любом случае появление DeepSeek изменило правила игры на рынке ИИ, и это уже факт. По мнению основателя Telegram Павла Дурова, все произошло не на пустом месте. Прогресс Поднебесной, быстро догоняющей США в области искусственного интеллекта, обусловлен превосходством китайской системы среднего образования над западной, считает бизнесмен.

«В Китае система образования поощряет жесткую конкуренцию между учащимися — принцип, заимствованный из высокоэффективной советской модели. Если система среднего образования США не подвергнется радикальной реформе, растущее доминирование Китая в области технологий окажется неизбежным», — заявил Дуров в своем телеграм-канале.

Китайские нейросети и мировой рынок ИИ

Нейросеть DeepSeek-R1 уже обвалила мировой рынок ИИ на 1 трлн долларов. Акции американских компаний, занимающихся разработками в области искусственного интеллекта, рухнули. Рекордное падение коснулось Nvidia, она производит ИИ-ускорители. За сутки капитализация компания сократилась на 17,8%, это 620 млрд долларов — это рекорд рынка, — а состояние основателя сократилось на 20%.

Акции Broadcom за 24 часа упали на 17%, подешевели Alphabet, AMD, Intel и ряд других западных фирм. Bloomberg сообщил: 500 богатейших людей планеты стали беднее на 108 млрд долларов.

Внезапно и с фурором появившийся конкурент вызвал ответную реакцию, и прежде всего — у американских разработчиков. В адрес Китая начали высказываться подозрения. Некоторые эксперты заявили, что для обучения DeepSeek использовал чипы Nvidia, полученные в обход санкций. Существует мнение, что реальная стоимость разработки выше заявленной. О расследовании возможной кражи кода OpenAI уже заявила компания Microsoft.

Также программисты США сообщили, что нашли в открытом доступе базу данных DeepSeek. В публикации компании по кибербезопасности Wiz говорится, что база данных была полностью открытой и содержала конфиденциальную информацию.

В свою очередь, китайская XLab заявила о серии кибератак с IP-адресов, связанных с США, Сингапуром, Нидерландами и Германией, из-за чего работа DeepSeek была приостановлена. Эксперты полагают, что ситуация с конкурированием в ИИ все больше напоминает информационную войну.

Прогнозы для рынка ИИ: мнение экспертов

По мнению Павла Мясоедова, в ближайшее время произойдет стабилизация рынка. Падение акций ведущих американских компаний в этом отношении малопоказательно, они легко могут «отыграть». «Второе: существует определенный перегрев технологий, связанных с искусственным интеллектом: они все переоценены, поэтому более чувствительны к любым новостям», — заметил он.

Другой вопрос — интерес обычных пользователей: о нем можно судить по рекордному количеству скачиваний новой нейросети. А вот оценить перспективы бизнес-применимости той ли иной модели ИИ эксперт не взялся, объяснив, что это тяжело сделать только на основании того, как нейросеть общается с пользователями.

В свою очередь, от разработчиков, в том числе и американских, стоит ожидать быстрого перехода на новую модель обучения, уверен Павел Гутин. Причина — экономия ресурса.

«Она намного дешевле. Шесть миллионов долларов против сотен миллионов, которые потребовались для обучения OpenAI. Это законы бизнеса. Все будут использовать новый, более экономичный, дешевый способ, который дает ту же самую результативность и даже лучше, потому что обучен на проверенных данных», — подчеркнул эксперт.

Фото: Gorodenkoff/Shutterstock/Fotodom
Фото: Gorodenkoff/Shutterstock/Fotodom

Кроме того, флагманские компании будут открывать новые вакансии для привлечения специалистов высокого уровня. Сотрудникам предстоит генерировать контент или проверять уже имеющуюся информацию для обучения нейросетей. Будут также появляться новые специальности.

Открытым остается вопрос о ранее заявленной цели — создании сверхинтеллектуальной нейросети. Павел Мясоедов полагает, что сейчас на рынке ИИ крупных прорывов не прогнозируется, и вау-эффекта, который был после появления первых версий, точно не будет. По этой же причине невозможно сказать, кто в обозримом будущем вплотную приблизится к революционной разработке.

Максим Гутин добавил, что речь может идти даже не о странах, а о группе людей, которые совершат новый прорыв в развитии нейросетей. Но и это сложно предугадать.

Ранее сообщалось, что Россия будет укреплять сотрудничество с КНР в сфере ИИ. Разработать проект поручено кабмину и «Сбербанку».

Самые важные и оперативные новости — в нашем телеграм-канале «Ямал-Медиа».


Мы используем файлы cookie.
Продолжая пользоваться сайтом, Вы автоматически соглашаетесь с использованием файлов cookie. Вы можете отказаться от использования cookies, отключив самостоятельно эту опцию в настройках браузера. Сохраненные файлы cookie можно удалить в любое время.