Гра розуміння: як Сполучені Штати та Китай борються за лідерство у сфері штучного інтелекту.
![](/images/content/8539215462/e880f64db4f24fd483591d3c1659a0cb.jpg)
DeepSeek — це стартап з Китаю, який нещодавно презентував свою нову модель штучного інтелекту під назвою DeepSeek-R1. Ця розробка може конкурувати з аналогічними системами, створеними американськими компаніями, такими як OpenAI, Meta та Google. Однак DeepSeek-R1 використовує лише дві тисячі старшого покоління чипів Nvidia, тоді як, наприклад, модель штучного інтелекту від Meta потребує близько 16 тисяч чипів. Вартість навчання цієї системи становить менше шести мільйонів доларів, що є значно меншою сумою, ніж "понад 100 мільйонів доларів", про яку згадував Сем Альтман, CEO OpenAI, в контексті навчання GPT-4.
27 січня DeepSeek обійшов ChatGPT і став найпопулярнішим безплатним застосунком в App Store. Також додаток зібрав понад один мільйон завантажень у Google Play. На обох платформах застосунок використовує основну версію чатбота DeepSeek-V3, яка є безплатною, однак потребує авторизації. Модель DeepSeek-R1 наразі доступна для вебверсій.
Увечері того-таки 27 січня новостворений китайський чат-бот зазнав масштабної кібератаки, через яку тимчасово призупинив реєстрацію нових користувачів. Станом на 31 січня проблему виправили.
Як з'явився DeepSeek
Підприємець Лян Веньфен заснував компанію DeepSeek у 2023 році у місті Ханчжоу. 40-річний Веньфен -- випускник факультету інформаційної та електронної інженерії державного Чжецзянського університету. З 2016 року він є гендиректором хедж-фонду High Flyer, що використовує штучний інтелект для торгів на фінансових ринках і є основним спонсором DeepSeek.
Маловідомий загалу Лян Веньфен нині опинився у центрі міжнародної уваги. Нещодавно він навіть був присутній на зустрічі, яку організував прем'єр-міністр Китаю Лі Цян. Це, як пише BBC, свідчить про дедалі більшу популярність DeepSeek в індустрії ШІ й увагу до нього з боку держави, яка декларує пріоритетом розвиток нових технологій.
"Ми часто стверджуємо, що різниця в розвитку штучного інтелекту між Китаєм і США складає лише рік чи два. Проте насправді суть полягає в оригінальності проти наслідування. Якщо ситуація залишиться незмінною, Китай залишиться в тіні, — зазначив Лян у своєму інтерв'ю минулого року. І, здається, він дійсно знайшов унікальний підхід."
Які особливості роблять модель DeepSeek-R1 прогресивною?
За словами творців, ефективність R1 порівнянна з моделлю "o1" від Open AI. Ця система має здатність вирішувати математичні проблеми, створювати програмний код, проводити аналіз даних та навіть веселити користувачів жартами. Однією з її ключових характеристик є доступна для всіх функція "reasoning", яка демонструє, як алгоритм прийшов до певного висновку у відповідь на запит користувача.
Більшість моделей, які розробляють компанії Кремнієвої долини у галузі ШІ, залишаються закритими. Натомість китайська модель R1 має відкритий вихідний код, що дозволяє іншим компаніям чи дослідникам використати його для створення власних аналогічних продуктів.
Генеральний директор OpenAI Сем Альтман охарактеризував модель R1 як "надзвичайно потужну", тоді як виконавчий директор Meta Марк Цукерберг визнав досягнення компанії, підкресливши, що вони сподіваються досягти подібних результатів у своїх системах. При цьому Цукерберг зазначив, що прорив, досягнутий DeepSeek, є лише одним із багатьох в постійно розвиваючійся сфері штучного інтелекту.
Дональд Трамп же вважає, що китайський штучний інтелект DeepSeek має стати "тривожним дзвіночком для американських галузей", і що Штатам потрібно "зосередитися на конкуренції, щоб перемогти".
Обвал фондових ринків і що до цього призвело
Новини про досягнення DeepSeek викликали значні зміни в акціях технологічних корпорацій на міжнародних фінансових ринках. Однією з причин цього стало те, що китайська модель штучного інтелекту має невисоку ціну та може функціонувати на застарілих процесорах.
Через це на ринку виникли сумніви щодо обґрунтованості ціни таких компаній як Nvidia. Акції американського виробника графічних процесорів впали на 17 %. Лише за 27 січня Nvidia втратила майже 600 млрд доларів ринкової капіталізації, що є найбільшим падінням в історії фондового ринку США, пише CNBS.
Financial Times повідомляє, що ринки пережили коливання через перегляд інвесторами потенційних майбутніх вкладів у штучний інтелект. У результаті, технологічний індекс Nasdaq Composite знизився на 3,1%, в той час як індекс S&P 500 впав на 1,5%, а акції Microsoft зменшилися на 2,1%.
Чи може DeepSeek бути крадіжкою
Влада китайської компанії повідомляє, що інвестиції в розробку їхнього проєкту склали приблизно шість мільйонів доларів, тоді як їхні американські конкуренти з DeepSeek витратили на аналогічні чат-боти сотні мільйонів, а іноді й мільярди. Ця значна різниця у витратах викликала у американців питання щодо чесності китайських розробників.
Не так давно OpenAI звинуватила компанію DeepSeek у використанні їхнього штучного інтелекту для власних навчальних цілей. Згідно з даними OpenAI, китайська фірма використовувала метод, відомий як "дистиляція", під час якого одна модель штучного інтелекту отримує навчання на основі відповідей іншої генеративної моделі ШІ.
Протягом минулих двох років, під час президентства Джо Байдена, Вашингтон ввів ряд експортних обмежень, спрямованих на стримування розвитку штучного інтелекту в Китаї. Наразі, за даними джерел Bloomberg, представники Білого дому та ФБР перевіряють інформацію про те, чи купував китайський стартап DeepSeek високотехнологічні напівпровідники Nvidia через посередників у Сінгапурі, обходячи американські обмеження.
Як пише BBC, засновник DeepSeek Лян Веньфен мав у запасі 50 тисяч чипів Nvidia A100, експорт яких був заборонений до Китаю з вересня 2022 року. Саме завдяки поєднанню цих мікросхем із дешевшими, менш складними аналогами Веньфену вдалося створити таку потужну модель ШІ.
Зберігання інформації та контроль в DeepSeek
Інформація, яку користувачі вводять у додаток, а також супутній контент можуть бути використані для навчання або поліпшення моделей DeepSeek. Якщо користувач не подасть запит на видалення своїх даних, вони можуть зберігатися в системах на тривалий період. Цей підхід є відмінною рисою DeepSeek в порівнянні з OpenAI, яка має чітко визначені процедури відмови та видалення інформації. Цю тему висвітлює Forbes.
Користувачі програми відзначили, що чат-бот не реагує на питання, пов’язані з чутливими для китайської влади темами, такими як розстріл протестувальників на площі Тяньаньмень або критика Комуністичної партії Китаю. Додаток розроблений таким чином, щоб надавати лише інформацію, що відповідає комуністичній доктрині. Однак дослідники вважають, що модель була навчена на великому обсязі даних, що включають відомості про ці події, але над нею встановлено цензурний механізм, який блокує доступ до цих інформацій у відповідях.
Зростає тривога.
Нещодавно Міністерство оборони та Конгрес США заборонили своїм працівникам використовувати новий китайський чат-бот на основі штучного інтелекту, відомий як DeepSeek. Аналогічні обмеження були введені на Тайвані, де державним установам та підприємствам критичної інфраструктури також заборонено користуватися цим додатком. Причиною таких заходів стало побоювання, що чат-бот може передавати інформацію до уряду Китаю.
Італія стала першою європейською країною, що повністю заборонила використання додатку DeepSeek, прагнучи захистити особисті дані своїх громадян. Тим часом Франція планує дослідити роботу системи штучного інтелекту, розробленої китайським стартапом, та оцінити потенційні загрози для конфіденційності користувачів.
DeepSeek — це тільки початок!
За останні шість місяців Китай затвердив понад 40 моделей штучного інтелекту. Такий підхід підкреслює наміри Пекіна як до розвитку технологій ШІ, так і до контролю над галуззю, пише Reuters.
Китайський технологічний гігант Alibaba, відомий своїми досягненнями в електронній комерції, хмарних рішеннях та фінансових послугах, нещодавно представив оновлену версію свого штучного інтелекту — Qwen 2.5. Представники компанії стверджують, що їхній новий продукт демонструє кращі результати в порівнянні з конкурентом DeepSeek R1.
Модель Qwen 2.5 була представлена у перший день китайського Нового року, що підкреслює зростаючий вплив популярності DeepSeek на як міжнародних, так і місцевих конкурентів, зазначає Reuters.
Інавгурація Трампа та його політика щодо ШІ
Рішення компанії DeepSeek анонсувати нову модель штучного інтелекту напередодні інавгурації президента США Дональда Трампа мало політичний підтекст. Основною метою цього кроку було знизити довіру суспільства до регулювання сфери штучного інтелекту в критичний період для американської політики, зазначає "Голос Америки".
Ставши президентом вдруге, Дональд Трамп одразу скасував указ свого попередника Джо Байдена, спрямований на зменшення ризиків, пов'язаних зі штучним інтелектом. А ще -- анонсував 500 млрд доларів інвестицій у створення нової державної компанії Stargate, яка упродовж чотирьох років має розбудувати інфраструктуру штучного інтелекту.
Під час зустрічі з керівництвом Stargate, новообраний президент США пообіцяв, що реалізація цього проекту призведе до створення 100 тисяч нових робочих місць "майже відразу" та забезпечить "технологічне майбутнє" для країни. "Це масштабне зусилля є яскравим підтвердженням віри в потенціал Америки", -- наводить слова Трампа The Guardian.
Що далі?
Випуск нової моделі штучного інтелекту, відомої як R1, поставив під сумнів домінування США у цій галузі та збільшив шанси на те, що деякі китайські компанії зможуть обійти Кремнієву долину у її власній грі. Цю інформацію повідомляє Financial Times.
Нещодавні досягнення DeepSeek не свідчать про те, що Китай вже випередив США у галузі штучного інтелекту, але вони безумовно змінюють хід конкурентної боротьби між цими державами. У майбутньому лідерство в сфері штучного інтелекту залежатиме не лише від наявності найсучасніших чіпів, а й від вмілого їх використання.