Політичні новини України та світу

Як DeepSeek змогла перевершити популярність американського штучного інтелекту?

Все, що варто дізнатися про чат-бот DeepSeek: його витоки, використовувані технології, вплив на фінансові ринки, питання безпеки та порівняння з ChatGPT.

Китайський стартап DeepSeek буквально увірвався в ШІ-простір, засмутивши компанії з Кремнієвої долини і оскарживши припущення про те, чого насправді може досягти ШІ. Проєкт поєднує фінансування на рівні хедж-фондів, амбіції відкритого вихідного коду і глибоко вкорінену місію перевершити людський інтелект. При цьому він намагається затьмарити таких розробників, як OpenAI і Meta, склавши їм конкуренцію. То хто і що стоїть за новим чат-ботом? Відповіді шукав Фокус.

Компанія DeepSeek була заснована в липні 2023 року випускником Чжецзянського університету на ім'я Лян Веньфен. Штаб-квартира розташовується в Ханчжоу і фінансується хедж-фондом High-Flyer, співзасновником якого є Лян. Варто зазначити, що активи цього фонду становлять близько 8 млрд доларів США.

DeepSeek використовує процесори Nvidia A100, незважаючи на заборону їх експорту до Китаю. Ці дії, вжиті адміністрацією Білого дому, спрямовані на стримування прогресу китайської технологічної індустрії. Як зазначає видання interestingengineering.com, "ці чіпи є ключовими для технологічної інфраструктури та інноваційних можливостей компанії".

На сьогоднішній день стало відомо, що для розвитку обчислювальних можливостей ШІ-моделі DeepSeek-V3 було інвестовано 6 мільйонів доларів. Це невелика сума в порівнянні з величезними інвестиціями, які роблять американські компанії в сфері ШІ. Ще одна перевага DeepSeek полягає в можливості безкоштовного доступу до чат-бота, який можна завантажити, наприклад, з App Store, на відміну від ChatGPT, де частина послуг є платними. Експерти ринку вважають, що DeepSeek має суттєвий потенціал для змагання з американськими ШІ-моделями, оскільки забезпечує високу продуктивність за набагато нижчих витрат, "викликавши переосмислення існуючих стандартів у глобальній індустрії ШІ". Фахівці не просто так висловлюють ці думки: версія бота DeepSeek R1 зайняла перше місце за кількістю завантажень у світі, в результаті чого популярність інших ботів різко впала. Це призвело до значних втрат для таких підприємців, як Дженсен Хуанг (співзасновник Nvidia), Майкл Делл (Dell) та Ларрі Еллісон (Oracle), які втратили 20,1 мільярда, 22,6 мільярда та 13 мільярдів доларів відповідно. Існування DeepSeek підтвердило, що можливо створювати ефективний ШІ без використання дорогих процесорів та величезних капіталовкладень, згідно з повідомленням bloomberg.com. Керування всією системою здійснює кластер з 10 тисяч чипів Nvidia A100.

Команда експертів з High-Flyer активно розробляє китайського ШІ-бота, зосереджуючи свої зусилля на створенні штучного інтелекту загального призначення (AGI), про що вони оголосили ще на початку 2023 року.

Можна сказати, що DeepSeek є "китайською відповіддю" на ChatGPT від OpenAI, який з'явився наприкінці 2022 року. Відтоді війна технологій між КНР і США перейшла в гарячу фазу, і китайські компанії всерйоз узялися за розробку конкурентоспроможних чат-ботів на основі ШІ. Незважаючи на зусилля таких гігантів, як Baidu, був очевидний помітний розрив у можливостях ШІ США і Китаю. КНР значно відставала в цій сфері.

Але у 2023 році ситуація змінилася докорінно. Проєкт DeepSeek зумів подолати технологічний розрив і досягти успіху в галузі AGI, який, як вважається, зможе в майбутньому перевершити людський інтелект. Не обійшлося і без значних інвестицій у розробку моделей DeepSeek-V3 і DeepSeek-R1, які швидко здобули визнання завдяки продуктивності, що конкурує з продуктами від OpenAI та Meta. І все це попри обмежений доступ компанії до новітніх чипів Nvidia.

Зокрема, DeepSeek-V3 акцентує увагу на високій швидкості обробки даних та економічній ефективності. Цей бот досяг вражаючих результатів у сферах, що потребують потужних обчислювальних ресурсів, таких як кодування та розв'язання складних математичних завдань. Більш детальну інформацію про цю модель штучного інтелекту можна знайти в статті на Arxiv, де зазначено, що вона перевершує інші подібні рішення з відкритим вихідним кодом і демонструє результати, що порівнянні з передовими моделями з закритим вихідним кодом, такими як GPT-4 і Claude-3.5-Sonnet.

DeepSeek вирізняється серед інших застосунків на основі штучного інтелекту, таких як ChatGPT, завдяки своїй унікальній архітектурі та методам роботи, які сприяють підвищенню продуктивності та зниженню витрат. Застосовуючи модель "групи експертів" (англ. Mixture of Experts - MoE), цей китайський бот активує лише певні сегменти своєї нейромережі в залежності від конкретного запиту, що суттєво економить обчислювальні ресурси. Це контрастує з підходом ChatGPT, який обробляє всі запити через всю свою мережу, що призводить до вищого споживання ресурсів.

Конструкція MoE дає змогу "ДіпСік" виконувати обробку, орієнтовану на конкретні завдання, що підвищує продуктивність у спеціалізованих галузях, як-от кодування та розв'язання технічних проблем, і прискорює час відгуку.

Навпаки, ChatGPT забезпечує більш стабільну продуктивність у широкому спектрі завдань, але може відставати у швидкості через комплексний метод обробки даних. Незважаючи на це, ChatGPT часто надає більш точні та контекстно багаті відповіді, забезпечуючи глибину, якої DeepSeek може не вистачати.

Фреймворк DeepSeek відрізняється високим рівнем налаштування і створений з урахуванням потреб користувачів, які мають достатні навички та експертизу для ефективного управління можливостями штучного інтелекту. Завдяки цьому, модель ідеально підходить для виконання специфічних завдань, що вимагають технічної підтримки.

З іншого боку, інтуїтивно зрозумілі налаштування ChatGPT привертають увагу більшої кількості користувачів, що робить його відмінним вибором для творчої діяльності, генерації ідей та загального збору інформації.

Що стосується доступності, то відкритий вихідний код DeepSeek забезпечує безкоштовний доступ і простоту модифікації та використання, що робить його надзвичайно привабливим для розробників.

ChatGPT надає безкоштовний доступ, але також пропонує платні опції, що відкривають шлях до розширених функцій API.

DeepSeek, хоча й потужний, вимагає від користувачів вищого рівня технічних навичок, що може завадити його популярності. А ось інтуїтивно зрозумілий інтерфейс ChatGPT і простіша модель взаємодії з користувачем забезпечують легшу криву навчання.

З етичної перспективи DeepSeek викликає занепокоєння через здійснення збору даних, яке включає зберігання IP-адрес і відомостей про пристрої, що може бути у конфлікті з вимогами GDPR. Натомість OpenAI акцентує увагу на процесах анонімізації та шифрування інформації, щоб відповідати нормам захисту особистих даних.

Запуск моделі R1 DeepSeek буквально вразив світові фондові ринки, особливо зачепивши технологічний сектор. Так, індекс Nasdaq Composite різко впав на 3,1%, втративши понад 1 трлн доларів ринкової вартості.

Згідно з інформацією від CNBC, цей спад був викликаний втратами великих технологічних корпорацій. Наприклад, Nvidia понесла збитки, що перевищують 600 мільярдів доларів ринкової капіталізації, зазнавши найбільших одноразових втрат в історії компанії. Це призвело до того, що Apple обійшла Nvidia, ставши найдорожчою компанією в Сполучених Штатах, тоді як інші технологічні гіганти, такі як Google та Microsoft, також відчули значні фінансові втрати.

Енергетична індустрія зазнала значного зниження, спричиненого стурбованістю інвесторів щодо можливого впливу новітньої енергоефективної технології DeepSeek на загальний попит на енергію в технологічному секторі. Акції компаній GE Vernova та Vistra, які займаються виробництвом чистої енергії, знизилися на 21% і 28% відповідно.

Аналітики Волл-стріт уважно вивчають довгострокові наслідки появи DeepSeek як суперника для американських технологій у сфері ШІ. Нижчі витрати і знижені потреби в енергії цього чат-бота піднімають питання про стійкість високих ставок інвестицій у ШІ-технології з боку американських компаній, підкреслюючи потенційну перевитрату коштів у цьому секторі.

Численні аналітики вважають, що ринкова реакція може виявитися надмірною, враховуючи постійно високий попит на технології штучного інтелекту, які потребують значних ресурсів для своєї інфраструктури. Окрім цього, геополітичні фактори також мають значення, оскільки санкції з боку США не змогли зупинити прогрес у розвитку штучного інтелекту в Китаї.

Незважаючи на технологічні досягнення, DeepSeek викликає такі ж побоювання, як і інші китайські платформи на кшталт TikTok. Річ у тім, що новий ШІ-бот збирає персональні дані користувачів, включно з датами народження, натисканнями клавіш, текстовими та аудіоповідомленнями, завантаженими файлами та історією чатів. Ця інформація зберігається на серверах у Китаї, пише interestingengineering.com.

Така практика викликає серйозні побоювання щодо безпеки та конфіденційності користувацьких даних, з огляду на закони Китаю, які зобов'язують усі організації співпрацювати з національними розвідувальними службами.

Фахівці у сфері ринку висловлюють занепокоєння, що "ДіпСік" має потенціал для розповсюдження шкідливого програмного забезпечення або механізмів спостереження, що може загрожувати приватності користувачів. Питання щодо заходів безпеки DeepSeek виникли після інциденту з вразливістю, що був зафіксований у грудні 2024 року. Тоді було виявлено недолік, який дозволяв "захоплювати" облікові записи, хоча пізніше ця проблема була усунена, згідно з інформацією від clickcontrol.com.

Ситуація загострилася, коли на тлі сплеску завантажень ШІ-бот став ціллю "масштабної шкідливої атаки", що вказує на триваючі проблеми безпеки. Цей інцидент підкреслює ризики, пов'язані з використанням DeepSeek, особливо щодо захисту персональних даних, які обробляє ШІ, пише theguardian.com.

Користувачі та розробники повинні враховувати ці ризики під час інтеграції та використання інструментів ШІ, таких як DeepSeek. У міру розвитку ШІ, забезпечення прозорості та надійних заходів безпеки матиме вирішальне значення для підтримки довіри користувачів і захисту особистої інформації від неправомірного використання.

Читайте також