Root NationСтаттіСервісиЩо таке DeepSeek і чому всі про нього говорять

Що таке DeepSeek і чому всі про нього говорять

-

28/01/2025

© ROOT-NATION.com - Використання контенту дозволено за умови розміщення зворотного посилання

Сьогодні ми розкажемо про нову мовну модель DeepSeek, яка визвала справжній ажіотаж. З’ясуємо, чому всі про неї говорять.

Здається, в Інтернеті з’явилася нова улюблена модель штучного інтелекту, і це не остання модель ChatGPT від індустрії недоторканних OpenAI. Ця нова модель походить з Китаю, і вона викликала справжній фурор у світі АІ.

DeepSeek

Китайський чат-бот зі штучним інтелектом піднявся на вершину Apple App Store і тепер став найпопулярнішим безкоштовним застосунком. Все це відбулося після випуску моделі “мислення” DeepSeek-R1 20 січня, яка обігнала ChatGPT від OpenAI. Але про все по порядку.

🤖 Що таке DeepSeek і чому впали акції Nvidia

Також цікаво: Панамський канал: Історія будівництва та причини претензій США

ЗМІСТ

1. Чим цікавий DeepSeek

2. Хто створив DeepSeek R1

3. Що таке DeepSeek R1

4. DeepSeek R1 безкоштовний і необмежений

5. DeepSeek R1 є надзвичайно економічно ефективним

6. DeepSeek R1 є відкритим кодом

7. Як почати користуватися DeepSeek R1

8. DeepSeek все більш ефективно завойовує Захід

9. DeepSeek проти інших мовних моделей: тести

9.1. Еталонний тест Hugging Face

9.2. Еталонний штучний аналіз від Artificial Analysis

10. DeepSeek AI обвалив ринки

11. Що далі?

Чим цікавий DeepSeek

Це китайський стартап, який створює відкриті моделі штучного інтелекту, щоб будь-який розробник міг отримати доступ до технології та створювати нові моделі.

DeepSeek відрізняється від ChatGPT, оскільки він викладає ланцюжок думок, перш ніж дати відповідь на запит. Відгуки у Apple App Store і Google Play Store свідчать про те, що користувачі високо оцінили такий рівень прозорості.

DeepSeek

Його можна завантажити та використовувати безкоштовно, хоча користувачі повинні зареєструватися, перш ніж отримати доступ до АІ.

Китайський стартап DeepSeek 20 січня випустив свою флагманську модель штучного інтелекту R1, здивувавши Кремнієву долину розширеними можливостями моделі. R1 відповідав або перевершував функціональність штучного інтелекту, випущеного OpenAI, Google і Meta — за значно меншого бюджету та без останніх чипів штучного інтелекту.

За останній тиждень застосунок став популярним серед громадськості. Він перевершила ChatGPT за популярністю, ставши №1 у магазині застосунків Apple у США та в топі безкоштовних програм для Android у Google Play Store на момент публікації.

Випуск DeepSeek R1 викликав запитання про те, чи виправдані мільярди доларів, витрачені на штучний інтелект за останні кілька років, і поставив під сумнів думку про те, що США є світовим лідером у сфері штучного інтелекту.

Також цікаво: 10 прикладів найдивнішого використання AI

Хто створив DeepSeek R1

DeepSeek — дослідницька лабораторія штучного інтелекту, яка розташована у китайському місті Ханчжоу, а R1 — її остання модель АІ. Компанію заснував у 2023 році Лян Веньфен, інженер і підприємець з досвідом у сфері АІ та фінансів. До створення DeepSeek Лян очолював приватний інвестиційний фонд High-Flyer, відомий використанням АІ для аналізу фінансових даних. Команда Ляна Веньфена в DeepSeek складається переважно з молодих випускників провідних китайських університетів, таких як Цінхуа та Пекінський університет.

DeepSeek

У березні 2023 року фонд Ляна оголосив у своєму офіційному обліковому записі WeChat, що він “починає гру заново”, виходячи за межі торгівлі. Тепер він зосередить всі ресурси на створенні “нової незалежної дослідницької групи для вивчення суті AGI” (загального штучного інтелекту). Пізніше того ж року було створено DeepSeek.

Компанія DeepSeek LLM (Large Language Model) дебютувала у листопаді 2023 року як DeepSeek Coder з відкритим вихідним кодом, а за нею у травні 2024 року з’явився DeepSeek-V2. Компанія випустила свою останню модель DeepSeek-V3 у грудні 2024 року, і з тих пір спостерігається стрімке зростання популярності, оскільки його мобільний застосунок набрав понад 1,6 мільйона завантажень.

Незважаючи на те, що DeepSeek LLM в основному схожий на інші популярні чат-боти, такі як Google Gemini або ChatGPT, безкоштовні моделі застосунка виявилися популярними серед користувачів, а його зручні для розробників ціни на API висувають його на передній план обговорення.

Також цікаво: Як Тайвань, Китай і США борються за технологічне домінування: велика війна чипів

Що таке DeepSeek R1

DeepSeek поки що має дві поточні моделі: R1 і R1 Zero. Наразі для користувачів доступний лише R1, хоча відмінності між двома моделями AI не такі вже й очевидні. Однак на папері ми знаємо, що DeepSeek R1 — це система штучного інтелекту загального призначення, тоді як DeepSeek R1 Zero використовує Reinforcement Learning, що означає, що вона повністю самонавчається. У всякому разі, це технічні моменти, які не стосуються таких користувачів, як ми.

DeepSeek

Нам важливо знати, що DeepSeek R1 — це модель штучного інтелекту, створена китайською компанією, і вона не поступається останнім доступним системам штучного інтелекту, таким як OpenAI o1 і Anthropic Claude.

Читайте також: Телепортація з наукової точки зору та її майбутнє

DeepSeek R1 безкоштовний і необмежений

Однією з ключових причин, чому DeepSeek вдалося здійняти такий галас, є його вартість для кінцевих користувачів. Він просто безкоштовний. У певному сенсі це перша надзвичайно просунута система АІ, яка доступна користувачам безкоштовно. Для інших систем, як-от OpenAI ChatGPT o1 і Claude Sonnet, потрібна платна підписка. І навіть якщо є підписка, користувачі можуть їх використовувати обмежено. Google Gemini також доступний безкоштовно, але він обмежений для старих моделей і має обмеження щодо використання. DeepSeek, здається, не має обмежень. Користуватися ним поки що можна безкоштовно, як і повністю необмежено.

Також цікаво: 10 найдивніших речей, які ми дізналися про чорні діри у 2021

DeepSeek R1 є надзвичайно економічно ефективним

Одна з причин, чому DeepSeek безкоштовний, швидше за все, полягає в тому, що він, як кажуть, має деякі ключові технологічні прориви. Однією з найбільших переваг DeepSeek R1 є його економічність. У той час як такі моделі, як ChatGPT o1 від OpenAI, коштують близько $15 за мільйон вхідних токенів, ті самі завдання можуть коштувати лише $0,55 для DeepSeek. Ймовірно, низька вартість є причиною того, чому DeepSeek R1 безкоштовний для кінцевих користувачів. І DeepSeek, мабуть, знайшов спосіб знизити вартість системи штучного інтелекту, оптимізувавши її настільки добре, що для її роботи не потрібні величезні обчислювальні ресурси чи безліч графічних карт.

DeepSeek

Насправді, ефективність — це той момент, який змусив людей звернути увагу на DeepSeek, особливо у США. Ще кілька тижнів тому така ефективність вважалася неможливою. Але тепер, коли DeepSeek показав, що можливо зробити, маючи лише кілька мільйонів доларів, такі компанії зі штучного інтелекту, як OpenAI і Google, які витрачають мільярди доларів, виглядають справжніми невдахами.

Також цікаво: Транзистори майбутнього: На нас чекає нова ера чипів

DeepSeek R1 є відкритим кодом

Це ще один ключовий момент, який привабив людей. На відміну від систем OpenAI або Google, DeepSeek R1 є відкритим кодом. По суті, це означає, що DeepSeek не тільки змушує великі американські технологічні компанії виглядати екстравагантними та безвідповідальними в тому, як вони витрачають гроші, але й позбавляє їх можливості підвищувати ціни на свої продукти. Зрештою, DeepSeek, по суті, говорить людям, що вам не потрібно витрачати $1000, щоб отримати доступ до систем OpenAI або Anthropic. Натомість, ви можете просто взяти цю модель з відкритим кодом, налаштувати її відповідно до своїх потреб і використовувати як завгодно.

У той же час наслідки не лише пов’язані з бізнесом. Вони також мають геополітичний характер. Замість того, щоб АІ став ще однією бажаною та ретельно охоронюваною системою, якою володіють певні країни, як-от США, модель з відкритим кодом, як DeepSeek, звільняє технологію, яку може використовувати будь-яка країна світу для створення власних систем АІ. Тепер вже точно можна сказати, що DeepSeek R1 — це один із найдивовижніших і вражаючих проривів, які ми коли-небудь бачили, і це великий подарунок для світу.

Також цікаво: Про квантові комп’ютери простими словами

Як почати користуватися DeepSeek R1

Ви можете використовувати його у будь-якому браузері, відкривши посилання на DeepSeek R1, або завантажити його і встановити з Apple App Store або Google Play Store.

DeepSeek

DeepSeek - AI Assistant

DeepSeek - AI Assistant

Download QR-Code

DeepSeek - AI Assistant

Developer: DeepSeek

Price: Free

‎DeepSeek - AI Assistant

‎DeepSeek - AI Assistant

Download QR-Code

‎DeepSeek - AI Assistant

Developer: 杭州深度求索人工智能基础技术研究有限公司

Price: Free

Найцікавіше, що ви можете спробувати DeepSeek R1 навіть без реєстрації. Хоча тоді він не дуже ефективно працює. Багато хто з вас зразу згадає, що це китайський продукт, і тому подібне, але спробувати можна.

DeepSeek

Що стосується застосунку для смартфонів, то останнім часом користувачі скаржаться, що неможливо пройти реєстрацію через великий наплив бажаючих спробувати китайську новинку. Думаю, незабаром цю проблему буде вирішено.

DeepSeek

DeepSeek

Теж цікаво: Нові технології – як вони полегшують подорожі?

DeepSeek все більш ефективно завойовує Захід

Раптовий вибух популярності моделі не випадковий. Динамічний розвиток технології штучного інтелекту та зростаючий попит на передові аналітичні інструменти змусили користувачів шукати більш точні та ефективні рішення. Виявляється, DeepSeek відповів на ці потреби, запропонувавши інструмент, який не тільки обробляє дані, але й інтерпретує їх значення в певному контексті.

Головним досягненням DeepSeek є зменшення споживання пам’яті та прискорення обчислень без значної втрати точності результатів. Компанія зосередилася на спрощенні процесу вирішення проблем, уникаючи детальних пояснень кожного кроку, і це значно скоротило час обчислень.

Це дозволяє моделі R1 демонструвати виняткову продуктивність у математичних і програмних завданнях, використовуючи підхід ланцюжка думок, подібний до підходу ChatGPT o1.

Також цікаво: Всесвіт: Найнезвичайніші космічні об’єкти

DeepSeek проти інших мовних моделей: тести

Настав час перевірити, чи дійсно нова модель може загрожувати існуючим гігантам АІ на ринку. Щоб відстежити це, ми візьмемо до уваги зовнішні тести, які вже були проведені.

Але варто пам’ятати, що DeepSeek не було включено до багатьох офіційних тестів, принаймні, з двох причин. По-перше, це відносно новий гравець у сфері АІ. Модель R1 була представлена лише 20 січня 2025 року, це означає, що багато попередніх тестів не могли включати її.

DeepSeek

По-друге, китайський гравець застосував унікальний підхід до навчання своєї моделі, зосередившись на оптимізації та ефективності програмного забезпечення, що відрізняється від традиційних методів, які використовуються іншими моделями. Це, безсумнівно, призведе до труднощів при прямому порівнянні з іншими моделями в стандартних тестах.

Еталонний тест Hugging Face

Давайте подивимося на тести, проведені Hugging Face – компанією, яка розробляє обчислювальні засоби для створення програм за допомогою машинного навчання.

DeepSeek-R1 показує дуже високі результати у багатьох тестах Hugging Face, перевершуючи такі моделі, як Claude-3.5, GPT-4o і навіть деякі варіанти OpenAI o1 (хоча не всі).

DeepSeek

Основні переваги DeepSeek-R1:

Навички мислення: у категорії англійської мови вона вирізняється своєю чудовою універсальністю та здатністю давати точні відповіді, особливо в тестах MMLU та DROP.
Кодування та математика: у кодуванні модель демонструє виняткову продуктивність, отримавши високі бали на LiveCodeBench і Codeforces. У математиці DeepSeek-R1 перевершує конкурентів у таких тестах, як AIME 2024 і MATH-500.
Багатомовна підтримка: потужна англійська та китайська.

Еталонний штучний аналіз від Artificial Analysis

Давайте розглянемо подальші тести від компанії Artificial Analysis, яка забезпечує незалежний аналіз моделей АІ та постачальників API. Це еталонний аналіз, який розглядає моделі під дещо іншим кутом зору.

У категорії якості OpenAI o1 і DeepSeek R1 займають перше місце з точки зору якості, отримавши відповідно 90 і 89 балів за індексом якості. Ці моделі демонструють найвищу ефективність у генерації точних і контекстних відповідей, що робить їх лідерами в цій категорії. Однак варто зазначити, що різниця між ними – згідно з тестом – мінімальна.

DeepSeek

Що стосується швидкості генерації токенів, DeepSeek R1 досягає 53,6 токенів за секунду, що ставить його вище за OpenAI1 (32,3 токена/с) і робить його однією з найшвидших моделей у цій категорії. Однак він все ще поступається таким моделям, як ChatGPT o1-mini (210,5 токенів/с) або деяким версіям Gemini.

DeepSeek

Наступна категорія — затримка (час отримання першої відповіді ) — DeepSeek R1 має затримку 29,88 секунди, що ставить його в середину ряду. Такі моделі, як Gemini 2.0 Flash (0,46 с) або GPT-4o (0,46 с), набагато швидше генерують першу відповідь, що може бути вирішальним у програмах, які вимагають негайної відповіді.

Також цікаво: Тераформування Марса: чи може Червона планета перетворитися на нову Землю?

DeepSeek AI обвалив ринки

Увесь ринок у паніці, і головною причиною цього є можливості нової технологічної революції DeepSeek AI, яка, очевидно, потребує дуже недорогої інфраструктури. Крім того, цей новий штучний інтелект використовує мікросхеми, які коштують набагато дешевше у порівнянні з мікросхемами, які використовують американські компанії штучного інтелекту.

Ефективна модель DeepSeek AI викликала страх серед інвесторів і трейдерів по всьому світу, що призвело до ажіотажу на ринку продажів криптовалюти та фондового ринку. З моменту появи штучного інтелекту ціни на акції та криптовалюти на основі штучного інтелекту різко зросли.

DeepSeek

Компанії, які працюють над технологіями розробки алгоритмів АІ, багато в чому покладаються на дорогі чипи GPU. І тут з’являється DeepSeek AI, який використовує недорогі чипи порівняно з іншими американськими компаніями зі штучного інтелекту.

Це породило страх серед усіх інвесторів, які інвестували значні кошти у фінансові продукти на основі АІ. Адже якщо китайський DeepSeek захопить сектор штучного інтелекту, це зменшить домінування на ринку американських компаній штучного інтелекту та призведе до величезних збитків для інвесторів.

Великі технологічні компанії, зосереджені на штучному інтелекті, вже переживають темні дні. Акції Nvidia впали більш ніж на 10%, потягнувши за собою інших західних гравців, таких як ASML. І це тільки початок.

Читайте також: Ми всі станемо голограмами? Розвиток голографії від теорії до практики

Що далі?

Це питання зараз тривожить майже весь технологічний світ. DeepSeek дебютував як блокбастер у технологічному середовищі. Його поява як серйозного суперника в просторі штучного інтелекту свідчить про зміну глобальної технологічної конкуренції. Використовуючи економічно ефективну модель і принцип відкритого вихідного коду, він прагне підірвати сектор АІ та домінувати над компаніями, які займаються розробками в цій сфері у США.

DeepSeek

Успіх моделі вже був помічений у вищих політичних колах Китаю. 20 січня, в день, коли DeepSeek-R1 було оприлюднено, засновник Лян Веньфен відвідав закритий симпозіум для бізнесменів і експертів, організований прем’єр-міністром Китаю Лі Цяном, повідомляє державне інформаційне агентство Сіньхуа.

Присутність Ляна Веньфена на зустрічі є ознакою того, що успіх AI може бути важливим для політичних цілей Пекіна щодо подолання експортного контролю Вашингтону та досягнення самодостатності у стратегічних галузях, таких як АІ.

Однак вихід DeepSeek у простір штучного інтелекту створив напругу в галузі, оскільки ринок боїться його можливостей і надефективної моделі. Проте експерти вважають, що кожна нова інновація приносить певні страхи і зміни. Що з цього вийде – покаже час. Можу одне тільки сказати – нудно точно не буде.

Читайте також:

Син Карпатських гір, невизнаний геній математики, "адвокат "Microsoft, практичний альтруїст, лівоправосек

Більше від автора

Підписатися

2 Comments

Найновіше

Найстаріші Найбільше голосів

Зворотній зв'язок в режимі реального часу

Переглянути всі коментарі

Пок і Дьок

2 місяців тому

Сорян за рос мову, але це дійсно смішно :))

1

0

Відповісти

Eugene Beerhoff

2 місяців тому

Відповісти на Пок і Дьок

:-D

0

0

Відповісти

Інші статті

Підписатися на оновлення

Останні коментарі

похмурий заєць on SpaceX побудує систему ПРО Золотий купол для Трампа

Vladyslav Surkov on Огляд комп’ютерного стола 1stPlayer Moto-GT 1675: великий, універсальний, моторизований

Андрій on Огляд комп’ютерного стола 1stPlayer Moto-GT 1675: великий, універсальний, моторизований

Олекс on Астрономи виявили найвіддаленішого двійника Чумацького Шляху

похмурий заєць on Kenko Tokina випустила портативний касетний магнітофон у стилі ретро

Популярне зараз

ПРОГРАМА ПІДТРИМКИ СТАРТАПІВ