DeepSeek AI؛ آیا این رقیب جدید ChatGPT است؟ بررسی کامل ویژگی‌ها و عملکرد

بهمن ۱۸, ۱۴۰۳
بدون نظر

آیا درباره DeepSeek AI شنیده‌اید؟ این استارتاپ هوش مصنوعی در سال 2023 تاسیس شد و با مدل‌های متن‌باز خود، خیلی زود نامش بر سر زبان‌ها افتاد. گفته می‌شود DeepSeek می‌تواند با رقبای بزرگی مثل OpenAI و گوگل رقابت کند آن هم با هزینه‌ای به‌مراتب کمتر. در ادامه می‌خواهیم ببینیم DeepSeek دقیقا چیست، چه ویژگی‌هایی دارد و چرا در مدت کوتاهی به چنین جایگاهی رسیده است.

DeepSeek چیست؟

DeepSeek یک شرکت هوش مصنوعی چینی است که زیرمجموعه یک صندوق پوشش ریسک به نام High-Flyer در هانگژو چین فعالیت می‌کند. بنیان‌گذار و مدیرعامل آن، «لیانگ ونفنگ» است که پیش‌تر در سال 2016 صندوق High-Flyer را هم تاسیس کرده بود.
آنچه باعث شد DeepSeek خیلی زود مطرح شود، ارائه مدل‌های متن‌بازی است که از نظر قدرت با نمونه‌هایی مثل ChatGPT ،Claude و Gemini رقابت می‌کنند اما هزینه توسعه به‌مراتب کمتری دارند. در واقع DeepSeek مدعی است که هزینه آموزش مدل هوش مصنوعی اصلی‌اش (DeepSeek-R1) کمتر از شش میلیون دلار بوده است، در حالی که گفته می‌شود OpenAI برای GPT-4 حدود صد میلیون دلار هزینه کرده است.
رایگان‌بودن و متن‌بازبودن DeepSeek هم نگاه‌های زیادی را جذب کرده. آمار جستجوی کلمه «DeepSeek AI» در سه ماه گذشته حدود 99 برابر شده و وب‌سایت آنها هم طبق گزارش‌ها، از 4.6 میلیون بازدید ماهانه به 12.6 میلیون رسیده است.

تعداد کاربران DeepSeek

طبق اطلاعات موجود، DeepSeek اکنون بیش از 10 میلیون کاربر دارد. نسخه موبایل آن هم در گوگل‌پلی بیش از 10 میلیون بار دانلود شده است. به گزارش HuggingFace، مدل‌های DeepSeek بیش از 5 میلیون بار دانلود شده‌اند و حدود 500 مدل مشتق‌شده هم توسط دیگران ساخته شده است.
سایت Semrush نشان می‌دهد ترافیک وب‌سایت DeepSeek از 4.6 میلیون بازدید در ماه به 12.6 میلیون بین نوامبر و دسامبر 2024 رسیده که رشد قابل توجهی است.

رشد اولیه DeepSeek

زمانی که ChatGPT عرضه شد، توانست در 5 روز به 1 میلیون کاربر برسد و در 40 روز به 10 میلیون کاربر دست پیدا کند. DeepSeek در ژانویه 2025 شروع به کار کرد و در 14 روز به 1 میلیون کاربر رسید که نسبت به ChatGPT زمان بیشتری است. اما نکته جالب اینجاست که فقط 20 روز طول کشید تا DeepSeek مرز 10 میلیون کاربر را رد کند، یعنی نصف زمانی که ChatGPT نیاز داشت.
این روند برای یک استارتاپ نوظهور بسیار سریع محسوب می‌شود. باید دید که آیا می‌تواند به روند صعودی‌اش ادامه دهد و به اعداد و ارقام ChatGPT نزدیک شود یا خیر.

مدل‌ها و تاریخچه انتشار DeepSeek

از زمان تاسیس، DeepSeek چندین مدل هوش مصنوعی متن‌باز توسعه داده است. جدیدترین مدل آنها DeepSeek-R1 است که به‌نوعی پیشرفته‌ترین نسخه به شمار می‌رود.فهرست مدل‌های عرضه‌شده از این شرکت شامل این موارد است:

DeepSeek Coder (نوامبر 2023)
اولین مدل برای اهداف برنامه‌نویسی بود. ترکیب 87 درصد داده‌های کدنویسی و 13 درصد متن عادی، و مهم‌تر از آن متن‌باز بودن، باعث شد خیلی زود در جامعه توسعه‌دهندگان مورد توجه قرار بگیرد.
DeepSeek LLM (دسامبر 2023)
اولین مدل زبان عمومی از این شرکت. دارای 67 میلیارد پارامتر که به سطح GPT-4 نزدیک شد و نشان داد DeepSeek می‌تواند در حوزه هوش مصنوعی عمومی هم وارد رقابت با بزرگان شود.
DeepSeek-V2 (مه 2024)
با استفاده از معماری Multi-head Latent Attention و DeepSeekMoE، این مدل 236 میلیارد پارامتر داشت که تنها 21 میلیارد آن فعال بود. ترکیب این روش باعث افزایش سرعت استنتاج و صرفه‌جویی در هزینه آموزش شد.
DeepSeek-Coder-V2 (جولای 2024)
نسخه پیشرفته‌تر مدل کدنویسی با 236 میلیارد پارامتر و محدوده 128 هزار توکن. از 338 زبان برنامه‌نویسی پشتیبانی می‌کرد و مسائل پیچیده‌تری را حل می‌کرد.
DeepSeek-V3 (دسامبر 2024)
با 671 میلیارد پارامتر (37 میلیارد فعال)، از معماری پیشرفته mixture-of-experts و روش FP8 بهره برد تا هم توانایی درک زبان را بالا ببرد و هم هزینه اجرا را کم کند.
DeepSeek-R1 (ژانویه 2025)
جدیدترین مدل شرکت، بر توانایی استدلال و حل مسائل پیچیده تمرکز دارد. از روش یادگیری تقویتی استفاده شده تا در مسائل ریاضی و منطق قدرت بیشتری داشته باشد. این مدل به‌صورت متن‌باز منتشر شده و با نمونه‌های قدرتمند دیگر مثل OpenAI-o1 در رقابت است.

DeepSeek در مقایسه با OpenAI

مدت‌هاست OpenAI رهبری بازار مدل‌های زبانی را در دست دارد، اما DeepSeek به‌تازگی توجه‌ها را جلب کرده است. با بررسی سه حوزه ریاضی، کدنویسی و دانش عمومی، نقاط قوت و ضعف هر کدام مشخص می‌شود.
در حوزه ریاضی، DeepSeek-R1 در دو شاخص AIME 2024 و MATH-500 کمی بالاتر از مدل o1-1217 از OpenAI عمل کرده است. در بخش کدنویسی هم نتایج نزدیک به هم است، هرچند OpenAI با امتیاز 96.6 درصد در Codeforces کمی جلوتر است و DeepSeek-R1 با 96.3 درصد در رتبه دوم قرار دارد. در مقابل، DeepSeek-R1 در شاخص SWE-bench Verified با 49.2 درصد از OpenAI (48.9 درصد) جلو زده است.
اما وقتی صحبت از دانش عمومی می‌شود، OpenAI برتری نسبی دارد. در آزمون GPQA Diamond، مدل o1-1217 امتیاز 75.7 درصد را کسب کرده در حالی که DeepSeek-R1 به 71.5 درصد رسیده است. در آزمون MMLU هم OpenAI با 91.8 درصد اندکی از DeepSeek (90.8 درصد) جلوتر است.

هزینه‌ها و قیمت‌گذاری DeepSeek-R1

گزارش شده است DeepSeek فقط 5.58 میلیون دلار برای آموزش مدل جدید R1 هزینه کرده که در مقایسه با بودجه‌های کلان شرکت‌های آمریکایی (80 تا 100 میلیون دلار برای GPT-4) رقم بسیار کمتری به‌شمار می‌رود. البته OpenAI می‌گوید این عدد صرفا هزینه آموزش نیست و بخش زیادی از آن شامل تحقیق، خرید داده و دستمزد نیروهای انسانی است.
از لحاظ قیمت‌گذاری برای استفاده، DeepSeek متن‌باز و رایگان است اما در بخش API، هزینه کمی دریافت می‌شود. با این حال، در مقایسه با GPT-4o، ارقام DeepSeek خیلی پایین‌تر است. مثلا 1 میلیون توکن ورودی در DeepSeek-chat حدود 0.07 دلار (با کش فعال) و 0.27 دلار (بدون کش) هزینه دارد در حالی که همین میزان توکن در GPT-4o به 1.25 یا 2.50 دلار می‌رسد. هزینه توکن خروجی هم به همین شکل به‌نفع DeepSeek است.

چگونه به DeepSeek دسترسی داشته باشیم؟

در حال حاضر، محدودیت‌های ثبت‌نام و ظرفیت سرور ممکن است کمی دسترسی به DeepSeek را سخت کند. با این حال، سه راه اصلی وجود دارد:

نسخه وب DeepSeek

ساده‌ترین راه، رفتن به وب‌سایت رسمی و کلیک روی «Start» یا مراجعه مستقیم به صفحه چت است. پس از ساخت حساب کاربری یا ورود به آن، محیط چت قابل استفاده خواهد بود.

API DeepSeek

برنامه‌نویسان می‌توانند با دریافت کلید API از وب‌سایت DeepSeek، مدل‌های این شرکت را در سرویس‌ها یا اپ‌هایشان ادغام کنند. مستندات رسمی هم نحوه احراز هویت و ارسال درخواست به سرور را توضیح داده است.

اپ موبایل

DeepSeek روی هر دو پلتفرم اندروید و iOS عرضه شده و بیش از 10 میلیون دانلود در گوگل‌پلی دارد. کافی است نام آن را در فروشگاه اپلیکیشن جستجو کنید، نصب کنید و بعد از ایجاد حساب یا ورود، از امکانات هوش مصنوعی آن بهره ببرید.

آیا ممنوعیت DeepSeek در آمریکا ممکن است؟

مسائلی مثل احتمال تحریم یا ممنوعیت برای یک شرکت چینی همیشه مطرح است. سخنگوی کاخ سفید اعلام کرده که شورای امنیت ملی در حال بررسی DeepSeek است تا بداند آیا تهدید امنیتی به‌حساب می‌آید یا نه.
با این حال، فعلا خبری از ممنوعیت رسمی در آمریکا نیست. البته نیروی دریایی آمریکا استفاده از DeepSeek را برای پرسنلش منع کرده است. بعضی کارشناسان هم می‌گویند متن‌باز بودن DeepSeek باعث می‌شود حذف کلی آن از دسترس دشوار باشد.

آیا DeepSeek بهتر از ChatGPT است؟

هوش مصنوعی با سرعت زیادی پیش می‌رود و DeepSeek هم یکی از نام‌هایی است که اخیرا توجه‌ها را جلب کرده است. بعضی‌ها آن را رقیب جدی ChatGPT می‌دانند اما عده‌ای دیگر هنوز مطمئن نیستند که تمام جزئیات هزینه و فرایند آموزشی DeepSeek شفاف اعلام شده باشد.
در زمینه ریاضی و برنامه‌نویسی، DeepSeek نزدیک به GPT-4o عمل می‌کند و حتی در بعضی بخش‌ها جلوتر است. قیمت بسیار کمتر هم برای کسب‌وکارها و توسعه‌دهندگانی که می‌خواهند از API استفاده کنند، یک مزیت مهم به حساب می‌آید. اما اگر بخواهیم بگوییم DeepSeek قطعا از ChatGPT بهتر است، شاید هنوز زود باشد.
در هر صورت، این موفقیت نشان می‌دهد که شرکت‌های دیگر هم می‌توانند در این حوزه ورود کنند و با هوش مصنوعی پیشرفته سرشاخ شوند. آیا DeepSeek می‌تواند تاج‌وتخت ChatGPT را بگیرد؟ باید منتظر ماند و دید.
اگر شما هم به هوش مصنوعی علاقه دارید، تجربه کار با DeepSeek می‌تواند برایتان جذاب و آموزنده باشد. شاید این ابزار راه ارزان‌تری برای دسترسی به مدل‌های قوی هوش مصنوعی باشد. اگر هم سوالی دارید، بخش پرسش و پاسخ سایت یا مستندات رسمی DeepSeek می‌تواند راهنمایی‌تان کند.