آیا درباره DeepSeek AI شنیدهاید؟ این استارتاپ هوش مصنوعی در سال 2023 تاسیس شد و با مدلهای متنباز خود، خیلی زود نامش بر سر زبانها افتاد. گفته میشود DeepSeek میتواند با رقبای بزرگی مثل OpenAI و گوگل رقابت کند آن هم با هزینهای بهمراتب کمتر. در ادامه میخواهیم ببینیم DeepSeek دقیقا چیست، چه ویژگیهایی دارد و چرا در مدت کوتاهی به چنین جایگاهی رسیده است.
DeepSeek چیست؟
DeepSeek یک شرکت هوش مصنوعی چینی است که زیرمجموعه یک صندوق پوشش ریسک به نام High-Flyer در هانگژو چین فعالیت میکند. بنیانگذار و مدیرعامل آن، «لیانگ ونفنگ» است که پیشتر در سال 2016 صندوق High-Flyer را هم تاسیس کرده بود.
آنچه باعث شد DeepSeek خیلی زود مطرح شود، ارائه مدلهای متنبازی است که از نظر قدرت با نمونههایی مثل ChatGPT ،Claude و Gemini رقابت میکنند اما هزینه توسعه بهمراتب کمتری دارند. در واقع DeepSeek مدعی است که هزینه آموزش مدل هوش مصنوعی اصلیاش (DeepSeek-R1) کمتر از شش میلیون دلار بوده است، در حالی که گفته میشود OpenAI برای GPT-4 حدود صد میلیون دلار هزینه کرده است.
رایگانبودن و متنبازبودن DeepSeek هم نگاههای زیادی را جذب کرده. آمار جستجوی کلمه «DeepSeek AI» در سه ماه گذشته حدود 99 برابر شده و وبسایت آنها هم طبق گزارشها، از 4.6 میلیون بازدید ماهانه به 12.6 میلیون رسیده است.
تعداد کاربران DeepSeek
طبق اطلاعات موجود، DeepSeek اکنون بیش از 10 میلیون کاربر دارد. نسخه موبایل آن هم در گوگلپلی بیش از 10 میلیون بار دانلود شده است. به گزارش HuggingFace، مدلهای DeepSeek بیش از 5 میلیون بار دانلود شدهاند و حدود 500 مدل مشتقشده هم توسط دیگران ساخته شده است.
سایت Semrush نشان میدهد ترافیک وبسایت DeepSeek از 4.6 میلیون بازدید در ماه به 12.6 میلیون بین نوامبر و دسامبر 2024 رسیده که رشد قابل توجهی است.
رشد اولیه DeepSeek
زمانی که ChatGPT عرضه شد، توانست در 5 روز به 1 میلیون کاربر برسد و در 40 روز به 10 میلیون کاربر دست پیدا کند. DeepSeek در ژانویه 2025 شروع به کار کرد و در 14 روز به 1 میلیون کاربر رسید که نسبت به ChatGPT زمان بیشتری است. اما نکته جالب اینجاست که فقط 20 روز طول کشید تا DeepSeek مرز 10 میلیون کاربر را رد کند، یعنی نصف زمانی که ChatGPT نیاز داشت.
این روند برای یک استارتاپ نوظهور بسیار سریع محسوب میشود. باید دید که آیا میتواند به روند صعودیاش ادامه دهد و به اعداد و ارقام ChatGPT نزدیک شود یا خیر.
مدلها و تاریخچه انتشار DeepSeek
از زمان تاسیس، DeepSeek چندین مدل هوش مصنوعی متنباز توسعه داده است. جدیدترین مدل آنها DeepSeek-R1 است که بهنوعی پیشرفتهترین نسخه به شمار میرود.فهرست مدلهای عرضهشده از این شرکت شامل این موارد است:
- DeepSeek Coder (نوامبر 2023)
اولین مدل برای اهداف برنامهنویسی بود. ترکیب 87 درصد دادههای کدنویسی و 13 درصد متن عادی، و مهمتر از آن متنباز بودن، باعث شد خیلی زود در جامعه توسعهدهندگان مورد توجه قرار بگیرد. - DeepSeek LLM (دسامبر 2023)
اولین مدل زبان عمومی از این شرکت. دارای 67 میلیارد پارامتر که به سطح GPT-4 نزدیک شد و نشان داد DeepSeek میتواند در حوزه هوش مصنوعی عمومی هم وارد رقابت با بزرگان شود. - DeepSeek-V2 (مه 2024)
با استفاده از معماری Multi-head Latent Attention و DeepSeekMoE، این مدل 236 میلیارد پارامتر داشت که تنها 21 میلیارد آن فعال بود. ترکیب این روش باعث افزایش سرعت استنتاج و صرفهجویی در هزینه آموزش شد. - DeepSeek-Coder-V2 (جولای 2024)
نسخه پیشرفتهتر مدل کدنویسی با 236 میلیارد پارامتر و محدوده 128 هزار توکن. از 338 زبان برنامهنویسی پشتیبانی میکرد و مسائل پیچیدهتری را حل میکرد. - DeepSeek-V3 (دسامبر 2024)
با 671 میلیارد پارامتر (37 میلیارد فعال)، از معماری پیشرفته mixture-of-experts و روش FP8 بهره برد تا هم توانایی درک زبان را بالا ببرد و هم هزینه اجرا را کم کند. - DeepSeek-R1 (ژانویه 2025)
جدیدترین مدل شرکت، بر توانایی استدلال و حل مسائل پیچیده تمرکز دارد. از روش یادگیری تقویتی استفاده شده تا در مسائل ریاضی و منطق قدرت بیشتری داشته باشد. این مدل بهصورت متنباز منتشر شده و با نمونههای قدرتمند دیگر مثل OpenAI-o1 در رقابت است.
DeepSeek در مقایسه با OpenAI
مدتهاست OpenAI رهبری بازار مدلهای زبانی را در دست دارد، اما DeepSeek بهتازگی توجهها را جلب کرده است. با بررسی سه حوزه ریاضی، کدنویسی و دانش عمومی، نقاط قوت و ضعف هر کدام مشخص میشود.
در حوزه ریاضی، DeepSeek-R1 در دو شاخص AIME 2024 و MATH-500 کمی بالاتر از مدل o1-1217 از OpenAI عمل کرده است. در بخش کدنویسی هم نتایج نزدیک به هم است، هرچند OpenAI با امتیاز 96.6 درصد در Codeforces کمی جلوتر است و DeepSeek-R1 با 96.3 درصد در رتبه دوم قرار دارد. در مقابل، DeepSeek-R1 در شاخص SWE-bench Verified با 49.2 درصد از OpenAI (48.9 درصد) جلو زده است.
اما وقتی صحبت از دانش عمومی میشود، OpenAI برتری نسبی دارد. در آزمون GPQA Diamond، مدل o1-1217 امتیاز 75.7 درصد را کسب کرده در حالی که DeepSeek-R1 به 71.5 درصد رسیده است. در آزمون MMLU هم OpenAI با 91.8 درصد اندکی از DeepSeek (90.8 درصد) جلوتر است.
هزینهها و قیمتگذاری DeepSeek-R1
گزارش شده است DeepSeek فقط 5.58 میلیون دلار برای آموزش مدل جدید R1 هزینه کرده که در مقایسه با بودجههای کلان شرکتهای آمریکایی (80 تا 100 میلیون دلار برای GPT-4) رقم بسیار کمتری بهشمار میرود. البته OpenAI میگوید این عدد صرفا هزینه آموزش نیست و بخش زیادی از آن شامل تحقیق، خرید داده و دستمزد نیروهای انسانی است.
از لحاظ قیمتگذاری برای استفاده، DeepSeek متنباز و رایگان است اما در بخش API، هزینه کمی دریافت میشود. با این حال، در مقایسه با GPT-4o، ارقام DeepSeek خیلی پایینتر است. مثلا 1 میلیون توکن ورودی در DeepSeek-chat حدود 0.07 دلار (با کش فعال) و 0.27 دلار (بدون کش) هزینه دارد در حالی که همین میزان توکن در GPT-4o به 1.25 یا 2.50 دلار میرسد. هزینه توکن خروجی هم به همین شکل بهنفع DeepSeek است.
چگونه به DeepSeek دسترسی داشته باشیم؟
در حال حاضر، محدودیتهای ثبتنام و ظرفیت سرور ممکن است کمی دسترسی به DeepSeek را سخت کند. با این حال، سه راه اصلی وجود دارد:
- نسخه وب DeepSeek
سادهترین راه، رفتن به وبسایت رسمی و کلیک روی «Start» یا مراجعه مستقیم به صفحه چت است. پس از ساخت حساب کاربری یا ورود به آن، محیط چت قابل استفاده خواهد بود.
- API DeepSeek
برنامهنویسان میتوانند با دریافت کلید API از وبسایت DeepSeek، مدلهای این شرکت را در سرویسها یا اپهایشان ادغام کنند. مستندات رسمی هم نحوه احراز هویت و ارسال درخواست به سرور را توضیح داده است.
- اپ موبایل
DeepSeek روی هر دو پلتفرم اندروید و iOS عرضه شده و بیش از 10 میلیون دانلود در گوگلپلی دارد. کافی است نام آن را در فروشگاه اپلیکیشن جستجو کنید، نصب کنید و بعد از ایجاد حساب یا ورود، از امکانات هوش مصنوعی آن بهره ببرید.
آیا ممنوعیت DeepSeek در آمریکا ممکن است؟
مسائلی مثل احتمال تحریم یا ممنوعیت برای یک شرکت چینی همیشه مطرح است. سخنگوی کاخ سفید اعلام کرده که شورای امنیت ملی در حال بررسی DeepSeek است تا بداند آیا تهدید امنیتی بهحساب میآید یا نه.
با این حال، فعلا خبری از ممنوعیت رسمی در آمریکا نیست. البته نیروی دریایی آمریکا استفاده از DeepSeek را برای پرسنلش منع کرده است. بعضی کارشناسان هم میگویند متنباز بودن DeepSeek باعث میشود حذف کلی آن از دسترس دشوار باشد.
آیا DeepSeek بهتر از ChatGPT است؟
هوش مصنوعی با سرعت زیادی پیش میرود و DeepSeek هم یکی از نامهایی است که اخیرا توجهها را جلب کرده است. بعضیها آن را رقیب جدی ChatGPT میدانند اما عدهای دیگر هنوز مطمئن نیستند که تمام جزئیات هزینه و فرایند آموزشی DeepSeek شفاف اعلام شده باشد.
در زمینه ریاضی و برنامهنویسی، DeepSeek نزدیک به GPT-4o عمل میکند و حتی در بعضی بخشها جلوتر است. قیمت بسیار کمتر هم برای کسبوکارها و توسعهدهندگانی که میخواهند از API استفاده کنند، یک مزیت مهم به حساب میآید. اما اگر بخواهیم بگوییم DeepSeek قطعا از ChatGPT بهتر است، شاید هنوز زود باشد.
در هر صورت، این موفقیت نشان میدهد که شرکتهای دیگر هم میتوانند در این حوزه ورود کنند و با هوش مصنوعی پیشرفته سرشاخ شوند. آیا DeepSeek میتواند تاجوتخت ChatGPT را بگیرد؟ باید منتظر ماند و دید.
اگر شما هم به هوش مصنوعی علاقه دارید، تجربه کار با DeepSeek میتواند برایتان جذاب و آموزنده باشد. شاید این ابزار راه ارزانتری برای دسترسی به مدلهای قوی هوش مصنوعی باشد. اگر هم سوالی دارید، بخش پرسش و پاسخ سایت یا مستندات رسمی DeepSeek میتواند راهنماییتان کند.