Deepseek: بهترین گزینه جایگزین chatgpt یا کانون ادعاهای مشکوک؟

به نظر می رسد اینترنت دارای یک هوش مصنوعی جدید است و آخرین مدل Chatgpt از صنعت Untouchables Openai نیست.
در حال افزایش به بالای فروشگاه App Apple ، Chatbot اطلاعات مصنوعی چینی در اعماق داشتن اکنون به برنامه رایگان با رتبه برتر تبدیل شوید پس از انتشار مدل “استدلال” Deepseek-R1 در تاریخ 20 ژانویه ، برای بهره وری پس از محبوبیت در محبوبیت ، پس از محبوبیت در محبوبیت ، در این روند غلبه کرد.
فراتر از تابلوهای فروشگاه App ، ادعاهای پیرامون توسعه و توانایی های Deepseek ممکن است حتی چشمگیرتر باشد. شرکت پشت LLM (مدل زبان بزرگ) ادعا می کند که برای آموزش مدل Deepseek-V3 خود کمتر از 6 میلیون دلار هزینه دارد و ضمن دستیابی به نتایج مشابه ، از سخت افزار محدود در مقایسه با معاصران آمریکایی خود استفاده کرده است.
با این حال ، در حالی که Deepseek به طور یکسان در بین کاربران و توسعه دهندگان محبوبیت دارد ، عمدتاً به لطف قیمت گذاری مطلوب API آن ، تمام آنچه که درخشش می دهد طلا نیست وقتی این برنامه به دست می آید ، و هوای جنجالی باعث می شود که از دو AI در غیر این صورت موفقیت آمیز از دو هوش مصنوعی بسیار توانمند استفاده کند. مدل ها.
Deepseek: Deepseek چیست؟
Deepseek توسط Liang Wenfeng ، کارآفرین چینی و بنیانگذار صندوق پرچین High-Flyer مستقر در Hangzhou ، Zhejiang ، چین تأسیس شد. در ابتدا ، Deepseek قرار بود یک بال تحقیقاتی AGI (هوش کلی مصنوعی) از Flyer High-Flyer باشد ، که از سال 2021 به طور انحصاری از AI در الگوریتم های معاملاتی استفاده کرده است. با این حال ، از ماه مه 2023 ، Deepseek به عنوان شرکت خود ، با Flyer-Flyer ایستاده است. تبدیل شدن به یکی از سرمایه گذاران اصلی آن.
Deepseek LLM این شرکت (الگوی زبان بزرگ) در نوامبر 2023 به عنوان رمزگذار Deepseek منبع باز آغاز شد و در ماه مه 2024 توسط Deepseek-V2 دنبال شد. این شرکت آخرین مدل Deepseek-V3 خود را در دسامبر 2024 راه اندازی کرد و از آن زمان شاهد توهین بوده است. محبوبیت ، با برنامه تلفن همراه خود بیش از 1.6 میلیون بارگیری.
در حالی که Deepseek LLM عمدتاً شبیه به سایر چت های محبوب مانند Google Gemini یا Chatgpt است ، مدل های رایگان برنامه در حال استفاده از برنامه ها محبوب هستند و قیمت گذاری API سازگار با توسعه دهنده آن ، آن را به خط مقدم بحث و گفتگو سوق می دهد.
Deepseek: چرا مهم است؟
اسطوره قدیمی پیش می رود که در طول مسابقه فضایی دهه 1960 ، ناسا میلیون ها دلار را برای تهیه یک قلم فضایی پس از آنکه متوجه شد گزینه های توپ برای نوشتن در محیط جاذبه صفر فضا ناتوان هستند ، صرف تولید قلم فضایی می کند. در همین حال ، همتایان کیهانی آنها با استفاده از مداد از چنین هزینه ها و سردردهایی جلوگیری کردند.
در حالی که هیچ یک از اینها درست نیست، این یک تمثیل از پرش و عملی است که یک داستان عالی را ایجاد می کند.
با این حال ، با آینه ای از افسانه قلم فضایی ، Deepseek به ظاهر موفق شده است از طریق توسعه مدل Deepseek-V3 خود ، که ادعا می کند با قیمت کمتر از 6 میلیون دلار آموزش دیده است ، یک شاهکار مشابه را در مقرون به صرفه و کاربردی از بین ببرد. از صدها میلیون نفر که توسط شرکت های دیگر که نتایج مشابهی را دنبال می کنند (ضمن دستیابی سطح قابل مقایسه عملکرد).
نه تنها این ، بلکه نسخه اخیر Deepseek از مدل “استدلال” Deepseek-R1 آن برای شبیه سازی اندیشه منطقی با قربانی کردن سرعت پاسخ برای یک پاسخ مناسب تر طراحی شده است. این می تواند به نتایج برابر با (اگر بهتر از) مدل “استدلال” خود Openai ، GPT-O1 باشد-حتی اگر این شرکت ادعا کند توسط محدودیت های صادراتی ایالات متحده در GPU های قدرتمندتر NVIDIA همسترن شده است.
Deepseek: هزینه آن چقدر است؟
Deepseek از طریق آن از طریق آنلاین رایگان است درگاه وب یا در تلفن همراه (با هر دو اندرویدی و برنامه های iOS موجود).
با این حال ، تأثیر ظهور Deepseek بر هزینه هوش مصنوعی برای مشاغل ، توسعه دهندگان و موارد دیگر می تواند بیشترین پیشگویی باشد ، با این که مدل قیمت API این شرکت رقابت را از آب بیرون می کشد.
در حالی که Openai در حال حاضر هزینه 15 دلار در هر میلیون دلار (واحد داده ای که در طی تولید پاسخ یک مدل به آنها تقسیم می شود) ، Deepseek تنها 55 سنت در هر میلیون توکن هزینه دارد ، که افت پدیده ای برای کاربران API تا 96 درصد است.
این تفاوت هزینه می تواند برای بسیاری از کاربران حرفه ای درگیر با هوش مصنوعی در حال تغییر باشد و خطر قابل توجهی برای درآمد بالقوه Openai ایجاد می کند ، در حالی که Deepseek به طور بالقوه اکنون دست شرکت های دیگر را وادار می کند تا قیمت های خود را پایین بیاورند تا رقابتی باقی بمانند.
تأثیر Deepseek در حال حاضر در بازارها احساس می شود. چندین نام نیمه هادی احساس ضربه می کنند، از جمله nvidia. پس از انتشار آخرین مدل های Deepseek در روز دوشنبه ، معاملات قبل از بازار 13.8 ٪ کاهش یافت و تهدید کرد که تقریباً 500 میلیارد دلار از کلاه معاملات این شرکت از بین می رود. با این حال ، از آن زمان به 11 ٪ صعود کرده است.
Deepseek: بحث و جدال
اگر همه چیز Deepseek برای درست بودن صداهای بسیار خوب را ارائه می دهد ، این به طور بالقوه است زیرا برخی از ادعاهای Deepseek ممکن است دقیقاً همین باشد.
عملکرد مدل های V3 و R1 Deepseek قابل بحث نیست. با این وجود ، بسیاری از سؤالات در مورد قیمت گذاری واقعی شرکت ، استفاده از آن از سخت افزار ، هزینه آموزش آن و تهیه اطلاعات آموزشی آن باقی مانده است.
دومی قبلاً موضوع بحث و جدال بوده است. چندین کاربر گزارش دادند که Deepseek V3 از خود به عنوان chatgpt مراجعه کنید، به طور بالقوه نشان می دهد که این مدل بر روی مجموعه داده های عمومی تولید شده توسط مدل GPT-4 OpenAi آموزش داده شده است.
به تکنیک، مایک کوک ، یکی از همکاران پژوهشی در کالج کینگ لندن که متخصص در AI است ، از این ادعاها حمایت کرد و اظهار داشت: “بدیهی است که این مدل در حال دیدن پاسخ های خام از چتپپ است.”
کوک برجسته می کند که این ممکن است یک عمل عمدی توسط Deepseek نباشد ، اما همچنین خاطرنشان می کند که تمرین مدل های آموزش بر روی داده های تولید شده توسط مدل های دیگر می تواند “بسیار بد” باشد ، آن را به “گرفتن یک فتوکپی از یک فتوکپی” به این معنا که این امر را تشبیه می کند کیفیت خروجی ها هر بار کاهش می یابد.
همچنین ممکن است که با اتخاذ داده های آموزشی تولید شده ، Deepseek هر یک از همان تعصبات مدل اصلی را به ارث ببرد ، و به تعصبات خود chatbot اضافه شود ، که سانسور سختگیرانه توسط قانون حزب ضد کمونیستی چین (CCP) روایت، از جمله وقایع حادثه میدان Tiananmen در سال 1989 ، اعتراضات هنگ کنگ ، مالکیت تایوان ، رفتار چین با مردم اویغور یا اشغال تبت.
این شکل سانسور فقط اعتماد به این سکو را کاهش می دهد و بنیانگذار لیانگ ونفنگ ارتباط با CCP فقط نگرانی های مربوط به نحوه استفاده از داده های کاربر یا اینکه چگونه مقامات چینی می توانند در آینده از این پلتفرم استفاده کنند ، افزایش یابد.
نوشتن برای بروزرسانی بیومتریک، آنتونی کیمری ، سردبیر سابق و بنیانگذار امنیت میهن تاداY ، برجسته کرد که چگونه این پلتفرم می تواند “از کمپین های اطلاعاتی با هدف بی ثبات کردن نهادهای آمریکایی پشتیبانی کند.”
ادعاهای Deepseek مبنی بر توسعه مدل های خود در سخت افزار کمتر پیشرفته نیز مورد سؤال قرار می گیرد. آتیف مالک ، تحلیلگر سیتی ، اظهار داشت: “در حالی که دستاورد Deepseek می تواند پیشگامانه باشد ، ما این تصور را مطرح می کنیم که شاهکارهای آن بدون استفاده از GPU های پیشرفته برای تنظیم دقیق آن و/یا ساخت LLMS اساسی مدل نهایی از طریق تقطیر انجام شده است. تکنیک. “
سؤال مالیک می تواند وزن بیشتری داشته باشد ، زیرا Deepseek ادعا می کند که مدل V3 آن با استفاده از GPU های NVIDIA H800 آموزش دیده است ، مصاحبه اخیر با بنیانگذار مقیاس AI الکساندر وانگ در CNBC مدیرعامل این شرکت اظهار داشت “Deepseek حدود پنجاه هزار H100 دارد.”
همان GPU هایی که در سال 2023 توسط دولت بایدن از صادرات به چین مسدود شده اند ، با ادامه وانگ ، “آنها نمی توانند در مورد آن صحبت کنند زیرا این مخالف کنترل های صادراتی است که [the] ایالات متحده در جای خود قرار داده است. “
چشم انداز
Deepseek یک ضربه اثبات شده است که به شرکت هایی مانند Openai چیزی می دهد که هنگام حفظ پایگاه کاربر قابل توجه خود در مواجهه با رقابت سخت ، در نظر بگیرند.
با این حال ، هنوز هم دیده می شود که آیا بوی ماشین جدید هنوز روی آخرین مدل های Deekseek می ماند ، و بوی اطلاعات نادرست پیرامون نحوه توسعه مدل های خود را نشان می دهد و اینکه آیا قیمت گذاری آن در دراز مدت پایدار است یا خیر.
با توجه به واکنش اخیر ایالات متحده به Tiktok ، دشوار است تصور کنید که شرکتی مانند Deepseek بدون بررسی جدی برای مدت زمان طولانی تر پیش می رود ، به خصوص که مدل های آن باعث ناراحتی سبد سیب می شود برنامه های رئیس جمهور ترامپ برای نگه داشتن ایالات متحده به عنوان “پایتخت جهانی هوش مصنوعی”.