به روزرسانی

    آخرین اخبار خلاقانه را در مورد هنر و طراحی دریافت کنید.

    پست های اخیر

    یه تحقیق جدید نشون میده: تخم‌مرغ رو بدون نگرانی از کلسترول «بد» بخورید

    مرداد 7, 1404

    گوشی آیکو ۱۳ قراره ۴ ژوئیه با یه رنگ سبز جدید تو هند عرضه بشه

    تیر 14, 1404

    سامسونگ Bioepis برای تجاری سازی چندین بیوسیمیلار در ژاپن وارد یک همکاری استراتژیک با NIPRO می شود

    خرداد 19, 1404
    فیس بوک توییتر اینستاگرام
    تاختن نیوز
    فیس بوک توییتر اینستاگرام
    Button
    • صفحه اصلی
    • آشپزی
    • آموزشی
    • تکنولوژی
    • سلامتی
    تاختن نیوز
    صفحه اصلی»فیلم و سریال»یک آزمایشگاه چینی یک مدل هوش مصنوعی «استدلال» را برای رقیب O1 OpenAI منتشر کرده است
    فیلم و سریال

    یک آزمایشگاه چینی یک مدل هوش مصنوعی «استدلال» را برای رقیب O1 OpenAI منتشر کرده است

    ngal32lop2توسط ngal32lop2آبان 30, 1403بدون دیدگاه4 دقیقه خواندن
    فیس بوک توییتر پینترست لینکدین تامبلر پست الکترونیک
    اشتراک گذاری
    فیس بوک توییتر لینکدین پینترست پست الکترونیک

    یک آزمایشگاه چینی از آنچه به نظر می رسد یکی از اولین مدل های هوش مصنوعی «استدلال» برای رقابت با OpenAI’s o1 است، رونمایی کرده است.

    روز چهارشنبه، DeepSeek، یک شرکت تحقیقاتی هوش مصنوعی که توسط معامله گران کمی تامین می شود، پیش نمایشی از DeepSeek-R1 را منتشر کرد، که این شرکت ادعا می کند یک مدل استدلالی قابل رقابت با o1 است.

    برخلاف اکثر مدل‌ها، مدل‌های استدلالی با صرف زمان بیشتر برای بررسی یک سؤال یا پرس و جو، خود را به طور مؤثر بررسی می‌کنند. این به آن‌ها کمک می‌کند از برخی از مشکلاتی که معمولاً مدل‌ها را خراب می‌کنند اجتناب کنند.

    مشابه o1، DeepSeek-R1 از طریق وظایف، برنامه ریزی پیش رو و انجام مجموعه ای از اقدامات که به مدل کمک می کند تا به پاسخ برسد، دلایل می کند. این ممکن است کمی طول بکشد. مانند o1، بسته به پیچیدگی سوال، DeepSeek-R1 ممکن است ده ها ثانیه قبل از پاسخ دادن “فکر” کند.

    DeepSeek ادعا می کند که DeepSeek-R1 (یا به طور دقیق DeepSeek-R1-Lite-Preview) در دو معیار محبوب هوش مصنوعی، AIME و MATH، همتراز با مدل O1-preview OpenAI عمل می کند. AIME از مدل‌های هوش مصنوعی دیگر برای ارزیابی عملکرد یک مدل استفاده می‌کند، در حالی که MATH مجموعه‌ای از مسائل کلمه است. اما مدل کامل نیست برخی از مفسران X خاطرنشان کردند که DeepSeek-R1 با مشکلات tic-tac-toe و سایر مشکلات منطقی دست و پنجه نرم می کند (همانطور که o1 دارد).

    همچنین می‌توان DeepSeek را به راحتی جیلبریک کرد – یعنی به گونه‌ای از آن خواسته شود که محافظ‌ها را نادیده بگیرد. یکی از کاربران X این مدل را برای ارائه یک دستور العمل دقیق متم دریافت کرد.

    و به نظر می رسد که DeepSeek-R1 درخواست هایی را که از نظر سیاسی بسیار حساس تلقی می شوند مسدود می کند. در آزمایش ما، این مدل از پاسخ دادن به سؤالات در مورد رهبر چین شی جین پینگ، میدان تیان آن من و پیامدهای ژئوپلیتیکی حمله چین به تایوان خودداری کرد.

    این رفتار احتمالاً نتیجه فشار دولت چین بر پروژه های هوش مصنوعی در منطقه است. مدل‌ها در چین باید توسط تنظیم‌کننده اینترنت چین مورد ارزیابی قرار گیرند تا اطمینان حاصل شود که پاسخ‌های آن‌ها «مجسم ارزش‌های سوسیالیستی اصلی» است. طبق گزارش‌ها، دولت تا آنجا پیش رفته است که فهرست سیاهی از منابعی را پیشنهاد می‌کند که نمی‌توان از آنها برای آموزش مدل‌ها استفاده کرد – نتیجه این است که بسیاری از سیستم‌های هوش مصنوعی چینی از پاسخگویی به موضوعاتی که ممکن است خشم تنظیم‌کننده‌ها را برانگیزد، خودداری کنند.

    توجه فزاینده به مدل‌های استدلال زمانی صورت می‌گیرد که قابلیت «قوانین مقیاس‌بندی»، نظریه‌های قدیمی مبنی بر اینکه پرتاب داده‌ها و قدرت محاسباتی بیشتر به یک مدل به طور مداوم قابلیت‌های آن را افزایش می‌دهد، مورد بررسی قرار می‌گیرند. انبوهی از گزارش‌های مطبوعاتی حاکی از آن است که مدل‌های آزمایشگاه‌های بزرگ هوش مصنوعی از جمله OpenAI، Google و Anthropic به‌اندازه گذشته به طور چشمگیری بهبود نمی‌یابند.

    این به تقلا برای رویکردهای جدید هوش مصنوعی، معماری ها و تکنیک های توسعه منجر شده است. یکی از آنها محاسبه زمان تست است که زیربنای مدل هایی مانند o1 و DeepSeek-R1 است. محاسبه زمان تست که به عنوان محاسبه استنتاج نیز شناخته می‌شود، اساساً به مدل‌ها زمان پردازش اضافی برای تکمیل وظایف می‌دهد.

    ساتیا نادلا، مدیر عامل مایکروسافت، این هفته در جریان یک سخنرانی اصلی در کنفرانس Ignite مایکروسافت، با اشاره به محاسبه زمان تست، گفت: “ما شاهد ظهور یک قانون مقیاس بندی جدید هستیم.”

    DeepSeek که می گوید قصد دارد DeepSeek-R1 را منبع باز کند و یک API منتشر کند، یک عملیات عجیب است. توسط High-Flyer Capital Management، یک صندوق تامینی کمی چینی که از هوش مصنوعی برای اطلاع رسانی تصمیمات تجاری خود استفاده می کند، پشتیبانی می شود.

    یکی از اولین مدل‌های DeepSeek، یک مدل همه‌منظوره تحلیل متن و تصویر به نام DeepSeek-V2، رقبایی مانند ByteDance، Baidu و Alibaba را مجبور کرد تا قیمت‌های استفاده را برای برخی از مدل‌های خود کاهش دهند – و بقیه را کاملاً رایگان کنند.

    High-Flyer خوشه‌های سرور خود را برای آموزش مدل می‌سازد که طبق گزارش‌ها، جدیدترین آنها دارای 10000 پردازنده گرافیکی Nvidia A100 است و هزینه آن 1 میلیارد ین (حدود 138 میلیون دلار) است. High-Flyer که توسط لیانگ ونفنگ، فارغ التحصیل علوم کامپیوتر تأسیس شده است، قصد دارد از طریق سازمان DeepSeek خود به هوش مصنوعی «فوق هوشمند» دست یابد.

    TechCrunch یک خبرنامه متمرکز بر هوش مصنوعی دارد! برای دریافت آن در صندوق پستی خود هر چهارشنبه اینجا ثبت نام کنید.

    منبع: techcrunch

    Share. فیس بوک توییتر پینترست لینکدین تامبلر پست الکترونیک
    مقاله قبلیدادستان های فدرال یکی دیگر از آلارم فوربس 30 زیر 30 را به کلاهبرداری متهم کرده اند
    مقاله بعدی TV Time به “قدرت قابل توجه” اپل بر توسعه دهندگان پس از حذف از اپ استور اشاره می کند
    ngal32lop2

    پست های مرتبط*

    آیا می خواهید در دوران بارداری قرار گرفتن در معرض مواد شیمیایی را کاهش دهید؟ لاک ناخن، آرایش و رنگ مو را کنار بگذارید

    آذر 1, 1403

    کدام طرح بیمه درمانی ممکن است برای شما مناسب باشد؟

    آذر 1, 1403

    این هفته در هوش مصنوعی: کمیسیون کنگره در مورد AGI چین هشدار می دهد

    آبان 30, 1403

    پاسخ دهید لغو پاسخ

    عنوان بالا و اینتر را برای جستجو فشار دهید. برای لغو، Esc را فشار دهید.