بات مکالمه هوش مصنوعی، توسعه یافته توسط اوپن ایآی From Wikipedia, the free encyclopedia
چتجیپیتی (انگلیسی: ChatGPT) یک بات مکالمه است که توسط شرکت اوپن ایآی توسعه یافتهاست؛ گروه اوپن اِیآی برعکس نسخههای قبلی که با نام پردازش زبانی منتشر شده بود این بار ابزاری با نام بات مکالمه منتشر کرد.[1] چتجیپیتی بر روی خانواده مدل زبانی جیپیتی ۳٫۵ و جیپیتی ۴ اوپن ایآی ساخته شده و با تکنیکهای یادگیری نظارت شده و تقویتی بهخوبی تنظیم شدهاست.
توسعهدهنده(ها) | اوپنایآی |
---|---|
انتشار اولیه | ۳۰ نوامبر ۲۰۲۲ |
نوشتهشده با | پایتون |
موتور نرمافزاری | جیپیتی ۳٫۵ جیپیتی ۴ |
پلتفرم | رایانش ابری |
نوع | مدل زبانی بزرگ ترنسفورمر تولیدگر از پیش آموزشدیده بات مکالمه |
مجوز | مالکیتی |
چتجیپیتی به عنوان یک نمونه اولیه در ۳۰ نوامبر ۲۰۲۲ معرفی شد و به سرعت به دلیل پاسخهای دقیق و واضح خود در بسیاری از حوزهها، توجهها را به خود جلب کرد. چتجیپیتی به دلیل ظرفیت آن در ترکیب و تفسیر زبان طبیعی مشابه انسان، استفاده از آن محبوبیت پیدا کردهاست. دقت واقعی نابرابر آن به عنوان یک اشکال مهم شناسایی شد.[2] پس از عرضه چتجیپیتی، اوپن ایآی شرکت تولیدکننده این چت بات، ۲۹ میلیارد دلار ارزشگذاری شد.[3]
ChatGPT که بر پایه نسخههای پیشرفته GPT مانند GPT-3.5 و GPT-4 شکل گرفته، برای مکالمات بهینه شدهاست. در این روند، از ترکیب یادگیری تحت نظارت و یادگیری تقویتی مبتنی بر بازخورد انسانی (RLHF) استفاده شده تا کیفیت پاسخهایش بهبود یابد. در این متدها، افراد واقعی به بهسازی مدل کمک کردهاند.
در مرحلهٔ یادگیری تقویتی، مربیان انسانی پاسخهای قبلی مدل را ارزیابی و رتبهبندی کردند تا با استفاده از آنها مدلهای پاداشی ایجاد شود که بر پایه پروتکلهای بهینهسازی سیاست مجاورت (PPO) به بهبود مدل کمک میکنند.
ChatGPT از ابتدا از زیرساختهای ابری شرکت Microsoft Azure استفاده کرد که بر پایه تکنولوژی GPU شرکت انویدیا و با هزینهای چشمگیر، به صورت مخصوص برای OpenAI راهاندازی شده بود. در پی استقبال وسیع از ChatGPT، مایکروسافت در سال ۲۰۲۳ سرمایهگذاری قابل توجهی در توسعه زیرساختهای OpenAI انجام داد. محققان دانشگاه کالیفرنیا، ریورساید تخمین زدند که هر دستوری که به ChatGPT داده میشود به حدود ۵۰۰ میلیلیتر آب برای خنکسازی سرورهای مایکروسافت نیاز دارد. آژانس TrendForce برآورد کرد که در سال ۲۰۲۳ حدود ۳۰٬۰۰۰ کارت گرافیک انویدیا، هر کدام به ارزش تقریبی ۳۰٬۰۰۰ دلار، برای تأمین قدرت مورد نیاز ChatGPT استفاده شدهاند.
OpenAI با جمعآوری دادهها از کاربران ChatGPT به دنبال آموزش و بهینهسازی بیشتر خدماتش است. کاربران میتوانند به پاسخهای دریافتی از ChatGPT رأی مثبت یا منفی دهند و نظرات تکمیلی خود را در فیلد متنی وارد کنند.
محتوای آموزشی ChatGPT شامل صفحات راهنمای نرمافزار، اطلاعاتی دربارهٔ پدیدههای مختلف اینترنتی نظیر انجمنهای آنلاین و زبانهای برنامهنویسی است. ویکیپدیا نیز یکی دیگر از منابع اصلی داده آموزشی برای ChatGPT بودهاست.
ویژگی ها
در حالی که وظیفه اصلی یک چتبات تقلید از یک مکالمهگر انسانی است، ChatGPT تنوع بالایی دارد. در میان نمونههای بیشمار، این قابلیتها را دارد که برنامههای کامپیوتری بنویسد و اشکالزدایی کند[4] موسیقی، فیلمنامههای تلویزیونی، داستانها و مقالههای دانشجویی بسازد؛ به سؤالات آزمون پاسخ دهد (گاهی، بسته به آزمون، در سطحی بالاتر از میانگین شرکتکنندگان انسانی)؛[5] ایدههای کسبوکار تولید کند؛[6] شعر و ترانه بنویسد؛[7]متنها را ترجمه و خلاصه کند؛[8] یک سیستم لینوکس را شبیهسازی کند؛ اتاقهای چت کاملی را شبیهسازی کند؛ بازیهایی مانند دوز را انجام دهد؛ یا یک دستگاه ATM را شبیهسازی کند.[9][10]
در مقایسه با نسخه پیشین خود، InstructGPT, ChatGPT سعی در کاهش پاسخهای زیانآور و فریبنده دارد.[11] به عنوان مثال، در حالی که InstructGPT پایه و اساس پرسش «دربارهٔ زمانی که کریستف کلمب به ایالات متحده در سال ۲۰۱۵ آمد توضیح دهید» را به عنوان حقیقت میپذیرد، ChatGPT طبیعت خلاف واقع این سؤال را شناسایی کرده و پاسخ خود را به صورت بررسی یک فرضیه در نظر میگیرد که چه اتفاقی میافتاد اگر کلمب در سال ۲۰۱۵ به ایالات متحده میآمد، با استفاده از اطلاعات دربارهٔ سفرهای کریستف کلمب و واقعیات دنیای مدرن - از جمله دیدگاههای مدرن در مورد اقدامات کلمب.[12]
برخلاف اکثر چتباتها، ChatGPT تعداد محدودی از پرسشهای قبلی را در همان گفتگو به خاطر میسپارد. خبرنگاران حدس میزنند که این قابلیت میتواند امکان استفاده از ChatGPT به عنوان یک درمانگر شخصی را فراهم کند.[13] برای جلوگیری از ارائه و تولید پاسخهای توهینآمیز توسط ChatGPT، درخواستها از طریق API «نقطه پایانی تعدیل» OpenAI (یک AI مبتنی بر GPT جداگانه)،[14][15] فیلتر میشوند و هر پرسش احتمالاً نژادپرستانه یا جنسیتزدایی را رد میکنند.[16]
در مارس ۲۰۲۳، OpenAI پشتیبانی از پلاگینها برای ChatGPT را اضافه کرد.[17] این شامل هم پلاگینهای ساخته شده توسط OpenAI، مانند جستجوی وب و تفسیر کد، و هم پلاگینهای خارجی از توسعهدهندگانی مانند Expedia, OpenTable, Zapier, Shopify, Slack, و Wolfram میشود.[18][19]
در یک مقاله برای مجله نیویورکر، نویسنده علمی تخیلی تد چیانگ، ChatGPT و سایر LLMها را به یک تصویر JPEG با کیفیت پایین تشبیه کرد.
محدودیت ها
OpenAI اعتراف میکند که ChatGPT «گاهی پاسخهایی معقول به نظر رساندهاما نادرست یا بیمعنی مینویسد».[20] این رفتار در مدلهای بزرگ زبانی رایج است و به آن «هذیانگویی» گفته میشود.[21]مدل پاداش ChatGPT, که بر اساس نظارت انسانی طراحی شده، ممکن است بیش از حد بهینه شده و در نتیجه عملکرد را تحت تأثیر قرار دهد، که نمونهای از یک بیماری بهینهسازی شناخته شده به عنوان قانون گودهارت است.
تا سال ۲۰۲۳، ChatGPT-۳٫۵ (رایگان) اطلاعاتی دربارهٔ رویدادهایی که تا ژانویه ۲۰۲۲ رخ دادهاند را دارا است و ChatGPT-۴ (پولی) اطلاعات تا آوریل ۲۰۲۳ را در اختیار دارد.[22]
در فرایند آموزش ChatGPT، داوران انسانی به پاسخهایی طولانیتر، بدون توجه به فهم واقعی یا محتوای واقعگرایانه تمایل داشتند. همچنین دادههای آموزشی دچار تعصب الگوریتمی است که ممکن است هنگام واکنش ChatGPT به سوالاتی که شامل توصیفهای اشخاص است، آشکار شود. در یک نمونه، ChatGPT رپی تولید کرد که در آن زنان و دانشمندان رنگینپوست به عنوان افرادی سطح پایینتر از دانشمندان مرد سفیدپوست معرفی شدند.[23]
شکستن قفلهای نرمافزاری
ChatGPT تلاش میکند تا با دستورالعملهایی که ممکن است با خطمشی محتوای آن تضاد داشته باشد مقابله کند. با وجود این، برخی کاربران موفق به شکستن این قفلها در ChatGPT با استفاده از تکنیکهای مهندسی پرسش مختلف در اوایل دسامبر ۲۰۲۲ شدند و توانستند آن را فریب دهند تا دستورالعملهایی برای ساختن کوکتل مولوتوف یا یک بمب اتمی بدهد، یا استدلالهایی را به سبک نئونازیها تولید کند.[24]
کمی پس از راهاندازی ChatGPT، یک خبرنگار برای روزنامه تورنتو استار در تلاشهایش برای وادار کردن آن به بیان عبارات تحریکآمیز نوشت: ChatGPT با موفقیت فریب خورد تا تجاوز روسیه به اوکراین در سال ۲۰۲۲ را توجیه کند، اما حتی زمانی که از آن خواسته شد تا در سناریویی خیالی همراه باشد، ChatGPT در تولید دلایلی برای چرایی خیانت نخستوزیر کانادایی، جاستین ترودو، تمایلی نشان نداد.[25][26]
OpenAI تلاش میکند تا با شکستن قفلها مقابله کند.
چتجیپیتی در دسامبر ۲۰۲۲ با بررسیهای کلی مثبت مواجه شد. نیویورک تایمز آن را «بهترین چت ربات هوش مصنوعی که تا به حال برای عموم منتشر شده» نامیدهاست.[27] سامانتا لاک از گاردین خاطرنشان کرد که میتواند متنی «با جزئیات کامل» و «مانند انسان» تولید کند.[28] الکس کانترویتز از اسلیت، پاسخ چتجیپیتی به سوالات مربوط به آلمان نازی را ستود، از جمله این ادعا که آدولف هیتلر بزرگراههایی در آلمان ساختهاست، که با اطلاعاتی در مورد استفاده آلمان نازی از کار اجباری مواجه شد.[29]
در یک مقاله نظری در دسامبر ۲۰۲۲، اقتصاد دان پل کروگمن نوشت که چتجیپیتی بر تقاضای کارگران دانش تأثیر میگذارد.[30] در ایالات متحده، مدارس دولتی در نیویورک و سیاتل تصمیم گرفتهاند که دسترسی به چتجیپیتی را از طریق شبکه وای-فای خود مسدود کنند. مؤسسه مطالعات سیاسی پاریس به تازگی استفاده از آن را برای دانشجویان خود ممنوع کردهاست.[31][32]
همچنین گفته شدهاست به احتمال زیاد این بزرگترین و قدرتمندترین موسسات و نهادها خواهند بود که از هرگونه تکنیک لابی گری مبتنی بر هوش مصنوعی با بیشترین میزان و احتمال موفقیت به نفع خود استفاده خواهند کرد.[33]
یک قاضی کلمبیایی برای اولین بار از ربات هوش مصنوعی Chat GPT برای کمک به صدور حکم در یک پرونده استفاده کرد. این قاضی به نام خوان مانوئل پادیلا در موردی که شامل معاف کردن یک کودک مبتلا به اوتیسم از پرداخت هزینه برای ویزیتهای پزشکی، درمان و حمل و نقل با توجه به درآمد محدود والدینش بود، از این ربات مشاوره گرفت.
چتجیپیتی در ۳۰ نوامبر ۲۰۲۲ توسط اوپن ایآی در سانفرانسیسکو، خالق DALL·E 2 و Whisper راه اندازی شد. این سرویس در حال حاضر به صورت رایگان در دسترس عموم قرار دارد اما برنامههایی برای کسب درآمد از این سرویس را هم در نظر گرفتهاند[34] البته با اینکه دسترسی به آن رایگان است در ایران این سرویس قابل دسترسی نیست و نیاز به نرمافزارهای عبور از تحریم و شماره تلفن مجازی کشورهای دیگر دارد. ۴ دسامبر، اوپن ایآی تخمین زد که چتجیپیتی در حال حاضر بیش از یک میلیون کاربر داشتهاست. در ۱۵ دسامبر ۲۰۲۲ نوشت «گاهی این سرویس از دسترس خارج میشود».[35]
چتبات ChatGPT درواقع مبتنی بر نسخهٔ بهروز شده GPT-3، نوعی مدل زبانی بزرگ (LLM) است که بر شبکهٔ عظیمی از نورونهای مصنوعی متکی است که بهنوعی، رفتار نورونهای مغز انسان را تقلید میکنند.
مدل زبانی GPT برپایه معماری شبکه عصبی ترانسفورمر گوگل ایجاد شده و گوگل از این شبکه عصبی در ساخت مدل زبانی پیشرفتهٔ LaMDA استفاده کردهاست؛ همان مدلی که چند ماه پیش، یکی از کارمندان گوگل مدعی شد «خودآگاه» است و موجی از شوخیهای اینترنتی و نگرانی از ظهور رباتهای قاتلی بهراه انداخت.
به تعریف خود گوگل، «ترانسفورمر مدلی تولید میکند که میتواند برای خواندن کلمات بسیاری (مثلا یک جمله یا پاراگراف) آموزش داده شود و به نحوهٔ ارتباط آن کلمات با یکدیگر توجه و سپس پیشبینی کند که بهنظرش، کلمات بعدی چه خواهند بود.»
بهعبارتدیگر، ترانسفورمر بهجای مدلسازی کند. از آن جا که این شبکه، تجزیه و تحلیل را بهطور کلی و یکجا انجام میدهد، به مراحل کمتری نیاز دارد و در حوزهٔ یادگیری ماشین هرچه تعداد مراحل پردازش داده کمتر باشد، نتیجهٔ بهتری حاصل میشود.
بهطورکلی، به هوش مصنوعی مدلهای زبانی بزرگ، صدها میلیارد کلمه در قالب کتاب، مکالمات، صفحات وب و حتی پستهای توییتر و دیگر شبکههای اجتماعی «خورانده» میشود و هوش مصنوعی به کمک این منابع عظیم از داده، مدلی بر اساس احتمال آماری میسازد؛ یعنی کلمات و جملاتی که به احتمال زیاد پس از متن قبلی میآیند. مدلهای زبانی از این جهت کمی شبیه قابلیت پیشبینی کلمات در گوشیهای هوشمند هستند، با این تفاوت که در مقیاس بسیار بزرگتری عمل میکنند و به جای پیشبینی تنها یک کلمه، میتوانند پاسخهای کامل متشکل از چندین پاراگراف تولید کنند.
روش آموزش دادن مدل زبانی بهکار رفته در ChatGPT به این صورت بود که ابتدا تعداد زیادی سؤال و جواب که توسط افراد متخصص این حوزه، دستچین شده بودند، به آن داده شد. سپس، این سؤال و جوابها در مجموعه دادهٔ مدل گنجانده شد. در مرحلهٔ بعد، از سیستم خواسته شد تا برای مجموعهٔ بسیار بزرگی از سؤالات متنوع، چندین پاسخ مختلف ارائه دهد تا کارشناسان انسانی هر یک از آنها را از بهترین تا بدترین پاسخ، رتبهبندی کنند.[36][37]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.