Розробники навчили ШІ думати, перш ніж говорити
Новий метод вчить системи штучного інтелекту думати, перш ніж реагувати на підказки — так само як люди обмірковують, що сказати далі. Зазвичай такі чат-боти, як ChatGPT, не «думають» про те, що пишуть, і не передбачають різні можливості для наступних кроків у розмові.
Розробку назвали «Quiet-STaR», вона наказує системі штучного інтелекту паралельно генерувати безліч внутрішніх обґрунтувань, перш ніж реагувати на діалогову підказку. Коли ШІ відповідає на запити, він генерує суміш цих прогнозів з обґрунтуванням і без нього, надаючи кращу відповідь. Це може перевірити людина залежно від характеру питання. У результаті ШІ навчається, відкидаючи обґрунтування, які виявилися невірними. «Такий метод навчання дає агентам ШІ можливість передбачати майбутні розмови і вчитися на поточних», — наголосили розробники.
Дослідники застосували алгоритм Quiet-STaR до Mistral 7B, великої мовної моделі з відкритим кодом і опублікували результати в базі даних препринтів arXiv. Документ ще не пройшов рецензування.
Версія Mistral 7B, навчена Quiet-STaR, набрала 47,2% тесту на мислення порівняно з 36,3% до будь-якого навчання. Однак він все одно провалив шкільний тест із математики, набравши 10,9%. Втім, це майже вдвічі перевищує стартовий показник у 5,9% у звичайній версії.
Источник: noworries.news