Microsoft шукає дешевші в експлуатації та прості альтернативи мовним моделям OpenAI
Хоча Microsoft належить 49% OpenAI, що займається розробкою популярних і продуктивних мовних моделей типу GPT-4, інтереси компаній не завжди збігаються. Як повідомляє Silicon Angle, Bing Chat Enterprise першою та ChatGPT Enterprise другою, по суті, конкурують за одну і ту ж цільову аудиторію. Крім того, Microsoft, що прагне впровадити ІІ майже у всі свої програмні продукти, готує нові, простіші і менш ресурсомісткі моделі, ніж GPT-4.
За даними джерел в OpenAI, Microsoft стурбовані високою вартістю експлуатації передових ІІ-моделей. Microsoft намагається вбудувати ІІ у багато продуктів, включаючи Copilot для Windows на базі GPT-4. З урахуванням того, що користувачів Windows у світі більше 1 млрд, у компанії побоюються, що поширення ІІ-інструментів призведе до неконтрольованого зростання витрат. За деякими даними, компанія вже доручила частини зі своїх 1,5 тис. співробітників ІІ-департаменту зайнятися більш економічними альтернативами — хай навіть вони будуть не такими «кмітливими».
Хоча реалізація відповідних проектів все ще знаходиться на ранніх стадіях, з’явилася інформація, що компанія розпочала внутрішні тести моделей власної розробки. Зокрема, «творчий» та «точний» режими Bing Chat спираються на GPT-4, тоді як «збалансований» використовує нові моделі Prometheus та Turing. Остання може відповідати тільки на прості питання, а більш каверзні вона все одно змушена передавати на обробку твору OpenAI.
Для програмістів Microsoft має модель Phi-1 з 1,3 млрд параметрів, яка може ефективно генерувати код, але в іншому відстає від GPT-4. Ще однією альтернативою стала розроблена Microsoft модель Orca на основі Meta Llama-2, що належить Meta. За деякими даними, Orca близька за можливостями до моделей OpenAI, але компактніша і вимагає значно менше ресурсів.
Вважається, що підрозділ Microsoft використовує близько 2 тис. прискорювачів NVIDIA, більшість з яких сьогодні і застосовується для тренування ефективніших моделей, що мають вузьку спеціалізацію на відміну від багатопрофільної GPT-4. Якщо раніше змагання на ринку йшло за створення ІІ з найбільшими можливостями, то тепер одним із найважливіших факторів стає вартість розробки та обслуговування таких інструментів.