Китайська компанія зі штучного інтелекту MiniMax випускає нові моделі, які, як вона стверджує, найкращими в галузі
Китайські фірми продовжують випускати моделі ШІ, які конкурують за можливостями систем, розроблених OpenAI та іншими американськими компаніями ШІ.
Цього тижня MiniMax , стартап за підтримки Alibaba та Tencent, який залучив близько 850 мільйонів доларів венчурного капіталу та оцінюється у понад 2,5 мільярда доларів, представив три нові моделі: MiniMax-Text-01, MiniMax-VL-01 і T2A. -01-HD. MiniMax-Text-01 — це модель лише для тексту, тоді як MiniMax-VL-01 може сприймати як зображення, так і текст. T2A-01-HD, тим часом, генерує аудіо — зокрема мову.
MiniMax стверджує, що MiniMax-Text-01, який має розмір 456 мільярдів параметрів, працює краще, ніж такі моделі, як нещодавно представлений Google Gemini 2.0 Flash , у таких тестах, як MMLU та SimpleQA, які вимірюють здатність моделі відповідати на математичні задачі та факти. засновані запитання. Параметри приблизно відповідають навичкам моделі розв’язувати проблеми, і моделі з більшою кількістю параметрів, як правило, працюють краще, ніж моделі з меншою кількістю параметрів.
Що стосується MiniMax-VL-01, MiniMax каже, що він конкурує з Anthropic Claude 3.5 Sonnet щодо оцінок, які вимагають мультимодального розуміння, як-от ChartQA, який доручає моделям відповідати на запити, пов’язані з графіками та діаграмами (наприклад, «Яке пікове значення помаранчева лінія на цьому графіку?»). Звичайно, MiniMax-VL-01 не є найкращим Gemini 2.0 Flash у багатьох із цих тестів. GPT-4o від OpenAI і відкрита модель під назвою InternVL2.5 також перемогли в кількох.
Слід зазначити, що MiniMax-Text-01 має надзвичайно велике контекстне вікно. Контекст моделі, або контекстне вікно, відноситься до вхідних даних (наприклад, тексту), які модель розглядає перед тим, як генерувати вихідні дані (додатковий текст). Завдяки контекстному вікну в 4 мільйони токенів MiniMax-Text-01 може аналізувати близько 3 мільйонів слів за один раз — або трохи більше п’яти копій «Війни і миру».
Щодо контексту (без каламбуру), контекстне вікно MiniMax-Text-01 приблизно в 31 раз перевищує розмір вікна GPT-4o та Llama 3.1.
Остання з моделей MiniMax, випущених цього тижня, T2A-01-HD, є аудіогенератором, оптимізованим для мовлення. T2A-01-HD може генерувати синтетичний голос із регульованим каденсом, тембром і тенором приблизно 17 різними мовами, включаючи англійську та китайську, і клонувати голос лише з 10 секунд аудіозапису.
MiniMax не публікував результати порівняння T2A-01-HD з іншими моделями аудіогенераторів. Але для вуха цього репортера вихідний сигнал T2A-01-HD звучить нарівні з аудіо моделями від Meta та таких стартапів, як PlayAI .
За винятком T2A-01-HD, який ексклюзивно доступний через API MiniMax і платформу Hailuo AI, нові моделі MiniMax можна завантажити з GitHub і платформи розробників AI Hugging Face.
Проте те, що моделі є «відкрито» доступними, не означає, що вони не обмежені в певних аспектах. MiniMax-Text-01 і MiniMax-VL-01 не є справді відкритими кодами в тому сенсі, що MiniMax не випустив компоненти (наприклад, навчальні дані), необхідні для їх повторного створення з нуля. Крім того, вони перебувають під обмежувальною ліцензією MiniMax, яка забороняє розробникам використовувати моделі для покращення конкуруючих моделей ШІ та вимагає, щоб платформи з понад 100 мільйонами активних користувачів щомісяця запитували спеціальну ліцензію від MiniMax.
MiniMax була заснована в 2021 році колишніми співробітниками SenseTime, однієї з найбільших китайських фірм ШІ. Проєкти компанії включають такі додатки, як Talkie, рольову платформу на основі штучного інтелекту на кшталт Character AI , а також моделі перетворення тексту у відео, які MiniMax випустила в Hailuo.
Деякі продукти MiniMax стали предметом невеликих суперечок.
Talkie, який було вилучено з Apple App Store у грудні з невстановлених «технічних» причин, містить аватари публічних діячів, включаючи Дональда Трампа, Тейлор Свіфт, Ілона Маска та Леброна Джеймса, жоден із яких, здається, не погодився на те, щоб бути представленим у додаток.
У грудні журнал Broadcast повідомив , що відеогенератори MiniMax можуть відтворювати логотипи британських телеканалів, припускаючи, що моделі MiniMax навчалися на контенті з цих каналів. Повідомляється, що на MiniMax подали до суду iQiyi, китайська служба потокового відео, яка стверджує, що MiniMax незаконно навчався на захищених авторським правом записах iQiyi.
Нові моделі MiniMax з’явилися через кілька днів після того, як адміністрація Байдена, що йде у відставку, запропонувала жорсткіші правила експорту та обмеження на технології ШІ для китайських підприємств. Компаніям у Китаї вже було заборонено купувати передові мікросхеми штучного інтелекту, але якщо нові правила набудуть чинності, як зазначено, компанії зіткнуться з більш суворими обмеженнями як на напівпровідникові технології, так і на моделі, необхідні для завантаження складних систем штучного інтелекту.
У середу адміністрація Байдена оголосила про додаткові заходи, спрямовані на те, щоб складні чіпи не потрапляли в Китай. Ливарні та пакувальні компанії, які хочуть експортувати певні мікросхеми, будуть піддаватися ширшим ліцензійним вимогам, якщо вони не будуть здійснювати більш ретельний контроль і належну обачність, щоб запобігти потраплянню їхньої продукції до китайських клієнтів.