15 жовтня Nvidia без зайвого розголосу представила свою нову модель штучного інтелекту Nemotron, яка вже перевершила такі потужні системи, як GPT-4 від OpenAI та Claude-3 від Anthropic. Модель під назвою Llama-3.1-Nemotron-70B-Instruct — це вдосконалена версія моделі з відкритим кодом Llama-3.1-70B-Instruct від Meta, що відзначається своєю продуктивністю.
За словами розробників Nvidia, Nemotron став лідером у тестах на платформі Chatbot Arena. Модель отримала високі оцінки в розділі «складних» завдань, що ставить її на вершину рейтингу серед конкурентів. Такий результат став можливим завдяки ретельно відібраним наборам даних, спеціальному налаштуванню та використанню передових обчислювальних можливостей апаратного забезпечення Nvidia.
Незважаючи на меншу кількість параметрів (70 мільярдів) порівняно з гігантськими моделями, як-от GPT-4 (1 трильйон параметрів), Nemotron демонструє гарну ефективність і корисність у відповідях, що робить його перспективним інструментом у галузі штучного інтелекту.