Apple собирается присоединиться к компании разработчиков моделей искусственного интеллекта с собственным семейством OpenELM. Это линейка больших языковых моделей (LLM) с открытым кодом, которые могут работать полностью на одном устройстве вместо подключения к облачным серверам.
OpenELM — это сокращение от Open-source Efficient Language Models. Они нацелены на приложения на устройстве. Apple утверждает, что семейство моделей «имеет целью расширить возможности и укрепить открытое исследовательское сообщество, способствуя будущим исследовательским усилиям». Модели были предварительно обучены на общедоступных наборах данных с 1,8 трлн токенов с Reddit, Wikipedia, arXiv.org и тому подобное.
Apple is joining the public AI game with 4 new models on the Hugging Face hub! https://t.co/oOefpK37J9
— clem 🤗 (@ClementDelangue) April 24, 2024
OpenELM состоит из небольших моделей, предназначенных для эффективного выполнения задач по созданию текста. Соответствующий код опубликован в сообществе кодов искусственного интеллекта Hugging Face. Всего существует 8 моделей OpenELM: 4 предварительно обученные и 4 настроенные по инструкции. Они охватывают различные размеры параметров — от 270 миллионов до 3 миллиардов параметров.
Модели OpenELM могут работать на обычных пользовательских устройствах, таких как ноутбуки и смартфоны. Apple отмечается, что тесты проводились на «рабочей станции с процессором Intel i9-13900KF, оснащенной 64 ГБ памяти DDR5-4000 DRAM и графическим процессором NVIDIA RTX 4090 с 24 ГБ видеопамяти под управлением Ubuntu 22.04», а также «Apple MacBook Pro со встроенной системой M2 Max и 64 ГБ оперативной памяти под управлением macOS 14.4.1».
Apple предлагает свои модели OpenELM в рамках так называемой «лицензии на обраец
Читать на itc.ua