Генеративні нейромережі впевнено увійшли до повсякденного життя. Масове поширення набули моделі штучного інтелекту для створення зображень за описом. Наступний крок — створення відео, і розробки в цій галузі вже існують. Тепер компанія OpenAI, відома за ChatGPT, представила нову генеративну модель Shap-E, яка створює 3D-об'єкти за описом. Отримане зображення можна імпортувати в Microsoft Paint 3D для подальшої обробки або у формат STL для друку на 3D-принтері.
Модель Shap-E доступна безплатно на GitHub та працює локально на вашому ПК. Після завантаження всіх файлів Shap-E не вимагає з'єднання з Інтернетом та якихось онлайнових сервісів. Однак встановити цю модель не так просто, оскільки OpenAI не дає інструкції для звичайних користувачів. Журналіст Tom's Hardware зміг запустити Shap-E у середовищі Linux та під WSL2 для Windows. Модель Shap-E вимагає Python Pip, установки Miniconda чи Anaconda. Для перегляду невеликих фрагментів коду автор використав інтерактивний блокнот Jupyter Notebook. Повний опис установки доступний на Tom's Hardware.
Якщо говорити про результати, то вони поки що видаються в низькій роздільній здатності. Також найкраще у Shap-E виходять анімовані GIF, у тривимірному форматі PLY об'єкти виглядають погано та мають криву геометрію. Також Shap-E може перетворювати 2D-зображення на 3D-об'єкт. Очевидно, що це початковий етап розвитку проєкту, тому OpenAI й розповсюджує цю модель безплатно. Коли Shap-E сягне досконалішого рівня, на його основі можуть запустити платний сервіс.
Також журналіст Tom's Hardware поділився даними про продуктивність Shap-E. Генерація простеньких моделей на системі з Ryzen 9 5900X та GeForce RTX 3080 займає до 5 хвилин, ноутбук Asus ROG Strix Scar 18 з Intel Core i9-13980HX та RTX 4090 справлявся з цим за 2-3 хвилини. Автор спробував запустити генерацію на старому ноутбуці з процесором Intel Core 8-го покоління та вбудованою графікою, але за годину було завершено лише 3% моделі.