Останніми роками розробники програмного забезпечення дедалі активніше використовують штучний інтелект для прискорення своїх завдань. Серйозним поштовхом до впровадження ШІ в програмування стала поява спеціалізованих моделей Cursor та GitHub Copilot, що дало змогу автоматизувати й повністю перекласти на ШІ деякі проміжні етапи. Усі провідні компанії в галузі ШІ невпинно покращують свої моделі. Продукти від OpenAI, Google DeepMind, Anthropic і xAI з часом стають тільки кращими в програмуванні. Це навіть призвело до появи явища під назвою «Vibe Coding», що змінило загальне сприйняття професії програміста. Але нове дослідження показує, що не все так однозначно і добре, як здається на перший погляд.

Дослідницька група METR провела експеримент за участю досвідчених кодерів зі стажем понад 10 років. У рамках контрольованого дослідження групі з 16 розробників доручали виконати 246 завдань у великих репозиторіях коду, з якими вони раніше працювали. У половині випадків рандомно було дозволено використовувати ШІ-інструменти. В інших завданнях застосування ШІ було заборонено. Згідно з прогнозами дослідників, кодування з ШІ мало скоротити час виконання завдань на 24%. Але в реальності виявилося, що час виконання завдань із ШІ збільшився на 19%. При цьому майже всі розробники мали досвід роботи зі ШІ, а 56% учасників мали досвід роботи зі спеціалізованим ШІ Cursor Pro. Однак результат все одно виявився протилежним очікуванням.

Автори дослідження не роблять однозначних висновків із цих результатів, але зазначають, що на їхню думку, ШІ наразі не здатний прискорити роботу всіх розробників програмного коду. Серед можливих причин: додатковий час на запити й очікування відповіді замість кодування, а також проблеми ШІ під час роботи зі складними завданнями. З іншого боку, є дослідження, які прямо вказують на виграш від використання ШІ в цій сфері. Але досвідчені фахівці, ймовірно, поки ще ефективніші.

Джерело:
TechCrunch