ШІ-компанії, як-от Anthropic, часто віддають роботу з даними на аутсорс стороннім підрядникам. Ті, своєю чергою, наймають фахівців, які навчають штучний інтелект різноманітних профільних предметів та виконують інші завдання для вдосконалення моделей. Видання Business Insider зазирнуло за лаштунки того, як ця «невидима армія» розробника Claude Code діє по всьому світу.
Читайте также: Українські розробники створили єдину платформу LLM API для оркестрації та порівняння сотень ШІ-моделей
Двоє підрядників, які працюють над проєктом Anthropic, розповіли Business Insider, що за кожне завдання зі створення промтів та перевірки коду їм платять по $280. За їхніми словами, на одне завдання йде близько години, хоча деякі матеріали вимагали додаткових узгоджень на етапі затвердження з Snorkel — компанії, що створює набори даних для покращення моделей ШІ та тести для чат-ботів.
Проєкт, який усередині Snorkel називають Marlin, зосереджений на тонкому налаштуванні відповідей Claude Code, аби він міг точно імітувати роботу професійного розробника.
Згідно з інструкціями Snorkel, фрілансерам (усі вони мають досвід у розробці програмного забезпечення) доручили проводити A/B-тестування коду, написаного двома різними моделями. У ході цього процесу вони порівнювали результати роботи обох моделей і обирали найкращий варіант. Один із підрядників зазначив, що метою проєкту було переконатися, що модель здатна видавати код із необхідним рівнем деталізації, зазначеним у промті. Фактично це навчання Claude Code писати спрощений код, який легше підтримувати.
Проєкт усе ще триває. Самі фрілансери не знають, які саме версії моделей вони оцінюють.
У міру того, як штучний інтелект стає розумнішим та спроможнішим, платформи для розмітки даних переходять від загальних завдань до дедалі більш спеціалізованих, які вимагають експертних знань у конкретній галузі чи навіть наукових ступенів. На сайті Snorkel зазначено, що компанія співпрацює з фахівцями, які мають вищу освіту та наукові ступені (такі як Ph.D, кандидати медичних чи юридичних наук) або еквівалентний досвід. За даними компанії, провідні експерти заробляють понад $3000 на тиждень.
Окрім Snorkel, платформи кшталт Scale AI та Mercor також готові платити інженерам-програмістам до $110 на годину.
Читайте также: До Чого Сниться Кров: подробный разбор значения сна
Учасники проєкту Marlin мали створити серію сценаріїв, за яких розробники програмного забезпечення могли б використовувати Claude Code.
Підрядникам доручили обрати GitHub-репозиторій зі списку, що налічував тисячі варіантів. Після цього вони повинні були створити Pull Request — етап, на якому розробник пропонує зміни до коду, наприклад, нові функції чи виправлення багів. Також підрядники мали написати промт — серію запитань, які пояснюють, чого саме очікують від моделі.
В одному із завдань підрядник попросив модель реорганізувати те, як система зберігає та обробляє «метадані виконання» — тобто додаткову інформацію про те, як запускаються процеси. Мета полягала в тому, щоб зробити код зрозумілішим і зручнішим для роботи розробників, взагалі не змінюючи логіку роботи самого продукту чи його функцій.
Модель видала два варіанти коду, після чого підрядник обирав той, який вважав ефективнішим. Згідно з інструкціями проєкту, учасники також мали надсилати уточнювальні промти, щоб «перевірити, як моделі працюють із контекстом розмови».
У межах іншого завдання виконавець сформував запит до моделі на створення патчу безпеки. Він стосувався того, як саме MLFlow (платформа для машинного навчання з відкритим кодом) завантажує пакети Python під час завантаження деяких моделей.
Текст інструкції до завдання вимагав від виконавця наступного: «Оцініть готовий до експлуатації код на основі його коректності, безпеки, надійності та зручності супроводу. Виправлення має ефективно блокувати спроби ін’єкції команд, зберігаючи при цьому доступ для всіх легітимних опцій інсталятора pip, внесених до білого списку».
Читайте также: 5% українських айтівців втратили роботу через ШІ: з яких причин ІТ-компанії звільняли найчастіше
