Від контрольованого навантаження до критичного дефіциту
Донедавна дата центри створювали хоч і суттєве, але цілком контрольоване навантаження на енергосистему. Вебгостинг, стрімінг та традиційні хмарні обчислення розподілялися відносно рівномірно.
Ситуація змінилася радикально з появою великих мовних моделей (LLM) та генеративного ШІ, які вимагають колосальних обчислювальних ресурсів. Тепер попит на електроенергію з боку дата центрів зростає приблизно в чотири рази швидше, ніж загальне зростання попиту на електроенергію у світі.
Аналіз McKinsey показує, що глобальний попит на потужності дата центрів може більш ніж потроїтися до 2030 року. Очікується, що лише у Сполучених Штатах додатковий попит на електроенергію для дата центрів складе близько 460 ТВт-год до 2030 року, що утричі перевищує поточний рівень споживання.
За оцінками, США потребуватимуть понад $2 трлн на модернізацію своєї енергетичної інфраструктури, щоб впоратися з цим навантаженням. Проблема в тому, що будівництво великих ліній електропередач займає в 3–7 разів більше часу, ніж прокладання інтернет-ліній, а планування та отримання дозволів може тривати до 10 років.
Наслідки цього зростання є драматичними. 10 липня 2024 року невеликий збій на високовольтній лінії в американській «Алеї дата-центрів» (Data Center Alley) змусив понад 60 ЦОДів загальною потужністю 1,5 ГВт негайно перейти на автономне живлення від дизельних генераторів. Це спричинило таке різке зниження навантаження на мережу, що ледь не призвело до розбалансування та локдауну на великій території.
Яскравим прикладом критичного навантаження стала історія компанії Ілона Маска xAI, яка оголосила про плани розширення свого суперкомп’ютера Colossus у Мемфісі, що мав вмістити до 1 млн графічних процесорів (GPU). Однак місцевий постачальник комунальних послуг, MLGW, публічно попередив, що інфраструктура Мемфіса може не мати необхідної потужності для підтримки таких грандіозних планів.
Генеральний директор MLGW Даг МакГоуен назвав це «проблемою фізики, а не політичною проблемою». Компанія xAI була змушена самостійно фінансувати будівництво нової підстанції лише для задоволення початкового запиту на 150 МВт. Крім того, Маск опинився в центрі скандалу через встановлення незаконних і несанкціонованих газових турбін для свого дата-центру Colossus, що мав загальну потужність майже пів гігавата.
Споживання розміром з країни
За прогнозами Goldman Sachs, енергоспоживання дата центрів, призначених спеціально для завдань AI/ML, зросте з 7,7 ГВт до 22,7 ГВт до 2027 року, що втричі більше за поточні показники.
У 2022 році світове споживання вже перевищувало загальне споживання Франції та Великобританії. До 2027 року енергія, необхідна для функціонування ШІ, може зрівнятися зі споживанням цілих країн, таких як Швеція або Аргентина.
Open AI планує будівництво дата-центру наступного покоління Stargate з потенційним споживанням у 7–10 ГВт, що еквівалентно потужності 7–10 атомних реакторів. Сем Альтман інколи називає цифри до 50 ГВт. Для порівняння — це практично дорівнює всій довоєнній генеруючій потужності України (50–55 ГВт).
До 2035 року енергетика стане вирішальним фактором у розвитку штучного інтелекту. Обчислювальні можливості будуть обмежуватися вже не продуктивністю обладнання, а доступними мегаватами живлення та охолоджувальними ресурсами.
Ціна одного запиту
Загалом енергетичні витрати ШІ розподіляються між двома основними процесами: тренуванням (створенням більших і розумніших моделей) та інференсом (обробкою мільярдів щоденних запитів користувачів). Хоча на тренування витрачаються величезні обсяги електроенергії, щоденний інференс (видача відповідей) становить нескінченний марафон споживання. Візьмемо для прикладу дві найпопулярніші ШІ моделі.
Google Gemini: Один середній запит до моделі Gemini споживає 0,24 Вт-год електроенергії. Це дорівнює споживанню 100-ватного телевізора протягом 9 секунд.
ChatGPT: Середня відповідь GPT-5 (на 1000 токенів) може становити близько 18 Вт-год, а в пікових випадках — до 40 Вт-год. Якщо взяти 2,5 млрд запитів на день, які обслуговує ChatGPT, це відповідає добовому споживанню енергії 1,5 млн середніх домогосподарств США.
Погодьтеся не мала ціна, щоб запитати LLMʼку, щоб та написала привітання з днем народження і згенерувала відео, як кіт поспішає на роботу в образі супер героя.
Як найбільші «ненажери» вгамовують апетит
Гіпермасштабні провайдери: AWS, Microsoft, Google, Meta та інші формують щонайменше три чверті загального енергоспоживання галузі. Високий попит на генерацію призвів до небаченого буму в сегменті виробників критично важливого енергетичного обладнання. Акції таких компаній, як Caterpillar, Cummins та Rolls-Royce, зростали навіть швидше, ніж акції технологічних гігантів, як-от Amazon і Meta.
Через безпрецедентний попит FAANG змушені ставати не лише технологічними гігантами, а й енергетичними компаніями, інвестуючи в генерацію.
Це твердження Наделли прозвучали за кілька місяців після того, Microsoft уклала 20-річну угоду з Constellation Energy на постачання ядерної енергії. Компанія інвестує у відновлення роботи одного з реакторів атомної електростанції Три-Майл-Айленд у Пенсильванії, яка була сумнозвісна ядерною аварією 1979 року. Ця енергія буде спрямована на живлення центрів обробки даних у цьому та сусідніх штатах.
Google готується перевести частину своїх дата-центрів у Теннессі та Алабамі на живлення від малих модульних реакторів (ММР) нового покоління. Проєкт, який має стартувати з 2030 року, передбачає використання установок стартапу Kairos Power, що працюють на технології розплавлених солей, що вважається більш безпечною.
Інші техногіганти, як-от Meta та Nvidia також інвестували в АЕС та у ядерний стартап Білла Гейтса відповідно.
Замість висновку
У найближчі роки головним обмеженням для ШІ стане не тільки потужність GPU і дефіцит памʼяті, а можливості енергосистем. Галузь уперше впирається не в алгоритми чи чипи, а в мегавати та інфраструктуру, яка здатна їх доставити.
Майбутнє ШІ тепер залежить не лише від інженерів-програмістів, а й від тих, хто будує реактори, підстанції та лінії електропередач.
https://dev.ua/news/ai-energy-demand
