Що таке LLM і чому всі про них говорять

LLM — це, по суті, те, з чим ви спілкуєтесь, коли відкриваєте будь-який сучасний AI-чат. Це велика мовна модель, яка «прочитала» гігантську кількість текстів і навчилася помічати закономірності в мові.

Читайте также: Скасування пільг на міжнародні посилки. Чи втратять українці інтерес до AliExpress і Temu, і чи готові поштові оператори до наслідків. Розбираємо з учасниками ринку

Коли ви ставите їй запитання, вона не шукає правильну відповідь у базі знань. Вона генерує найбільш імовірне продовження вашого запиту. Саме тому іноді здається, що вона розумна, а іноді — що говорить повну нісенітницю.

Сам підхід називається deep learning. Завдяки йому модель не просто виконує інструкції, а вчиться на прикладах і помилках.

Всередині цієї системи є weights — числові параметри, які визначають, що важливіше, а що ні. По суті, це і є «пам’ять» моделі.

AGI, мультимодальність і куди це все рухається

Окремо часто згадують AGI — це такий умовний «святий Грааль» індустрії. Ідея в тому, щоб створити ШІ, який зможе виконувати більшість задач не гірше за людину. Проблема в тому, що навіть у самій індустрії немає єдиного визначення, що це означає.

Натомість більш реальна історія сьогодні — це multimodal AI. Тобто моделі, які працюють не тільки з текстом, а й із зображеннями, відео і звуком. Один інтерфейс — багато типів даних.

Чому AI «вигадує», і це нормально (майже)

Ця нісенітниця має окрему назву — hallucinations. На практиці це означає, що модель вигадує: може послатися на вигадане дослідження, придумати факт або дати дуже впевнену, але неправильну відповідь.

І головне — вона не знає, що помиляється. Для неї це просто ще один «імовірний» варіант. Саме тому всі сервіси просять перевіряти відповіді, навіть якщо вони звучать переконливо.

Щоб це виправити, використовують RAG — підхід, коли модель підтягує реальні дані з баз або інтернету перед відповіддю.

Паралельно існує цілий напрям alignment — спроба зробити поведінку моделей безпечнішою і більш передбачуваною.

Як модель вчиться: training, fine-tuning і distillation

До того як почати відповідати, модель проходить training — навчання на величезних масивах даних.

Але майже ніхто не тренує моделі з нуля. Замість цього використовують transfer learning — беруть готову модель і адаптують її. Це доопрацювання називається fine-tuning. А якщо потрібно зробити модель дешевшою — застосовують distillation: «переливають» знання великої моделі в меншу.

За що ви насправді платите: що таке токени

Коли йдеться про платний AI, дуже швидко з’являється слово «токени». Саме через них списуються гроші.

Якщо спростити, токени — це шматочки тексту, які модель обробляє. Що довший ваш запит і що довша відповідь, то більше таких шматків потрібно. А отже — то дорожче це коштує.

Є ще context window — обсяг тексту, який модель може «пам’ятати» в межах діалогу. Якщо ви виходите за цей ліміт, вона починає забувати попередні частини розмови.

Що відбувається, коли модель «думає»

Коли ви пишете запит і чекаєте на відповідь, запускається процес, який називається inference. Це момент, коли модель реально працює: аналізує запит і генерує відповідь.

Саме тут відчувається швидкість сервісу. Якщо все відбувається повільно — це питання інфраструктури й навантаження, а не тільки «розумності» моделі.

У цей момент працюють embeddings — спеціальні векторні представлення, які дозволяють моделі розуміти сенс слів, а не просто їх форму.

А щоб відповіді були точнішими, іноді використовують chain of thought — модель «думає кроками», як людина, яка розв’язує задачу на папері.

До того, як почати відповідати на запити, модель проходить етап training — навчання на величезних масивах даних. Це складний і дорогий процес, який можуть дозволити собі лише великі компанії.

Читайте также: До $150 за годину: LinkedIn тестує ринок «тренерів AI»

Тому більшість продуктів працює інакше: вони беруть уже готову модель і додатково навчають її під конкретні завдання. Це називається fine-tuning. Саме так з’являються AI-рішення для медицини, юриспруденції чи сапорту.

Навіщо моделі «думають кроками»

Щоб зробити відповіді точнішими, іноді використовують підхід, що називається chain of thought. У цьому випадку модель не відповідає одразу, а ніби розкладає завдання на кілька кроків і проходить їх послідовно.

Це займає більше часу, зате результат зазвичай кращий — особливо в завданнях, де є логіка або обчислення.

Чому важливо вміти правильно формулювати запити

Звідси з’явився окремий навик — prompt engineering. Це вміння чітко пояснити моделі, що ви від неї хочете.

Є навіть підходи типу zero-shot і few-shot. У першому випадку ви просто ставите задачу, у другому — додаєте приклади, щоб модель краще зрозуміла, що від неї очікується.

А ще існує system prompt — це «невидимі інструкції», які задають поведінку моделі ще до того, як ви почали діалог.

Генерація зображень, кеш і трохи магії

Якщо говорити про картинки, тут працює diffusion — технологія, яка збирає зображення буквально з шуму.

Щоб все працювало швидше, використовується memory cache — модель зберігає частину обчислень і не рахує їх заново щоразу.

Окремий клас моделей — GAN — працює як змагання двох нейромереж, що дозволяє створювати дуже реалістичний контент.

Що таке AI-агенти та чому про них так багато говорять

AI-агенти — це спроба зробити наступний крок. Якщо звичайний AI відповідає на запитання, то агент має виконувати дії.

Наприклад, щось знайти, забронювати, зібрати або навіть написати код і запустити його. Звучить як логічна еволюція, але поки що ця технологія ще формується, і навколо неї значно більше хайпу, ніж стабільних рішень.

Що стоїть за всім цим: compute

Уся ця магія працює не сама по собі. За нею стоїть те, що в індустрії називають compute — обчислювальні потужності. Ідеться про сервери, відеокарти, дата-центри — усю інфраструктуру, що дає змогу моделям навчатися та працювати. І сьогодні це один із ключових ресурсів у світі AI: більше потужностей — більше можливостей.

І тут починається дефіцит. Настільки, що з’явився навіть термін RAMageddon — коли пам’яті не вистачає через попит з боку AI-компаній.

Ще один тренд — open weights. Компанії відкривають доступ до моделей, але не до всіх деталей їх створення.

Чому всі цими словами так легко розкидаються

У результаті з’являється відчуття, що AI — це щось дуже складне й майже недоступне для розуміння. Хоча насправді більшість цих термінів описують доволі прості речі.

Проблема не в самих словах, а в тому, як їх використовують — часто без пояснень і з зайвим пафосом.

Але є й хороша новина: щоб орієнтуватися в цій темі, не потрібно бути дослідником AI. Достатньо розуміти базові принципи й не боятися ставити прості запитання.

Бо дуже швидко стає помітно, хто дійсно розуміє, про що говорить, а хто просто повторює модні слова.

Читайте также: Дуров обіцяє, що в Telegram з’являться нові інструменти проти ботів: можна буде банити реакції і чистити накрутки в опитуваннях

Від admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *