За даними Engadget, окремі видавці вирішили заблокувати або частково обмежити роботу архівних ботів Internet Archive. Причина — зростаючий інтерес ШІ-компаній до великих структурованих масивів текстів, які можна швидко обробляти автоматично. Архівні копії сайтів із відкритим API розглядають як потенційний обхідний шлях доступу до журналістських матеріалів без дозволу правовласників.
Читайте также: До $425 500: скільки Nvidia платить ІТ-спеціалістам
Медіа наголошують, що проблема не в архівуванні як такому, а в подальшому використанні матеріалів. Wayback Machine може надавати доступ не лише до відкритих статей, а й до матеріалів за підпискою або публікацій, які редакції вже зняли з публічного доступу. У контексті розвитку ШІ це створює ризик неконтрольованого використання контенту для тренування моделей.
Обмеження доступу до Internet Archive вписуються в ширший конфлікт між медіаіндустрією та розробниками ШІ. Видавці дедалі активніше намагаються контролювати, де і як використовуються їхні тексти, паралельно вимагаючи ліцензування або компенсації за використання матеріалів у комерційних ШІ-продуктах.
Internet Archive багато років виконував роль цифрової бібліотеки та інструмента збереження історії інтернету. Проте масове впровадження генеративного ШІ змінює правила гри: навіть сервіси відкритого доступу тепер розглядають як елемент ланцюга постачання даних для алгоритмів, що змушує медіа переглядати підходи до захисту свого контенту.
Читайте также: Міністр економіки розповів, наскільки збільшилася кількість заброньованих спеціалістів за рік
Раніше dev.ua поспілкувалися з SEO-експертом Promodo Владиславом Трішкіним, який пояснив, що змінилося в Google після запуску AI Overviews, як це впливає на трафік і органічну видачу, а також які кроки варто зробити вже зараз.
