Головна Новини

Вчені навчають новий штучний інтелект виключно у даркнеті

Група південнокорейських дослідників створила модель штучного інтелекту, яка отримала назву DarkBERT, для індексації вебсайтів та форумів даркнету.

DarkBERT підіймається

Великі мовні моделі (LLM) OpenAI навчаються на великій кількості наборів даних, витягуючи інформацію з найбільш запорошених і заплутаних куточків Інтернету.

Але що, якби натомість така модель сканувала темну мережу – мізерний виворот Інтернету, де ви можете розмістити сайт, не розкриваючи свою особистість і навіть не надаючи правоохоронним органам доступу до неї? Група південнокорейських дослідників зробила саме це, створивши модель ШІ, що отримала назву DarkBERT, для індексації найненадійніших доменів в Інтернеті.

Це захопливий погляд на найтемніші куточки Всесвітньої павутини, які стали синонімом незаконної та зловмисної діяльності, від обміну витоком даних до продажу сильнодійних наркотиків.

Звучить як кошмар, але дослідники кажуть, що DarkBERT має шляхетні наміри: він намагається пролити світло на нові способи боротьби з кіберзлочинністю — областю, в якій все частіше використовується обробка природної мови.

Борець з кіберзлочинністю

Можливо, не дивно, що розібратися в частинах Інтернету, які не індексуються пошуковими системами, такими як Google, і часто доступні лише за допомогою спеціального програмного забезпечення, було непростим завданням.

Як докладно описано в статті під назвою "DarkBERT: мовна модель для темної сторони Інтернету", яка ще не пройшла рецензування, команда приєднала свою модель до мережі Tor, системі для доступу до частин темна павутина. Потім він розпочав роботу, створивши базу даних зі знайдених необроблених даних.

Команда каже, що їх новий LLM набагато краще розбирався в даркнеті, ніж інші моделі, навчені виконувати аналогічні завдання, у тому числі RoBERTa, яку дослідники Facebook розробили ще у 2019 році, щоб "пророкувати навмисно приховані фрагменти тексту всередині інших". неанотовані мовні приклади", згідно з офіційним описом.

"Результати нашої оцінки показують, що модель класифікації на основі DarkBERT перевершує відомі попередньо навчені мовні моделі", — пишуть дослідники у своїй статті.

Команда передбачає, що DarkBERT можна використовувати для різних завдань, пов'язаних з кібербезпекою, таких як виявлення сайтів, що продають програми-здирники або допускають витік конфіденційних даних. Його також можна використовувати для сканування незліченних темних вебфорумів, які щодня оновлюються, та відстеження їх щодо обміну незаконною інформацією.

Загалом ми повіримо, коли побачимо. Але навіть якщо система працює так, як задумано, чи дійсно ми хочемо, щоб ШІ контролював Інтернет?

Джерела:

Автор: Віктор Тангерманн
putin-khuylo
Вакцинуйся!
ОСТАННІ КОМЕНТАРІ