Основи інженерії штучного інтелекту 10-11 класи
12. Природна мова та генеративний ШІ
12.1. Моделювання простої мовної моделі
Мовні моделі - це клас алгоритмів штучного інтелекту, які вміють працювати з текстом. Їх головне завдання - передбачати, яке слово найімовірніше з'явиться далі в тексті, враховуючи попередні слова. Хоча сучасні мовні моделі (як-от GPT чи BERT) побудовані на складних нейронних мережах, ми можемо зрозуміти основний принцип їх роботи на простішому прикладі.
Практична робота: Створення простої мовної моделі
Мета: Навчитися створювати базову мовну модель, яка передбачає наступне слово на основі двох попередніх слів.
Хід роботи:
- Підготовка даних:
- Візьміть будь-який текст для навчання моделі
- Розбийте його на групи по три слова, де перші два будуть контекстом, а третє - тим, що модель має передбачити
- Створення моделі в Orange:
- Додайте блок Select Columns
- Виберіть колонку context як ознаку (Feature)
- Виберіть колонку next_token як цільову змінну (Target)
- Використайте Bag of Words або TF-IDF для перетворення слів у числа
- Додайте модель машинного навчання (Logistic Regression або Naive Bayes)
- Тестування моделі:
- Використайте блок Test & Score для оцінки якості моделі
- Перевірте роботу моделі на нових прикладах через блок Predict
Висновок: Створена модель вчиться знаходити закономірності в тексті - які слова найчастіше йдуть після певних комбінацій інших слів. Наприклад, якщо в навчальних даних після слів "червона" та "машина" часто зустрічається слово "їде", модель буде пропонувати саме це слово. Цей простий принцип лежить в основі сучасних чат-ботів та систем обробки тексту, хоча вони використовують значно складніші алгоритми.