Основи інженерії штучного інтелекту 10-11 класи
Цей документ містить навчальні матеріали для учнів та вчителів курсу «Основи інженерії штучного інтелекту». Навчальна програма курсу за вибором "Основи інженерії штучного інтелекту" Автори: Рибак О.С., Радер Р.І. Протокол №7 від 19.08.2024. Зареєстровано у каталозі надання грифів навчальних матеріалів та навчальних програм № 4.0164-2024 (Текст програми (pdf))
11. Основи обробки природної мови
Обробка природної мови (Natural Language Processing, NLP) - це галузь штучного інтелекту, що займається взаємодією між комп'ютерами та людською мовою. Це складна та захоплююча область, яка дозволяє комп'ютерам "розуміти", аналізувати та генерувати людську мову.
У цьому розділі ми:
- вивчимо основні концепції математичної лінгвістики, включаючи закон Ціпфа
- познайомимося з базовими методами обробки тексту: токенізацією та n-грамами
- освоїмо різні способи кодування тексту (one-hot encoding, bag of words)
- навчимося добувати семантичні ознаки з тексту
- розглянемо практичні застосування NLP: аналіз настрою та класифікацію текстів
Сьогодні технології NLP використовуються повсюдно: від пошукових систем та перекладачів до голосових помічників та чат-ботів. Розуміння принципів роботи з текстовими даними є важливою навичкою для сучасного спеціаліста з штучного інтелекту.
На практиці ми створимо програму для аналізу відгуків до фільмів, де застосуємо вивчені методи для визначення емоційного забарвлення тексту. Це дозволить нам побачити, як теоретичні знання застосовуються у реальних задачах обробки природної мови.