12. Природна мова та генеративний ШІ

Генеративний штучний інтелект - це новий етап у розвитку технологій обробки природної мови, який дозволяє не лише аналізувати, але й створювати осмислений текстовий контент. У цьому розділі ми заглибимось у сучасні методи роботи з текстом та розглянемо, як комп'ютери "розуміють" значення слів та речень.

У цьому розділі ми:

  • дослідимо методи представлення тексту через хмари слів та різні види кодування
  • вивчимо алгоритм Word2Vec для виявлення семантичної подібності між словами
  • розберемо концепцію контекстуальних вкладань слів (contextual embeddings)
  • познайомимося з принципами роботи великих лінгвістичних моделей
  • розглянемо практичні застосування: підсумовування тексту та машинний переклад

Сучасні генеративні моделі здатні створювати тексти, що важко відрізнити від написаних людиною, перекладати між мовами та створювати короткі реферати довгих документів. Розуміння принципів їх роботи є ключовим для розробки ефективних систем обробки тексту.

На практиці ми створимо систему перевірки на плагіат, використовуючи векторні представлення тексту, та розробимо просту модель для передбачення наступного слова в реченні. Це допоможе краще зрозуміти принципи роботи сучасних мовних моделей.