Журнал AI Lab News
AI Lab News #1: Роботи, мистецтво та мова
Випуск від 15.11.2024
-
Керування дроном за допомогою Python та як навчити його слідувати за об'єктами.
-
Створення робота-помічника Бендера з розпізнаванням мовлення та голосовою взаємодією.
-
Розпізнавання звуків української мови: навчання моделі та плани створення інтерактивного веб-сайту.
-
Картина-колаж у стилі кубізму для конкурсу WAICY: як поєднати штучний інтелект і мистецтво в темі гармонії технологій та природи.
Програму для розпізнавання конструктору біологічних клітин опубліковано
На базі конструктора біологічних клітин створюється програма для розпізнавання його елементів за допомогою технологій комп'ютерного зору. Вже виконано важливий етап роботи: усі елементи конструктора були відфотографовані для навчання системи.
Програма, розроблена на OpenCV.js, наразі здатна визначати елементи конструктора на статичних зображеннях. Перші результати опубліковані на веб-сторінці http://www.rmn.pp.ua/biology_cv/.
Подальші плани включають вдосконалення веб-сторінки, створення зручного інтерфейсу, а також реалізацію функції розпізнавання елементів у реальному часі через камеру. Це зробить технологію ще більш інтерактивною та придатною для використання у навчальних матеріалах з біології.

Голова Бендера - надрукована!
У рамках роботи над проєктом "Помічник із штучним інтелектом" вже змодельовано та надруковано 3D-прототип робота Бендера.
На даний момент реалізовано базову програму, що використовує модель OpenAI Whisper для розпізнавання мовлення, а також text-to-speech технологію для генерації голосу. Усі розробки доступні на GitHub-репозиторії проєкту: https://github.com/artemgrab/Head_project.
Подальші плани передбачають вдосконалення функціоналу робота, зокрема інтеграцію нових інтелектуальних можливостей і покращення голосової взаємодії. Проєкт демонструє потенціал використання штучного інтелекту в реальних пристроях і надихає на нові інноваційні рішення.

Вчимось керувати дроном з Python програми

Ми підключили дрон до компʼютера за допомогою бібліотеки DJITelloPy, що дозволило керувати ним безпосередньо з комп'ютера. Перші успіхи вже є: дрон навчився робити фотографії за командою та виконувати базові рухи під керуванням програми.
Наступний етап роботи — навчити дрон розпізнавати об'єкти в полі зору камери та слідувати за ними автоматично. Для цього буде використовуватися комп'ютерний зір та алгоритми штучного інтелекту.
Проєкт "Розпізнавання звуків української мови": перші успіхи

Розробка системи для розпізнавання звуків української мови успішно розпочалася. За допомогою Teachable Machine було записано тестовий набір звуків, що дозволило натренувати модель. Наразі розпізнавання голосних і приголосних працює, хоча під час запису виникають шуми, які впливають на якість даних.
Наступний етап роботи передбачає запис звуків у більш контрольованих умовах для підвищення точності моделі. Також планується розширити функціонал, додавши розпізнавання звуків за детальнішими категоріями.
Щоб зробити систему зручною для використання, розробляється веб-сайт, де буде інтегровано розпізнавання. Це дозволить усім охочим ознайомитися з можливостями моделі та випробувати її в реальному часі.
Картина майбутнього: участь у конкурсі WAICY
На конкурсі WAICY команда працює над унікальним мистецьким проєктом, який поєднує штучний інтелект і мистецтво. Завдання — створити картину-колаж у стилі кубізму, натхненну роботами Пабло Пікассо. Тема твору: "Майбутнє: гармонія технологій і природи".
Основна ідея проєкту — показати, як сучасні технології можуть співіснувати з природою, доповнюючи й підтримуючи одне одного. Для цього використовуються фрагменти зображень, згенерованих штучним інтелектом. Ці частини гармонійно поєднуються в кубістичну композицію, яка передає концепцію майбутнього, де природа і технології живуть у злагоді.
