Головна » Блог » Локалізація штучного інтелекту: п’ять найкращих стратегій

Локалізація штучного інтелекту: п’ять найкращих стратегій

Багато компаній впроваджують сервіси, що в першу чергу базуються на штучному інтелекті (ШІ) або доповненій реальності, які прямо чи опосередковано взаємодіють з користувачами. Ці сервіси у своїй основі використовують великі мовні моделі (LLM – large language model), які навчаються на даних, представлених здебільшого англійською мовою та кількома іншими мовами. Відповідно, їх функціональність менш ніж оптимальна…

Багато компаній впроваджують сервіси, що в першу чергу базуються на штучному інтелекті (ШІ) або доповненій реальності, які прямо чи опосередковано взаємодіють з користувачами. Ці сервіси у своїй основі використовують великі мовні моделі (LLM – large language model), які навчаються на даних, представлених здебільшого англійською мовою та кількома іншими мовами. Відповідно, їх функціональність менш ніж оптимальна для більшості мов. Саме тому локалізація штучного інтелекту створює певні потенційно складні проблеми.

Вторинні та малоресурсні мови створюють особливо складні проблеми через обмеженість навчальних даних. Ба навіть гірше, велика кількість онлайн-контенту такими мовами перекладена за допомогою машинного перекладу, що створює проблему «сміття на вході, сміття на виході», якщо такий матеріал використовувався для навчання моделі. Тож ваш продукт може поводитися як ChatGPT-4 англійською, але не бути таким надійним українською.

З огляду на ці недоліки, викладені нижче п’ять практик можуть допомогти компаніям покращити локалізацію штучного інтелекту і забезпечити своїх клієнтів якомога якіснішими послугами.

1. Залучайте носіїв мови для тестування взаємодії з користувачами

Одна з причин, чому наймати двомовних працівників – гарна ідея, це те, що вони можуть оцінити продукт і виявити функціональні проблеми, використовуючи продукт своєю мовою. Носії мови можуть визначити, що ШІ генерує «мову», яка звучить правильно, однак насправді є неправильною, — певні аспекти, які можуть залишитися непоміченими іншими тестувальниками.

З таким завданням, як локалізація штучного інтелекту, вам може допомогти бюро перекладів. Вони часто наймають спеціалістів, які є носіями цільової мови. Вони можуть оцінити якість перекладів, їх стиль та точність відповідей відповідними мовами.

2. Будьте обережні з новими мовами

Швидка локалізація штучного інтелекту новими мовами без ретельного тестування – не найкраща ідея. Навіть після цього вам слід позначити реліз як «бета-версія», а також порівняти показники користувачів з англомовною версією. Користувачі зазвичай досить толерантні до незначних помилок в перекладі інтерфейсу користувача (UI), тому така практика не сильно зашкодить вашому продукту; однак якщо користувачі використовують ваш сервіс для проведення досліджень і отримують безглузді результати своєю мовою, вони можуть піти від вас назавжди.

3. Використовуйте англійську мову як мову-місток

Компанії можуть використовувати штучний інтелект для перекладу на англійську мову та з англійської мови, зокрема DeepL або Google Translate. За такого підходу запит перекладається з додаткової мови на англійську, а відповідь перекладається назад на мову введення. Деякі постачальники ШІ, можливо, вже роблять це за лаштунками, тому варто вивчити це питання, перш ніж додавати власний шар перекладу, який може лише зашкодити.

Цей підхід передбачає певні ризики, адже в кожному напрямі буде деяка втрата інформації. Найкращі моделі забезпечують точний переклад у 80-90% випадків, що може бути вирішальним фактором між гарним запитом та тим, який дасть спотворені результати. Спеціалізовані ШІ для перекладу зазвичай перевершують у перекладі універсальні ШІ, такі як ChatGPT. Тож, звичайно, краще використовувати саме такі спеціалізовані ШІ для мов, які мають достатнє ресурсне забезпечення.

Мови, які мають недостатнє ресурсне забезпечення, часто недостатньо обслуговуються або взагалі не обслуговуються системами перекладу. Іноді можна знайти спеціальні перекладацькі платформи, що спеціалізуються на певних мовах. Ви побачите, що точність перекладу для вторинних мов не така висока, що призведе до втрати інформації в обох напрямках. Однак добре те, що багато людей розуміють одну або декілька інших популярних міжнародних мов, де платформи штучного інтелекту добре працюють. Наприклад, французька мова широко розповсюджена в певних частинах Африки, тому користувачі в цих місцях можуть виявити, що платформи краще працюють французькою, ніж локальними мовами й діалектами.

Загалом, цей підхід може бути найменш поганим варіантом для мов з низьким рівнем ресурсів, проте не ідеальний для більшості.

4. Зберіть результати кількох запитів

Інформація часто ізолюється через мову. Розгляньмо ситуацію, коли користувач запитує ШІ про японських бейсболістів. Хоча інформація про топ-гравців може бути доступна англійською мовою, ймовірно, набагато більш повна інформація про них буде доступна японською. У цій ситуації найкращий підхід полягає в тому, щоб зробити кількам запитів різними мовами, а потім зіставити результати, що представляються користувачу.

Досвідчені користувачі, швидше за все, обізнані з цим питанням і знають, як налаштовувати системи так, щоб відображати ізольовану інформацію. Проте пересічний користувач, ймовірно, не знатиме про це, тому збір результатів – це те, що постачальники штучного інтелекту можуть робити за лаштунками, щоб покращити відповіді.

5. За можливості використовуйте багатомовну модель, що базується на рідній мові

Обнадіює є те, що країни розробляють власні моделі штучного інтелекту, які навчаються відповідним мовам для створення багатомовних сервісів. Наприклад, у Швейцарії провідні університети розробляють відкриті багатомовні моделі, на яких інші можуть створювати власні проєкти. Сподіваємося побачити більше подібних розробок для створення моделей штучного інтелекту для обслуговування інших регіонів. Однак, хоча це найкраще довгострокове рішення, воно також є дорогим через вартість навчання мовних моделей.

Висновок

Неважливо, наскільки добре виглядає ваш інтерфейс користувача та веб-сайт тайською мовою, якщо базовий сервіс штучного інтелекту цією мовою не працює. Наразі п’ять представлених вище стратегій є найкращими для компаній, які хочуть створювати якісні послуги штучного інтелекту для своїх користувачів по всьому світу.

Схожі записи

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *