Поддержать нас
Беларусы на войне
  1. Глава проблемного предприятия в Минске пожаловалась на то, как работают беларусы. Посмотрели зарплаты там — есть чему поразиться
  2. В Беларуси ввели лимит задолженности на балансах абонентов сотовой связи
  3. У одного дома висела «Пагоня», другого уволили за разговор с протестующими. Как сложились судьбы руководителей беларусского КГБ
  4. ЦИК Армении огласил предварительные результаты парламентских выборов
  5. Вводят новшества по земельным участкам и недвижимости — власти пояснили, что и для кого изменилось
  6. Известный производитель обуви недавно попал в «реанимацию» — за это время ему стало хуже. Появились новые подробности
  7. Синоптики сделали предупреждение из-за предстоящей погоды в понедельник — есть смысл ознакомиться с прогнозом
  8. Тихановская и Зеленский поздравили Пашиняна с победой на выборах. Минск молчит — зато высказалась Россия
  9. На «Беларусьфильме» запускают новое кино. Есть повод для оптимизма
  10. «Кошмар. Нет слов, одни маты». В одном из крупных беларусских городов люди занимают очередь в ГАИ с вечера
  11. Олигарх, который в 2020-м выступил против насилия, после встречи с Лукашенко рассказал о новом проекте в Беларуси
  12. В сборной Беларуси по футболу появился самый возрастной в истории дебютант. Его присутствие помогло одержать третью подряд победу
  13. На рынке валют перемены: доллар начал расти. Прогноз: чего ждать от курсов дальше?
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.