HTP Logotype.

Кыргызстан жасалма интеллект тармагында: Kani TTS 2 дүйнөлүк AI моделдер каталогунда алдыңкы орунга чыкты

Kani TTS кыргыз тилинде жана башка тилдерде 40 секундга чейин сүйлөө синтезин камсыздай алат

Кыргызстандык иштеп чыгуучулар эл аралык технологиялык мейкиндикте кезектеги маанилүү жетишкендикке жетишти. NineNineSix командасы үн синтези боюнча жаңы муундагы Kani TTS 2 моделин сунуштады. Модель Hugging Face платформасында -  дүйнөдөгү эң ири жасалма интеллект моделдер каталогунда - TTS багыты боюнча эң популярдуу моделдердин катарына кирди.

Kani TTS 2 мурунку версиясынын негизинде иштелип чыгып, технологиялык жактан олуттуу өркүндөтүүлөрдү камтыйт. Модель бир өтүүдө 40 секундга чейин туруктуу жана сапаттуу сүйлөө синтезин ишке ашыра алат, бул биринчи версиясынын көрсөткүчтөрүнөн эки эседен ашык жогору.

Толугу менен ачык архитектурага ээ болгон модель үчүн Hugging Face платформасында TTS категориясы боюнча топ-3кө кирүү - маанилүү эл аралык жетишкендик болуп саналат.

NineNineSix жөнүндө

NineNineSix - жасалма интеллект жана тил технологиялары тармагында адистешкен кыргызстандык иштеп чыгуучулар командасы.

Команда буга чейин Kani TTS моделинин биринчи версиясын сунуштап, ошондой эле кыргыз тилинде сүйлөгөн алгачкы жасалма интеллект ассистенти - AkylAIди иштеп чыккан.

Аз ресурстуу тилдерге басым

Жасалма интеллект тармагындагы ири компаниялар негизинен англис жана башка кеңири колдонулган тилдерге артыкчылык беришет. Натыйжада аз ресурстуу тилдер технологиялык өнүгүүдөн четте калып келет. NineNineSix бул багытта инклюзивдүү ыкманы тандаган.

Kani TTS 2 учурда англис, испан жана кыргыз тилдерин колдойт. Моделдин архитектурасы аны башка тилдерге, акценттерге жана диалекттерге масштабдоо мүмкүнчүлүгүн берет.

Долбоордун өзгөчөлүгү - алдын ала окутуу (pretrain) кодунун толук ачык жеткиликтүүлүгү. Бул ар кандай өлкөлөрдүн же изилдөө топторунун Kani TTS 2 негизинде өз үн моделдерин иштеп чыгышына шарт түзөт.

«Kani TTS 2 - бул биздин биринчи версиядан кийинки системалуу өнүгүүнүн жыйынтыгы. Биз сүйлөө синтезинин туруктуулугун жогорулатып, узак фрагменттерди генерациялоо мүмкүнчүлүгүн камсыздадык. Компакттуу жана ачык моделдерге артыкчылык берүү аларды ар түрдүү тилдерге, анын ичинде аз ресурстуу тилдерге адаптациялоону жеңилдетет. Биз дүйнөлүк деңгээлдеги технологияларды Кыргызстанда иштеп чыгууга болорун көрсөтүүнү максат кылабыз. Ошондуктан моделдин салмактары менен катар pretrain үчүн толук кодду да ачык жарыяладык», - деп билдирди nineninesix.ai компаниясынын тең негиздөөчүсү Нурсултан Бакашов.

Kani TTS 2нин негизги мүнөздөмөлөрү

• Бир өтүүдө 40 секундга чейин туруктуу сүйлөө синтези
• Zero-shot voice cloning функциясы - кыска аудио үлгү аркылуу үндү клондоо
• Толук ачык архитектура жана окутуу коду
• Hugging Face платформасында TTS категориясы боюнча топ-3кө кирүү

Модель болжол менен 400 миллион параметрден турат, 10 000 саатка жакын сүйлөө маалыматтары менен алдын ала окутулган жана болжол менен 3 ГБ видеожадысы бар GPUда иштей алат. Бул аны локалдык жана сервердик инфраструктурада колдонууга ылайыктуу кылат.

«Kani TTS 2 - бул кезектеги AI-модель гана эмес. Бул кыргызстандык адистердин глобалдык жасалма интеллект рыногунда атаандаша ала турган технологияларды жарата аларын тастыктайт. NineNineSix Кыргызстан алдыңкы AI-чечимдерди иштеп чыгуучу өлкө боло аларын көрсөтүүдө», - деп белгилешти Кыргыз Республикасынын Жогорку технологиялар паркынын өкүлдөрү.

Долбоорго шилтемелер

Pretrained модель:
https://huggingface.co/nineninesix/kani-tts-2-pt

English модель:
https://huggingface.co/nineninesix/kani-tts-2-en

Pretrain коду:
https://github.com/nineninesix-ai/kani-tts-2-pretrain

HF Spaces:
https://huggingface.co/spaces/nineninesix/kani-tts-2-pt
https://huggingface.co/spaces/nineninesix/kanitts-2-en