ChatTTS: Преобразование текста в речь для чата Обзор
ChatTTS - это модель генерации речи, разработанная для разговорных сценариев, доступная на GitHub по адресу 2noise/chattts. Она предназначена для выполнения диалоговых задач для ассистентов на основе больших языковых моделей и для аудио- и видеоинтро в разговорном формате, поддерживая английский и китайский языки. Благодаря обучению на примерно 100 000 часах данных, ChatTTS обеспечивает высококачественный и естественный синтез речи. Команда проекта планирует предоставить в открытый доступ базовую модель, обученную на 40 000 часах данных, чтобы помочь дальнейшим исследованиям и разработке.
Одной из ключевых особенностей ChatTTS является поддержка нескольких языков, включая английский и китайский, преодолевая языковые барьеры. Она была широко обучена на примерно 10 миллионах часов данных, что привело к первоклассному синтезу голоса. Идеально подходит для диалоговых задач, ChatTTS улучшает опыт взаимодействия в приложениях и сервисах.