Merge pull request #48 from ijaric/tasks/#47_tts_handlers_repositories

[#47] TTS: Repositories
2026-06-19 08:37:47 +00:00 · 2023-10-14 22:51:35 +03:00
parent 9083c1d635 f8d32d4b87
commit ad9d4fdb4d
22 changed files with 302 additions and 38 deletions
--- a/.github/workflows/check-pr.yaml
+++ b/.github/workflows/check-pr.yaml
@@ -111,6 +111,11 @@ jobs:
          API_HOST: ${{ vars.API_HOST }}
          API_PORT: ${{ vars.API_PORT }}
          APP_RELOAD: ${{ vars.APP_RELOAD }}
          TTS_YANDEX_API_KEY: ${{ secrets.TTS_YANDEX_API_KEY }}
          TTS_ELEVEN_LABS_API_KEY: ${{ secrets.TTS_ELEVEN_LABS_API_KEY }}
          TTS_YANDEX_AUDIO_FORMAT: ${{ vars.TTS_YANDEX_AUDIO_FORMAT }}
          TTS_YANDEX_SAMPLE_RATE_HERTZ: ${{ vars.TTS_YANDEX_SAMPLE_RATE_HERTZ }}
          TTS_ELEVEN_LABS_DEFAULT_VOICE_ID: ${{ vars.TTS_ELEVEN_LABS_DEFAULT_VOICE_ID }}
        working-directory: src/${{ matrix.package }}
        run: |
          make ci-test
--- a/src/assistant/.env.example
+++ b/src/assistant/.env.example
@@ -30,3 +30,12 @@ VOICE_MAX_INPUT_SECONDS=30
 OPENAI_API_KEY=sk-1234567890
 OPENAI_STT_MODEL=whisper-1
 TTS_YANDEX_API_KEY=
 TTS_YANDEX_AUDIO_FORMAT=oggopus
 TTS_YANDEX_SAMPLE_RATE_HERTZ=48000
 TTS_YANDEX_TIMEOUT_SECONDS=30
 TTS_ELEVEN_LABS_API_KEY=
 TTS_ELEVEN_LABS_DEFAULT_VOICE_ID=EXAVITQu4vr4xnSDxMaL
 TTS_ELEVEN_LABS_TIMEOUT_SECONDS=30
--- a/src/assistant/lib/app/app.py
+++ b/src/assistant/lib/app/app.py
@@ -11,7 +11,9 @@ import lib.app.errors as app_errors
 import lib.app.settings as app_settings
 import lib.app.split_settings as app_split_settings
 import lib.clients as clients
 import lib.models as models
 import lib.stt as stt
 import lib.tts as tts
 logger = logging.getLogger(__name__)
@@ -59,21 +61,45 @@ class Application:
        logger.info("Initializing clients")
        http_yandex_tts_client = clients.AsyncHttpClient(
            base_url="yandex",  # todo add yandex api url from settings
            proxy_settings=settings.proxy,
            base_url=settings.tts_yandex.base_url,
            headers=settings.tts_yandex.base_headers,
            timeout=settings.tts_yandex.timeout_seconds,
        )
        http_eleven_labs_tts_client = clients.AsyncHttpClient(
            base_url=settings.tts_eleven_labs.base_url,
            headers=settings.tts_eleven_labs.base_headers,
            timeout=settings.tts_eleven_labs.timeout_seconds,
        )
        disposable_resources.append(
            DisposableResource(
                name="http_client yandex",
                dispose_callback=http_yandex_tts_client.close(),
            )
        )
        disposable_resources.append(
            DisposableResource(
                name="http_client eleven labs",
                dispose_callback=http_eleven_labs_tts_client.close(),
            )
        )
        # Repositories
        logger.info("Initializing repositories")
        stt_repository: stt.STTProtocol = stt.OpenaiSpeechRepository(settings=settings)
        tts_yandex_repository = tts.TTSYandexRepository(
            tts_settings=app_split_settings.TTSYandexSettings(),
            client=http_yandex_tts_client,
        )
        tts_eleven_labs_repository = tts.TTSElevenLabsRepository(
            tts_settings=app_split_settings.TTSElevenLabsSettings(),
            client=http_eleven_labs_tts_client,
            is_models_from_api=True,
        )
        # Caches
        logger.info("Initializing caches")
@@ -81,7 +107,15 @@ class Application:
        # Services
        logger.info("Initializing services")
-        stt_service: stt.SpeechService = stt.SpeechService(repository=stt_repository)
+        stt_service: stt.SpeechService = stt.SpeechService(repository=stt_repository)  # type: ignore
        tts_service: tts.TTSService = tts.TTSService(  # type: ignore
            repositories={
                models.VoiceModelProvidersEnum.YANDEX: tts_yandex_repository,
                models.VoiceModelProvidersEnum.ELEVEN_LABS: tts_eleven_labs_repository,
            },
        )
        # Handlers
        logger.info("Initializing handlers")
--- a/src/assistant/lib/app/settings.py
+++ b/src/assistant/lib/app/settings.py
@@ -12,3 +12,5 @@ class Settings(pydantic_settings.BaseSettings):
    project: app_split_settings.ProjectSettings = app_split_settings.ProjectSettings()
    proxy: app_split_settings.ProxySettings = app_split_settings.ProxySettings()
    voice: app_split_settings.VoiceSettings = app_split_settings.VoiceSettings()
    tts_yandex: app_split_settings.TTSYandexSettings = app_split_settings.TTSYandexSettings()
    tts_eleven_labs: app_split_settings.TTSElevenLabsSettings = app_split_settings.TTSElevenLabsSettings()
--- a/src/assistant/lib/app/split_settings/init.py
+++ b/src/assistant/lib/app/split_settings/init.py
@@ -5,6 +5,7 @@ from .openai import *
 from .postgres import *
 from .project import *
 from .proxy import *
 from .tts import *
 from .voice import *
 __all__ = [
@@ -15,6 +16,8 @@ __all__ = [
    "PostgresSettings",
    "ProjectSettings",
    "ProxySettings",
    "TTSElevenLabsSettings",
    "TTSYandexSettings",
    "VoiceSettings",
    "get_logging_config",
 ]
--- a/src/assistant/lib/app/split_settings/tts/init.py
+++ b/src/assistant/lib/app/split_settings/tts/init.py
@@ -0,0 +1,7 @@
 from .eleven_labs import *
 from .yandex import *
 __all__ = [
    "TTSElevenLabsSettings",
    "TTSYandexSettings",
 ]
--- a/src/assistant/lib/app/split_settings/tts/eleven_labs.py
+++ b/src/assistant/lib/app/split_settings/tts/eleven_labs.py
@@ -0,0 +1,26 @@
 import pydantic
 import pydantic_settings
 import lib.app.split_settings.utils as app_split_settings_utils
 class TTSElevenLabsSettings(pydantic_settings.BaseSettings):
    model_config = pydantic_settings.SettingsConfigDict(
        env_file=app_split_settings_utils.ENV_PATH,
        env_prefix="TTS_ELEVEN_LABS_",
        env_file_encoding="utf-8",
        extra="ignore",
    )
    api_key: pydantic.SecretStr = pydantic.Field(default=...)
    default_voice_id: str = "EXAVITQu4vr4xnSDxMaL"
    base_url: str = "https://api.elevenlabs.io/v1/"
    timeout_seconds: int = 30
    @property
    def base_headers(self) -> dict[str, str]:
        return {
            "Accept": "audio/mpeg",
            "Content-Type": "application/json",
            "xi-api-key": self.api_key.get_secret_value(),
        }
--- a/src/assistant/lib/app/split_settings/tts/yandex.py
+++ b/src/assistant/lib/app/split_settings/tts/yandex.py
@@ -0,0 +1,28 @@
 import typing
 import pydantic
 import pydantic_settings
 import lib.app.split_settings.utils as app_split_settings_utils
 class TTSYandexSettings(pydantic_settings.BaseSettings):
    model_config = pydantic_settings.SettingsConfigDict(
        env_file=app_split_settings_utils.ENV_PATH,
        env_prefix="TTS_YANDEX_",
        env_file_encoding="utf-8",
        extra="ignore",
    )
    audio_format: typing.Literal["oggopus", "mp3", "lpcm"] = "oggopus"
    sample_rate_hertz: int = 48000
    api_key: pydantic.SecretStr = pydantic.Field(default=...)
    base_url: str = "https://tts.api.cloud.yandex.net/speech/v1/"
    timeout_seconds: int = 30
    @property
    def base_headers(self) -> dict[str, str]:
        return {
            "Authorization": f"Api-Key {self.api_key.get_secret_value()}",
            "Content-Type": "application/x-www-form-urlencoded",
        }
--- a/src/assistant/lib/clients/http_client.py
+++ b/src/assistant/lib/clients/http_client.py
@@ -8,7 +8,7 @@ import lib.app.split_settings as app_split_settings
 class AsyncHttpClient(httpx.AsyncClient):
    def __init__(
        self,
-        proxy_settings: app_split_settings.ProxySettings,
+        proxy_settings: app_split_settings.ProxySettings | None = None,
        base_url: str | None = None,
        **client_params: typing.Any,
    ) -> None:
@@ -20,7 +20,7 @@ class AsyncHttpClient(httpx.AsyncClient):
        super().__init__(base_url=self.base_url, proxies=self.proxies, **client_params)  # type: ignore[reportGeneralTypeIssues]
    def __get_proxies_from_settings(self) -> dict[str, str] | None:
-        if not self.proxy_settings.enable:
+        if not self.proxy_settings or not self.proxy_settings.enable:
            return None
        proxies = {"all://": self.proxy_settings.dsn}
        return proxies
--- a/src/assistant/lib/models/init.py
+++ b/src/assistant/lib/models/init.py
@@ -8,6 +8,8 @@ __all__ = [
    "BaseLanguageCodesEnum",
    "BaseVoiceModel",
    "ElevenLabsLanguageCodesEnum",
    "ElevenLabsListVoiceModelsModel",
    "ElevenLabsVoiceModel",
    "IdCreatedUpdatedBaseMixin",
    "LANGUAGE_CODES_ENUM_TYPE",
    "LIST_VOICE_MODELS_TYPE",
@@ -17,4 +19,6 @@ __all__ = [
    "Token",
    "VoiceModelProvidersEnum",
    "YandexLanguageCodesEnum",
    "YandexListVoiceModelsModel",
    "YandexVoiceModel",
 ]
--- a/src/assistant/lib/models/tts/init.py
+++ b/src/assistant/lib/models/tts/init.py
@@ -6,6 +6,8 @@ __all__ = [
    "BaseLanguageCodesEnum",
    "BaseVoiceModel",
    "ElevenLabsLanguageCodesEnum",
    "ElevenLabsListVoiceModelsModel",
    "ElevenLabsVoiceModel",
    "LANGUAGE_CODES_ENUM_TYPE",
    "LIST_VOICE_MODELS_TYPE",
    "TTSCreateRequestModel",
@@ -13,4 +15,6 @@ __all__ = [
    "TTSSearchVoiceRequestModel",
    "VoiceModelProvidersEnum",
    "YandexLanguageCodesEnum",
    "YandexListVoiceModelsModel",
    "YandexVoiceModel",
 ]
--- a/src/assistant/lib/models/tts/models.py
+++ b/src/assistant/lib/models/tts/models.py
@@ -5,12 +5,45 @@ import lib.models.tts.voice.languages as models_tts_languages
 AVAILABLE_MODELS_TYPE = models_tts_voice.YandexVoiceModel | models_tts_voice.ElevenLabsVoiceModel
 LIST_VOICE_MODELS_TYPE = models_tts_voice.YandexListVoiceModelsModel | models_tts_voice.ElevenLabsListVoiceModelsModel
 DEFAULT_MODEL = models_tts_voice.ElevenLabsVoiceModel(
    voice_id="eleven_multilingual_v2",
    languages=[
        models_tts_languages.ElevenLabsLanguageCodesEnum.ENGLISH,
        models_tts_languages.ElevenLabsLanguageCodesEnum.JAPANESE,
        models_tts_languages.ElevenLabsLanguageCodesEnum.CHINESE,
        models_tts_languages.ElevenLabsLanguageCodesEnum.GERMAN,
        models_tts_languages.ElevenLabsLanguageCodesEnum.HINDI,
        models_tts_languages.ElevenLabsLanguageCodesEnum.FRENCH,
        models_tts_languages.ElevenLabsLanguageCodesEnum.KOREAN,
        models_tts_languages.ElevenLabsLanguageCodesEnum.PORTUGUESE,
        models_tts_languages.ElevenLabsLanguageCodesEnum.ITALIAN,
        models_tts_languages.ElevenLabsLanguageCodesEnum.SPANISH,
        models_tts_languages.ElevenLabsLanguageCodesEnum.INDONESIAN,
        models_tts_languages.ElevenLabsLanguageCodesEnum.DUTCH,
        models_tts_languages.ElevenLabsLanguageCodesEnum.TURKISH,
        models_tts_languages.ElevenLabsLanguageCodesEnum.FILIPINO,
        models_tts_languages.ElevenLabsLanguageCodesEnum.POLISH,
        models_tts_languages.ElevenLabsLanguageCodesEnum.SWEDISH,
        models_tts_languages.ElevenLabsLanguageCodesEnum.BULGARIAN,
        models_tts_languages.ElevenLabsLanguageCodesEnum.ROMANIAN,
        models_tts_languages.ElevenLabsLanguageCodesEnum.ARABIC,
        models_tts_languages.ElevenLabsLanguageCodesEnum.CZECH,
        models_tts_languages.ElevenLabsLanguageCodesEnum.GREEK,
        models_tts_languages.ElevenLabsLanguageCodesEnum.FINNISH,
        models_tts_languages.ElevenLabsLanguageCodesEnum.CROATIAN,
        models_tts_languages.ElevenLabsLanguageCodesEnum.MALAY,
        models_tts_languages.ElevenLabsLanguageCodesEnum.SLOVAK,
        models_tts_languages.ElevenLabsLanguageCodesEnum.DANISH,
        models_tts_languages.ElevenLabsLanguageCodesEnum.TAMIL,
        models_tts_languages.ElevenLabsLanguageCodesEnum.UKRAINIAN,
    ],
 )
 class TTSCreateRequestModel(pydantic.BaseModel):
    model_config = pydantic.ConfigDict(use_enum_values=True)
-    voice_model: AVAILABLE_MODELS_TYPE
+    voice_model: AVAILABLE_MODELS_TYPE = DEFAULT_MODEL
    text: str
--- a/src/assistant/lib/models/tts/voice/base.py
+++ b/src/assistant/lib/models/tts/voice/base.py
@@ -20,6 +20,8 @@ class BaseVoiceModel(pydantic.BaseModel):
    @pydantic.model_validator(mode="before")
    @classmethod
    def check_voice_name_exists(cls, data: typing.Any) -> typing.Any:
        if not data:
            return data
        voice_id = data.get("voice_id")
        voice_name = data.get("voice_name")
        if not voice_name and voice_id:
--- a/src/assistant/lib/models/tts/voice/eleven_labs.py
+++ b/src/assistant/lib/models/tts/voice/eleven_labs.py
@@ -71,5 +71,13 @@ class ElevenLabsListVoiceModelsModel(pydantic.BaseModel):
    @classmethod
    def from_api(cls, voice_models_from_api: list[dict[str, typing.Any]]) -> typing.Self:
-        voice_models = [ElevenLabsVoiceModel.model_validate(voice_model) for voice_model in voice_models_from_api]
+        voice_models = []
        for voice_model in voice_models_from_api:
            voice_model["voice_id"] = voice_model.pop("model_id")
            voice_model["voice_name"] = voice_model.pop("name")
            voice_model["languages"] = [
                models_tts_languages.ElevenLabsLanguageCodesEnum(item.get("language_id"))
                for item in voice_model.pop("languages")
            ]
            voice_models.append(ElevenLabsVoiceModel.model_validate(voice_model))
        return ElevenLabsListVoiceModelsModel(models=voice_models)
--- a/src/assistant/lib/models/tts/voice/yandex.py
+++ b/src/assistant/lib/models/tts/voice/yandex.py
@@ -16,6 +16,8 @@ class YandexVoiceModel(models_tts_base.BaseVoiceModel):
    @pydantic.model_validator(mode="before")
    @classmethod
    def check_voice_name_exists(cls, data: typing.Any) -> typing.Any:
        if not data:
            return data
        voice_id = data.get("voice_id")
        voice_name = data.get("voice_name")
        role = data.get("role")
--- a/src/assistant/lib/tts/init.py
+++ b/src/assistant/lib/tts/init.py
@@ -1,5 +1,9 @@
-from .services import TTSService
+from .repositories import *
 from .services import *
 __all__ = [
    "TTSBaseRepository",
    "TTSElevenLabsRepository",
    "TTSService",
    "TTSYandexRepository",
 ]
--- a/src/assistant/lib/tts/models/protocols.py
+++ b/src/assistant/lib/tts/models/protocols.py
@@ -4,11 +4,13 @@ import lib.models as models
 class TTSRepositoryProtocol(typing.Protocol):
-    def get_audio_as_bytes(self, request: models.TTSCreateRequestModel) -> models.TTSCreateResponseModel:
+    async def get_audio_as_bytes(self, request: models.TTSCreateRequestModel) -> models.TTSCreateResponseModel:
        ...
-    def get_voice_model_by_name(self, voice_model_name: str) -> models.BaseVoiceModel | None:
+    async def get_voice_model_by_name(self, voice_model_name: str) -> models.BaseVoiceModel | None:
        ...
-    def get_voice_models_by_fields(self, fields: models.TTSSearchVoiceRequestModel) -> models.LIST_VOICE_MODELS_TYPE:
+    async def get_voice_models_by_fields(
        self, fields: models.TTSSearchVoiceRequestModel
    ) -> models.LIST_VOICE_MODELS_TYPE:
        ...
--- a/src/assistant/lib/tts/repositories/init.py
+++ b/src/assistant/lib/tts/repositories/init.py
@@ -1,5 +1,9 @@
 from .base import *
 from .eleven_labs import *
 from .yandex import *
 __all__ = [
    "TTSBaseRepository",
    "TTSElevenLabsRepository",
    "TTSYandexRepository",
 ]
--- a/src/assistant/lib/tts/repositories/base.py
+++ b/src/assistant/lib/tts/repositories/base.py
@@ -1,37 +1,35 @@
 import abc
 import lib.clients as clients
 import lib.models as models
 class HttpClient:  # Mocked class todo remove and use real http client from lib.clients.http_client
    ...
 class TTSBaseRepository(abc.ABC):
-    def __init__(self, client: HttpClient, is_models_from_api: bool = False):
+    def __init__(self, client: clients.AsyncHttpClient, is_models_from_api: bool = False):
        self.http_client = client
        self.is_models_from_api = is_models_from_api
    @property
    @abc.abstractmethod
-    def voice_models(self) -> models.LIST_VOICE_MODELS_TYPE:
+    async def voice_models(self) -> models.LIST_VOICE_MODELS_TYPE:
        ...
    @abc.abstractmethod
    def get_audio_as_bytes(self, request: models.TTSCreateRequestModel) -> models.TTSCreateResponseModel:
        raise NotImplementedError
-    def get_voice_model_by_name(self, voice_model_name: str) -> models.BaseVoiceModel | None:
+    @abc.abstractmethod
    async def get_audio_as_bytes(self, request: models.TTSCreateRequestModel) -> models.TTSCreateResponseModel:
        raise NotImplementedError
    async def get_voice_model_by_name(self, voice_model_name: str) -> models.BaseVoiceModel | None:
        """
        Search voice model by name
        :param voice_model_name: String name
        :return: Voice model that match the name
        """
-        for voice_model in self.voice_models.models:
+        voice_models = await self.voice_models
        for voice_model in voice_models.models:
            if voice_model.voice_name == voice_model_name:
                return voice_model
-    def get_list_voice_models_by_fields(
+    async def get_list_voice_models_by_fields(
        self, fields: models.TTSSearchVoiceRequestModel
    ) -> list[models.AVAILABLE_MODELS_TYPE]:
        """
@@ -41,7 +39,8 @@ class TTSBaseRepository(abc.ABC):
        """
        fields_dump = fields.model_dump(exclude_none=True)
        voice_models_response = []
-        for voice_model in self.voice_models.models:
+        voice_models = await self.voice_models
        for voice_model in voice_models.models:
            for field, field_value in fields_dump.items():
                if field == "languages":  # language is a list
                    language_names: set[str] = {item.name for item in field_value}
--- a/src/assistant/lib/tts/repositories/eleven_labs.py
+++ b/src/assistant/lib/tts/repositories/eleven_labs.py
@@ -0,0 +1,42 @@
 import typing
 import lib.app.split_settings as app_split_settings
 import lib.clients as clients
 import lib.models as models
 import lib.tts.repositories.base as tts_repositories_base
 class TTSElevenLabsRepository(tts_repositories_base.TTSBaseRepository):
    def __init__(
        self,
        tts_settings: app_split_settings.TTSElevenLabsSettings,
        client: clients.AsyncHttpClient,
        is_models_from_api: bool = False,
    ):
        self.tts_settings = tts_settings
        super().__init__(client, is_models_from_api)
    @property
    async def voice_models(self) -> models.ElevenLabsListVoiceModelsModel:
        if self.is_models_from_api:
            return models.ElevenLabsListVoiceModelsModel.from_api(await self.get_all_models_dict_from_api())
        return models.ElevenLabsListVoiceModelsModel()
    async def get_all_models_dict_from_api(self) -> list[dict[str, typing.Any]]:
        response = await self.http_client.get("/models")
        return response.json()
    async def get_audio_as_bytes(self, request: models.TTSCreateRequestModel) -> models.TTSCreateResponseModel:
        if not isinstance(request.voice_model, models.ElevenLabsVoiceModel):
            raise ValueError("ElevenLabs TTS support only ElevenLabsVoiceModel")
        response = await self.http_client.post(
            f"/text-to-speech/{self.tts_settings.default_voice_id}",
            json={"text": request.text, "model_id": request.voice_model.voice_id},
        )
        return models.TTSCreateResponseModel(audio_content=response.content)
    async def get_voice_models_by_fields(
        self, fields: models.TTSSearchVoiceRequestModel
    ) -> models.ElevenLabsListVoiceModelsModel:
        list_voice_models = await self.get_list_voice_models_by_fields(fields)
        return models.ElevenLabsListVoiceModelsModel(models=list_voice_models)  # type: ignore
--- a/src/assistant/lib/tts/repositories/yandex.py
+++ b/src/assistant/lib/tts/repositories/yandex.py
@@ -0,0 +1,48 @@
 import logging
 import lib.app.split_settings as app_split_settings
 import lib.clients as clients
 import lib.models as models
 import lib.tts.repositories.base as tts_repositories_base
 logger = logging.getLogger(__name__)
 class TTSYandexRepository(tts_repositories_base.TTSBaseRepository):
    def __init__(
        self,
        tts_settings: app_split_settings.TTSYandexSettings,
        client: clients.AsyncHttpClient,
        is_models_from_api: bool = False,
    ):
        self.tts_settings = tts_settings
        if is_models_from_api:
            logger.warning("Yandex TTS doesn't support getting models from API")
        super().__init__(client, is_models_from_api=False)
    @property
    async def voice_models(self) -> models.YandexListVoiceModelsModel:
        return models.YandexListVoiceModelsModel()
    async def get_audio_as_bytes(self, request: models.TTSCreateRequestModel) -> models.TTSCreateResponseModel:
        if not isinstance(request.voice_model, models.YandexVoiceModel):
            raise ValueError("Yandex TTS support only YandexVoiceModel")
        data = {
            "text": request.text,
            "lang": request.voice_model.languages[0].value,
            "voice": request.voice_model.voice_id,
            "emotion": request.voice_model.role,
            "format": self.tts_settings.audio_format,
            "sampleRateHertz": self.tts_settings.sample_rate_hertz,
        }
        response = await self.http_client.post(
            "/tts:synthesize",
            data=data,
        )
        return models.TTSCreateResponseModel(audio_content=response.content)
    async def get_voice_models_by_fields(
        self, fields: models.TTSSearchVoiceRequestModel
    ) -> models.YandexListVoiceModelsModel:
        list_voice_models = await self.get_list_voice_models_by_fields(fields)
        return models.YandexListVoiceModelsModel(models=list_voice_models)  # type: ignore
--- a/src/assistant/lib/tts/services.py
+++ b/src/assistant/lib/tts/services.py
@@ -1,35 +1,33 @@
-import lib.app.settings as app_settings
+import lib.models as _models
 import lib.models as models
 import lib.tts.models as tts_models
 class TTSService:
    def __init__(
        self,
-        settings: app_settings.Settings,
+        repositories: dict[_models.VoiceModelProvidersEnum, tts_models.TTSRepositoryProtocol],
        repositories: dict[models.VoiceModelProvidersEnum, tts_models.TTSRepositoryProtocol],
    ):
        self.settings = settings
        self.repositories = repositories
-    def get_audio_as_bytes(self, request: models.TTSCreateRequestModel) -> models.TTSCreateResponseModel:
+    async def get_audio_as_bytes(self, request: _models.TTSCreateRequestModel) -> _models.TTSCreateResponseModel:
        model = request.voice_model
        repository = self.repositories[model.provider]
-        audio_response = repository.get_audio_as_bytes(request)
+        audio_response = await repository.get_audio_as_bytes(request)
        return audio_response
-    def get_voice_model_by_name(self, voice_model_name: str) -> models.BaseVoiceModel | None:
+    async def get_voice_model_by_name(self, voice_model_name: str) -> _models.BaseVoiceModel | None:
        for repository in self.repositories.values():
-            voice_model = repository.get_voice_model_by_name(voice_model_name)
+            voice_model = await repository.get_voice_model_by_name(voice_model_name)
            if voice_model:
                return voice_model
        raise ValueError("Voice model not found")
-    def get_list_voice_models_by_fields(
+    async def get_list_voice_models_by_fields(
-        self, fields: models.TTSSearchVoiceRequestModel
+        self, fields: _models.TTSSearchVoiceRequestModel
-    ) -> list[models.AVAILABLE_MODELS_TYPE]:
+    ) -> list[_models.AVAILABLE_MODELS_TYPE]:
-        response_models: list[models.AVAILABLE_MODELS_TYPE] = []
+        response_models: list[_models.AVAILABLE_MODELS_TYPE] = []
        for repository in self.repositories.values():
-            voice_models = repository.get_voice_models_by_fields(fields)
+            voice_models = await repository.get_voice_models_by_fields(fields)
            if voice_models.models:
                response_models.extend(voice_models.models)
        return response_models