본문 바로가기

AI

오픈소스 한국어 TTS : fish-speech / openaudio-s1-mini

728x90
반응형

이것 저것 찾아 헤매다 우선 이 모델로 정착 해야 겠다 싶었다. 

 

속도를 빠르게 하는 옵션도 있고 

 

 

레퍼런스 오디오를 넣고 

비슷한 목소리와 톤을 만들어 줄 수도 있었다. 

 

 

코드는 여기를 참고 하지만

https://github.com/fishaudio/fish-speech

 

GitHub - fishaudio/fish-speech: SOTA Open Source TTS

SOTA Open Source TTS. Contribute to fishaudio/fish-speech development by creating an account on GitHub.

github.com

 

환경 설정은 이 곳

https://github.com/fishaudio/fish-speech/blob/main/docs/ko/install.md

 

fish-speech/docs/ko/install.md at main · fishaudio/fish-speech

SOTA Open Source TTS. Contribute to fishaudio/fish-speech development by creating an account on GitHub.

github.com

 

apt install portaudio19-dev libsox-dev ffmpeg

//요즘uv 가 좋은 것 같아서 자주 사용
pip install uv
uv sync --python 3.12

 

 

실행은 이 곳을 참고 

https://github.com/fishaudio/fish-speech/blob/main/docs/en/inference.md

 

fish-speech/docs/en/inference.md at main · fishaudio/fish-speech

SOTA Open Source TTS. Contribute to fishaudio/fish-speech development by creating an account on GitHub.

github.com

 

pip install huggingface_hub
huggingface-cli login  # 웹에서 토큰 복사해 붙여넣기

huggingface-cli download fishaudio/openaudio-s1-mini --local-dir checkpoints/openaudio-s1-mini

uv run ./tools/run_webui.py --compile

 

성능 향상에 신경을 좀 써야 겠지만

어째든 게이밍 gpu 위에서도 속도가 잘 나온다. 

 

728x90
반응형