AI LAB/🦜 TTS
-
음성합성을 진행하다보면 alignment.json에 음성과 텍스트를 쌍을 저장하기 위해서 아래의 명령어를 실행할 때가 있다. python -m recognition.alignment --recognition_path "./datasets/son/recognition.json" --score_threshold=0.5 --recognition_encoding="utf-8" 상황에 따라 다를 수도 있겠지만, 인코딩 이슈 또는 IndexError list index out of range에러를 만날 것이다. 인코딩 이슈를 만났을 경우 에러명 : UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 51: illegal multibyte seq..
6. [음성합성] IndexError list index out of range 해결음성합성을 진행하다보면 alignment.json에 음성과 텍스트를 쌍을 저장하기 위해서 아래의 명령어를 실행할 때가 있다. python -m recognition.alignment --recognition_path "./datasets/son/recognition.json" --score_threshold=0.5 --recognition_encoding="utf-8" 상황에 따라 다를 수도 있겠지만, 인코딩 이슈 또는 IndexError list index out of range에러를 만날 것이다. 인코딩 이슈를 만났을 경우 에러명 : UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 51: illegal multibyte seq..
2019.04.07 -
recognition.google --audio_pattern을 실행해보았습니다. Google Speech Recognition API 를 사용하여, 오디오에 대한 문장을 출력해줍니다. > python -m recognition.google --audio_pattern "./datasets/son/audio/*.*.wav" 약... 4시간? 이 걸린 것으로 기억합니다. 해당 작업이 끝나면 275$ (약 28만원)을 사용하게 됩니다. ㄷㄷ 실행 중에 아래와 같은 에러에 직면할 수도 있습니다. 에러 발생 : cp949 codec can't decode byte 0xec in position illgall multibyte sequence 에러 원인 : cp949는 인코딩 문제입니다. 해결방법 : recogr..
5. [음성합성] recognition.google --audio_patternrecognition.google --audio_pattern을 실행해보았습니다. Google Speech Recognition API 를 사용하여, 오디오에 대한 문장을 출력해줍니다. > python -m recognition.google --audio_pattern "./datasets/son/audio/*.*.wav" 약... 4시간? 이 걸린 것으로 기억합니다. 해당 작업이 끝나면 275$ (약 28만원)을 사용하게 됩니다. ㄷㄷ 실행 중에 아래와 같은 에러에 직면할 수도 있습니다. 에러 발생 : cp949 codec can't decode byte 0xec in position illgall multibyte sequence 에러 원인 : cp949는 인코딩 문제입니다. 해결방법 : recogr..
2019.04.06 -
Exception: OS error: RetryError(Exception occurred in retry method that was not classified as transient, caused by ) pip install librosa==0.5.1 https://pypi.org/project/librosa/0.5.1/ librosa 버전 정확히 맞춰보세요. WAV header indicates 해결됩니다. 궁금한 점이 있으면 댓글남겨주세요. 감사합니다.
4. [음성합성] INVALID_ARGUMENT, WAV header indicates 해결Exception: OS error: RetryError(Exception occurred in retry method that was not classified as transient, caused by ) pip install librosa==0.5.1 https://pypi.org/project/librosa/0.5.1/ librosa 버전 정확히 맞춰보세요. WAV header indicates 해결됩니다. 궁금한 점이 있으면 댓글남겨주세요. 감사합니다.
2019.04.06 -
https://doctorson0309.tistory.com/432 위의 글을 읽었다면, 음성 데이터를 다운을 시도하였을 것입니다. 그러나 간혹 아래와 같은 에러에 직면할 수도 있습니다. 'cp949' codec can't encode character '\xa0' 이것은 파일 열기와 관련된 파이썬 코드에 인코딩을 안 넣었다는 의미입니다. 더 확실하게 설명하자면, UTF-8로 저장되어 있는 텍스트 파일을 열라고 시켰는데 파이썬이 싫다고 에러를 뱉은 것입니다. 파이썬은 ANSI를 좋아하기 때문입니다. (??) ㅎㅎㅎ 텍스트 파일을 ANSI로 바꿔도 에러는 해결될 테지만, 아래와 같이 하는 것이 더 좋습니다. 기존에 아래와 같이 코딩되어 있을 것입니다. open("test1.txt", mode='w') 그것..
3. [음성합성] cp949 codec can't encode characterhttps://doctorson0309.tistory.com/432 위의 글을 읽었다면, 음성 데이터를 다운을 시도하였을 것입니다. 그러나 간혹 아래와 같은 에러에 직면할 수도 있습니다. 'cp949' codec can't encode character '\xa0' 이것은 파일 열기와 관련된 파이썬 코드에 인코딩을 안 넣었다는 의미입니다. 더 확실하게 설명하자면, UTF-8로 저장되어 있는 텍스트 파일을 열라고 시켰는데 파이썬이 싫다고 에러를 뱉은 것입니다. 파이썬은 ANSI를 좋아하기 때문입니다. (??) ㅎㅎㅎ 텍스트 파일을 ANSI로 바꿔도 에러는 해결될 테지만, 아래와 같이 하는 것이 더 좋습니다. 기존에 아래와 같이 코딩되어 있을 것입니다. open("test1.txt", mode='w') 그것..
2019.04.01 -
https://doctorson0309.tistory.com/431 음성합성 설치에 이어서 두번째 오류 보고의 시간입니다. 위의 게시물을 잘 읽었다면 의 난관을 넘었을 것입니다. 이번엔 데이터 셋 다운로드에 대해서 얘기해보려합니다. 얘기에 앞서서 한 가지 명령어를 전달합니다. > python -m datasets.son.download 이것은 "현재 디렉터리에서부터 datasets 폴더 안에 son폴더 안에 download.py를 실행" 하는 명령어입니다. 위 명령어는 음성합성 프로젝트의 가장 상위에서 실행해야합니다. 안 그러면 No module named 'datasets'의 오류를 만나게 됩니다. 혹시 음성합성 프로젝트의 가장 상위에서 실행한다는 것이 헷갈린다면 아래의 사진을 참고해보세요. 해당 명령..
2. [음성합성] 데이터 셋 다운로드 오류 대처https://doctorson0309.tistory.com/431 음성합성 설치에 이어서 두번째 오류 보고의 시간입니다. 위의 게시물을 잘 읽었다면 의 난관을 넘었을 것입니다. 이번엔 데이터 셋 다운로드에 대해서 얘기해보려합니다. 얘기에 앞서서 한 가지 명령어를 전달합니다. > python -m datasets.son.download 이것은 "현재 디렉터리에서부터 datasets 폴더 안에 son폴더 안에 download.py를 실행" 하는 명령어입니다. 위 명령어는 음성합성 프로젝트의 가장 상위에서 실행해야합니다. 안 그러면 No module named 'datasets'의 오류를 만나게 됩니다. 혹시 음성합성 프로젝트의 가장 상위에서 실행한다는 것이 헷갈린다면 아래의 사진을 참고해보세요. 해당 명령..
2019.04.01 -
0. 서론 유투브에서 우연히 음성합성 영상을 보았습니다. 프로그램이 문재인 목소리를 학습하여, 개발자가 입력한 텍스트를 읽는데 놀라웠습니다. carpedm20/multi-speaker-tacotron-tensorflow Multi-speaker Tacotron in TensorFlow. Contribute to carpedm20/multi-speaker-tacotron-tensorflow development by creating an account on GitHub. github.com 소스코드도 깃허브에 공유해주셨습니다. 깃허브의 상세내용을 참고하여 개발 환경 세팅을 시도하였습니다. 실행에 앞써서 포스트 작성자의 파이썬은 3.6.2rc1버전을 설치하였고 tenserflow는 1.3 버전을 설치하였습니..
1. [음성합성] 개발환경 구축 및 패키지 소프트웨어 설치0. 서론 유투브에서 우연히 음성합성 영상을 보았습니다. 프로그램이 문재인 목소리를 학습하여, 개발자가 입력한 텍스트를 읽는데 놀라웠습니다. carpedm20/multi-speaker-tacotron-tensorflow Multi-speaker Tacotron in TensorFlow. Contribute to carpedm20/multi-speaker-tacotron-tensorflow development by creating an account on GitHub. github.com 소스코드도 깃허브에 공유해주셨습니다. 깃허브의 상세내용을 참고하여 개발 환경 세팅을 시도하였습니다. 실행에 앞써서 포스트 작성자의 파이썬은 3.6.2rc1버전을 설치하였고 tenserflow는 1.3 버전을 설치하였습니..
2019.04.01