네이버음성합성
-
네이버 음성합성의 train.py 파이썬 프로그램을 실행하다가 아래와 같은 에러에 직면하였습니다. 에러명 : not a git repository 에러원인 : 처음에 실행환경을 구축할 때, git clone이 아니라 zip파일로 받아서 그렇습니다. 해결방법 : git으로 commit하는 소스코드에 대하여 주석처리를 진행합니다. 아래의 파일을 참고하시면 됩니다. 잘 동작하는 소스코드입니다. 추가로 질문사항이 있으면 댓글에 남겨주세요. 감사합니다.
8. 네이버 음성합성, not a git repository 해결네이버 음성합성의 train.py 파이썬 프로그램을 실행하다가 아래와 같은 에러에 직면하였습니다. 에러명 : not a git repository 에러원인 : 처음에 실행환경을 구축할 때, git clone이 아니라 zip파일로 받아서 그렇습니다. 해결방법 : git으로 commit하는 소스코드에 대하여 주석처리를 진행합니다. 아래의 파일을 참고하시면 됩니다. 잘 동작하는 소스코드입니다. 추가로 질문사항이 있으면 댓글에 남겨주세요. 감사합니다.
2019.04.11 -
음성합성을 진행하다보면 alignment.json에 음성과 텍스트를 쌍을 저장하기 위해서 아래의 명령어를 실행할 때가 있다. python -m recognition.alignment --recognition_path "./datasets/son/recognition.json" --score_threshold=0.5 --recognition_encoding="utf-8" 상황에 따라 다를 수도 있겠지만, 인코딩 이슈 또는 IndexError list index out of range에러를 만날 것이다. 인코딩 이슈를 만났을 경우 에러명 : UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 51: illegal multibyte seq..
6. [음성합성] IndexError list index out of range 해결음성합성을 진행하다보면 alignment.json에 음성과 텍스트를 쌍을 저장하기 위해서 아래의 명령어를 실행할 때가 있다. python -m recognition.alignment --recognition_path "./datasets/son/recognition.json" --score_threshold=0.5 --recognition_encoding="utf-8" 상황에 따라 다를 수도 있겠지만, 인코딩 이슈 또는 IndexError list index out of range에러를 만날 것이다. 인코딩 이슈를 만났을 경우 에러명 : UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 51: illegal multibyte seq..
2019.04.07 -
recognition.google --audio_pattern을 실행해보았습니다. Google Speech Recognition API 를 사용하여, 오디오에 대한 문장을 출력해줍니다. > python -m recognition.google --audio_pattern "./datasets/son/audio/*.*.wav" 약... 4시간? 이 걸린 것으로 기억합니다. 해당 작업이 끝나면 275$ (약 28만원)을 사용하게 됩니다. ㄷㄷ 실행 중에 아래와 같은 에러에 직면할 수도 있습니다. 에러 발생 : cp949 codec can't decode byte 0xec in position illgall multibyte sequence 에러 원인 : cp949는 인코딩 문제입니다. 해결방법 : recogr..
5. [음성합성] recognition.google --audio_patternrecognition.google --audio_pattern을 실행해보았습니다. Google Speech Recognition API 를 사용하여, 오디오에 대한 문장을 출력해줍니다. > python -m recognition.google --audio_pattern "./datasets/son/audio/*.*.wav" 약... 4시간? 이 걸린 것으로 기억합니다. 해당 작업이 끝나면 275$ (약 28만원)을 사용하게 됩니다. ㄷㄷ 실행 중에 아래와 같은 에러에 직면할 수도 있습니다. 에러 발생 : cp949 codec can't decode byte 0xec in position illgall multibyte sequence 에러 원인 : cp949는 인코딩 문제입니다. 해결방법 : recogr..
2019.04.06 -
https://doctorson0309.tistory.com/431 음성합성 설치에 이어서 두번째 오류 보고의 시간입니다. 위의 게시물을 잘 읽었다면 의 난관을 넘었을 것입니다. 이번엔 데이터 셋 다운로드에 대해서 얘기해보려합니다. 얘기에 앞서서 한 가지 명령어를 전달합니다. > python -m datasets.son.download 이것은 "현재 디렉터리에서부터 datasets 폴더 안에 son폴더 안에 download.py를 실행" 하는 명령어입니다. 위 명령어는 음성합성 프로젝트의 가장 상위에서 실행해야합니다. 안 그러면 No module named 'datasets'의 오류를 만나게 됩니다. 혹시 음성합성 프로젝트의 가장 상위에서 실행한다는 것이 헷갈린다면 아래의 사진을 참고해보세요. 해당 명령..
2. [음성합성] 데이터 셋 다운로드 오류 대처https://doctorson0309.tistory.com/431 음성합성 설치에 이어서 두번째 오류 보고의 시간입니다. 위의 게시물을 잘 읽었다면 의 난관을 넘었을 것입니다. 이번엔 데이터 셋 다운로드에 대해서 얘기해보려합니다. 얘기에 앞서서 한 가지 명령어를 전달합니다. > python -m datasets.son.download 이것은 "현재 디렉터리에서부터 datasets 폴더 안에 son폴더 안에 download.py를 실행" 하는 명령어입니다. 위 명령어는 음성합성 프로젝트의 가장 상위에서 실행해야합니다. 안 그러면 No module named 'datasets'의 오류를 만나게 됩니다. 혹시 음성합성 프로젝트의 가장 상위에서 실행한다는 것이 헷갈린다면 아래의 사진을 참고해보세요. 해당 명령..
2019.04.01 -
0. 서론 유투브에서 우연히 음성합성 영상을 보았습니다. 프로그램이 문재인 목소리를 학습하여, 개발자가 입력한 텍스트를 읽는데 놀라웠습니다. carpedm20/multi-speaker-tacotron-tensorflow Multi-speaker Tacotron in TensorFlow. Contribute to carpedm20/multi-speaker-tacotron-tensorflow development by creating an account on GitHub. github.com 소스코드도 깃허브에 공유해주셨습니다. 깃허브의 상세내용을 참고하여 개발 환경 세팅을 시도하였습니다. 실행에 앞써서 포스트 작성자의 파이썬은 3.6.2rc1버전을 설치하였고 tenserflow는 1.3 버전을 설치하였습니..
1. [음성합성] 개발환경 구축 및 패키지 소프트웨어 설치0. 서론 유투브에서 우연히 음성합성 영상을 보았습니다. 프로그램이 문재인 목소리를 학습하여, 개발자가 입력한 텍스트를 읽는데 놀라웠습니다. carpedm20/multi-speaker-tacotron-tensorflow Multi-speaker Tacotron in TensorFlow. Contribute to carpedm20/multi-speaker-tacotron-tensorflow development by creating an account on GitHub. github.com 소스코드도 깃허브에 공유해주셨습니다. 깃허브의 상세내용을 참고하여 개발 환경 세팅을 시도하였습니다. 실행에 앞써서 포스트 작성자의 파이썬은 3.6.2rc1버전을 설치하였고 tenserflow는 1.3 버전을 설치하였습니..
2019.04.01