반응형 공개데이터1 [TTS] Text-To-Speech 음성 합성을 위한 AI허브 데이터 신청하기 AI 허브에서 제공 중인 감정 음성합성 데이터셋을 이용하여 음성 합성을 진행했다. 데이터 설명 30대 여성 성우 1인, 7가지 감정에 대하여 각각 3,000개 발화, 총 21,000개 음성 파일 데이터 구조 raw 폴더 아래에 acriil_(감정)_(문장번호).raw 파일 존재 해당 파일은 16bit, mono, 16KHz, PCM format의 음성 파일임 txt 폴더 아래에 acriil_(감정)_(문장번호).txt 파일이 해당 pcm 파일의 텍스트 실제 발화 내용(발음)에 따라 텍스트가 수정되었으므로 txt 파일은 감정에 따라 상이할 수 있음 링크: https://aihub.or.kr/opendata/keti-data/definition-tech/KETI-05-001 감정 음성합성 데이터셋 | AI .. 2022. 2. 4. 이전 1 다음 반응형