Skip to content

음성공학 관련 데이터 전처리 #1054

@jmj3047

Description

@jmj3047

해결하고자 하는 문제

안녕하세요 음성공학을 전공하고 있는 학생입니다.
음성으로 인공신경망 모델을 만들려고 하니 데이터 전처리가 힘들어서 질문드립니다.
우선 간단하게 단어 인식 모델을 google command speech data를 사용해서 만들어 보고 싶은데
데이터 전처리를 어떻게 해야 할지 몰라서 질문드립니다.

환경

텐서플로우
vs code
python

시도해본 방법

구글에 word detection이라고 검색하면 대부분 Speech Recognition 모델을 사용해서
실제로 사용자가 말을 하고 구글의 API를 가지고 와서 그 단어를 인식하는 방향으로 되어 있는데
제가 하고 싶은 단어 인식은 단어 10개 정도를 학습 시키고, 새로운 input data가 들어있을때
그 data가 10개의 단어에 있는지 아닌지, 그리고 10개의 단어에 해당이 된다면 어떤 단어인지를
맞추는 모델을 만들고 싶습니다.
feature를 추출하는 법이나 모델을 만들어서 학습하는 법은 어느정도 공부할수 있으나, feature를 추출해서
학습모델에 적용하기 전인 데이터 전처리 부분이 어려워 계속 찾아보다가 질문드립니다.
이런 데이터 전처리 부분은 어떤식으로 공부해야 하나요? 추천하실만한 책이나 강의가 있을까요?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions