Open AI 음성 받아쓰기 Whisper 사용해보자 파이썬 실생활 머신러닝 예제 적용
뱁새유니버스
1. 개요 Open AI에 Whisper라는 음성인식 AI가 있습니다. Whisper는 input data를 mp3(음성파일)을 분석해 Output data로 음성을 텍스트로 전환해주는 AI입니다. 실생활에도 정말 많이 쓰이죠. 유튜브 자동 자막 기능이라던지, 네이버 클로버노트를 통해 음성을 텍스트로 실시간 번역해주는 것들처럼 말이죠. 그럼에도 Whisper 같은 AI가 왜 대단하냐? AI기술을 이제 프로그램을 조금만 알아도 많은 사람들이 개인화할 수 있는 시대가 열릴 것 같기 때문입니다. 파이썬을 통해 명령어 몇줄만으로도 실시간 음성인식이 가능하기 떄문입니다. 물론 네이버 클로버노트와 같은 훌륭한 프랜차이즈 앱들이 있지만 개인이 충분히 구현하고 누릴 수 있는 것들이 나오고 있어 개발을 조금이라도 할 줄..