SPEECH TO TEXT với RASPBERRY PI và JASPER

Trong bài blog này, MechasolutionVN sẽ giới thiệu một công cụ rất hữu ích cho các ứng dụng dựa trên giọng nói - Jasper. Jasper là một dịch vụ cung cấp cho Raspberry Pi, cho phép bạn có thể tích hợp Speech to Text và Text to Speech vào trong các ứng dụng của mình. Bên cạnh đó Jasper còn có thể chạy trên các nền tảng ArchLinux, Raspian và Debian.


 

Jasper project là một platform mở, dành cho các developer có thể sử dụng và phát triển các ứng dụng có liên quan đến STT (Speech to Text) và TTS (Text to speech) trên Raspberry Pi. Jasper được phát triển dành riêng cho Raspberry Pi, chính vì thế nó là bộ công cụ tương thích nhất dành cho Raspberry Pi khi đụng đến vấn đề STT. Ngoài ra, Jasper còn hỗ trợ các ứng dụng như Weather, Spotify, … Các bạn có thể hiểu rằng, Jasper như một Alexa đơn giản.

Trong bài này, Mechasolution sẽ sử dụng Microphone là RESPEAKER. Các bạn có thể xem qua bài blog này trước, để cài đặt và tìm hiểu về RESPEAKER cho RASPBERRY PI: https://mechasolution.vn/Blog/gioi-thieu-va-cai-dat-respeaker

 

Cài đặt:

Bước 1: Cài đặt Jasper

Trong file home của các bạn, các bạn hãy clone repository của jasper xuống:

git clone https://github.com/jasperproject/jasper-client.git jasper

Để cài đặt Jasper, cần có những thư viện của Python, chúng ta sẽ cài đặt qua command sau:

sudo pip install --upgrade setuptools
sudo pip install -r jasper/client/requirements.txt

Sau đó là bước cuối cùng để làm cho file jasper.py có thể chạy được:

chmod +x jasper/jasper.py

 

Bước 2: Cài đặt Google STT

Jasper cần một STT engine để hoạt động, ở đây Mecha chọn Google STT engine. Để sử dụng Google STT engine, các bạn cần một API key của Google. Để lấy key API, các bạn tạo 1 project trên Google Developer’s Console.

Sau đó các bạn chọn project của mình, chuyển xuống mục API và khởi động Speech API. Sau đó chọn mục “Credentials”. Tạo một key mới và các bạn nhớ lưu key này lại nhé.

 

 

 

 

 

Bước 3: Config Jasper

Các bạn hãy quay lại Raspberry Pi của mình, mở một terminal lên và chạy dòng command sau:

cd ~/jasper/client
python populate.py

Sau đó quáy trình config Raspberry pi sẽ diễn ra, các bạn cần cung cấp thông tin. Tuy nhiên có một mục gmail, có yêu cầu password. Nếu các bạn thấy không thoải mái thì có thể không cung cấp. Jasper sẽ cần dùng username và password của tài khoản google của các bạn để thông báo và bật notification. Tuy nhiên điều này là tùy chọn của các bạn.

Các bạn chú ý, khi được hỏi về STT engine, các bạn hãy điền vào google

Sau đó các bạn chỉ  cần điền vào API key của mình.

Kế tiếp các bạn hãy vào profile của mình bằng command sau:

cd ~/.jasper
nano profile.yml

Các bạn hãy thêm vào cuối file dòng sau: tts-engine: google-tts

Sau đó các bạn lưu lại và cài đặt google TTS bằng commands sau:

sudo apt-get install python-pymad
sudo pip install --upgrade gTTS

Sau đó là mọi thứ đã hoàn tất rất. Nếu các bạn muốn điều chỉnh thêm gì, thì các bạn có thể vào file ~/jasper/profile.yml để config nhé.

Bước 4: Test

Các bạn hãy chạy command sau để chạy file jasper.py:

/home/pi/jasper/jasper.py

Khi test, mỗi lần bạn nói gì vào RESPEAKER, Teminal sẽ hiện ra những cụm từ bạn đã nói hoặc có thể đã nói.

Chúc các bạn thành công. Nếu các bạn có thắc mắc gì, đừng ngại mà gửi mail về cho chúng tôi nhé.

 

 

Tham Khảo:

http://jasperproject.github.io/documentation/usage/

 

Phúc Khang - Mechasolution.

Có thể bạn quan tâm ???