Đọc văn bản với Google TTS

Chào các bạn hôm nay mình sẽ hướng dẫn các bạn cách đọc hay chuyển một đoạn văn bản (text) sang âm thanhh (sound).


1. TTS - Text-To-Speech là gì ?

Text-To-Speech hay còn được viết tắt là TTS, là một kĩ thuật rất phổ biến ngày nay. TTS giúp bạn chuyển một đoạn văn bản (text) sang dạng âm thanh (sound).

2. Ứng dụng

            TTS có rất nhiều ứng dụng như:

  • Đọc tin tức ở các trang tin tức trực tuyến
  • Áp dụng vào các hệ thống robot / chatbot để tang khả năng tương tác với con người.

3. Cài đặt

- Việc cài đặt thư viện TTS rất đơn giản. Hiện nay có rất nhiều thư viện hỗ trợ bạn việc này. Tuy nhiên, có một thư viện vừa dễ dàng cài đặt nhưng lại có giọng đọc khá giống người thật là: gTTS (Google Text-To-Speech). Bạn chạy lệnh sau để cài đặt:

sudo pip3 install gTTS

- Sau khi cài đặt thành công bạn có thể tạo một file python và thử ngay nhé:

sudo nano tts.py

- Đoạn code mẫu như sau:

from gtts import gTTS

import os

tts = gTTS(text='Good morning', lang='en')

#tts = gTTS(text='Xin chào', lang='vi')

# tts = gTTS(text='안녕하세요', lang='ko')

tts.save("speech.mp3")

- Sau đó, chúng ta mở file `speech.mp3` để nghe kết quả nhé:

aplay speech.mp3

hoặc

omxplayer speech.mp3

Vậy là xong rồi đấy ! Thật đơn giản phải không nào. Bạn có thể dùng OCR để trích xuất text từ file hình và dùng TTS để chuyển sang âm thanh nhé ! Nghe là đã thấy thú vị rồi.

Chúc bạn thành công !

 

Tham khảo:

Bạn có thể xem thêm tại repository sau: https://gitlab.com/fpo-outsource/ocr-and-tts

Có thể bạn quan tâm ???