Chuẩn hóa văn bản
Khi một văn bản thể hiện đúng các quy tắc thì sẽ cho ra một giọng đọc tốt và ít khi xảy ra lỗi giọng đọc. Như vậy văn bản như nào thì đúng với quy tắc?
1. Chính tả và ngữ pháp
Chính tả: Sử dụng chính tả đúng để AI đọc không bị nhầm lẫn. Đảm bảo rằng các từ viết đúng, đặc biệt là những từ dễ nhầm lẫn.
Phần này có thể kiểm tra từng đoạn bằng tính năng nghe thử (không bị trừ kí tự) trước khi Chuyển văn bản. Hướng dẫn nghe thửhttps://help.vbee.vn/huong-dan-su-dung/chuyen-van-ban/tinh-nang-ho-tro/nghe-thu
Ngữ pháp: Tuân thủ các quy tắc ngữ pháp trong tiếng Việt như chia động từ, sử dụng dấu câu, cấu trúc câu.
2. Dấu câu
Quy tắc đặt dấu câu đúng trong 1 văn bản:
Dấu câu cuối câu:
Khi một câu kết thúc bằng dấu câu (chấm, dấu hỏi, dấu chấm than, v.v.), bạn cần đảm bảo có một khoảng cách giữa dấu câu và từ đầu của câu tiếp theo. Khoảng cách này là 1 dấu cách (space).
Ví dụ:
Dấu câu đặt sai | Dấu câu đặt đúng |
---|---|
Tôi sẽ đi chợ.Bạn có đi với tôi không ? | Tôi sẽ đi chợ. Bạn có đi với tôi không? |
Cô ấy đang dọn dẹp .Tôi đang rửa bát . | Cô ấy đang dọn dẹp. Tôi đang rửa bát. |
Thế à?Tôi không biết.Bạn kể tối nghe nhé! | Thế à? Tôi không biết. Bạn kể tôi nghe nhé! |
Dấu câu giữa câu:
Dấu phẩy, chấm phẩy, dấu hai chấm: Sau dấu câu này bạn vẫn phải đặt dấu cách khi tiếp tục văn bản.
Ví dụ:
Dấu câu đặt sai | Dấu câu đặt đúng |
---|---|
Tôi mua sữa,bánh mì,và trứng. | Tôi mua sữa, bánh mì, và trứng. |
Cô ấy nói:"Hãy cẩn thận." | Cô ấy nói: "Hãy cẩn thận." |
Tôi thích đọc sách,nghe nhạc,đi bộ. | Tôi thích đọc sách, nghe nhạc, đi bộ. |
Dấu gạch ngang (–)
Vị trí: Đặt dấu gạch ngang giữa các thành phần câu khi cần nhấn mạnh hoặc phân tách thông tin.
Lưu ý: Dấu gạch ngang thường được dùng để thay thế dấu phẩy, dấu chấm phẩy, hoặc dấu hai chấm trong một số tình huống.
Ví dụ: Anh ấy – người mà tôi rất tin tưởng – đã giúp tôi hoàn thành công việc.
Dấu ngoặc đơn (()) và ngoặc kép ("")
Vị trí: Ngoặc đơn: Đặt dấu ngoặc đơn xung quanh thông tin bổ sung hoặc giải thích thêm.
Ngoặc kép: Đặt dấu ngoặc kép xung quanh lời nói của người khác hoặc trích dẫn.
Lưu ý: Đặt dấu ngoặc đơn và ngoặc kép ngay sau từ cần nhấn mạnh hoặc trích dẫn.
Ví dụ:
Tôi đã gặp một người (tên là Hoa) trong buổi lễ hôm qua.
Cô ấy nói: "Tôi sẽ đến vào lúc 10 giờ."
3. Định dạng văn bản
Đảm bảo có khoảng cách hợp lý giữa các đoạn văn, giữa các câu để văn bản dễ đọc. Mỗi văn bản cần chia đoạn một cách hợp lý (nhất là với các văn bản sử dụng giọng đọc nước ngoài) cần đảm bảo các yếu tố:
Văn bản không nên sử dụng các câu rời rạc, xuống dòng quá nhiều lần. Như vậy hệ thống sẽ không thể xử lí tốt văn bản, nên gom các câu lại thành các đoạn phù hợp như vậy hệ thống sẽ xử lý tốt hơn, giảm được các trường hợp chuyển văn bản bị thất bại.
Văn bản để đoạn liền quá dài cũng sẽ có thể dẫn đến việc tổng hợp thành giọng nói chưa được ổn định. Nên chia thành các đoạn phù hợp để việc chuyển đổi được xử lý tốt hơn
Ví dụ:
Trường hợp văn bản sử dụng các câu rời rạc:
Trường hợp văn bản để đoạn quá dài:
Định dạng văn bản đúng để hệ thống xử lý tốt nhất (chia đoạn phù hợp):
Trên đây là hướng dẫn chuẩn hóa văn bản và một số lưu ý trong quá trình nhập văn bản để chuyển thành giọng nói của Vbee. Khách hàng tham khảo để quá trình chuyển đổi diển ra tốt hơn. Vbee xin chân thành cảm ơn.
Last updated