Khám phá công nghệ giọng nói AI được Dân trí tiên phong phát triển thành báo nói

Thứ sáu, 24/05/2019 09:22 AM - 0 Trả lời

Báo điện tử Dân trí vừa tiên phong tích hợp thêm phiên bản báo nói, cho phép các độc giả có thể nghe nội dung của các bài viết thay vì phải đọc chữ như trước đây. Phiên bản này của Dân trí ứng dụng công nghệ trí tuệ nhân tạo hiện đại do Trung tâm Không gian Mạng Viettel xây dựng và phát triển.

Khi truy cập vào trang web của báo điện tử Dân trí trên máy hoặc thiết bị di động, các độc giả sẽ thấy xuất hiện phía dưới tiêu đề là tùy chọn “Báo nói Dân trí”, mà người dùng có thể nhấn vào đây để có thể nghe  nội dung của bài báo, thay vì phải tự đọc.

Điều này giúp người dùng có thể trải nghiệm nội dung bài báo tốt hơn mà không cần phải mất thời gian tập trung vào màn hình, vừa có thể theo dõi bài báo, vừa có thể thư giãn cho đôi mắt.

Để phù hợp với sở thích và vùng miền mình đang sinh sống, độc giả có thể tùy chọn giọng đọc là nam hoặc nữ, giọng nói miền Nam hoặc miền Bắc, giúp nghe rõ và chính xác hơn về nội dung của bài báo.

Tùy chọn giọng đọc của phiên bản báo nói Dân trí giúp phù hợp với nhu cầu của độc giả

Tùy chọn giọng đọc của phiên bản báo nói Dân trí giúp phù hợp với nhu cầu của độc giả

Áp dụng công nghệ hiện đại nhất trong lĩnh vực trí tuệ nhân tạo

Phiên bản báo nói của Dân trí là thành quả kết hợp giữa báo điện tử Dân trí và Trung tâm Không gian Mạng Viettel (VTCC).  Bằng việc nghiên cứu áp dụng công cụ chuyển đổi văn bản thành giọng nói tiếng Việt tự nhiên (VTCC.AI) do VTCC xây dựng và phát triển, báo Dân trí đã thực hiện thành công việc đưa báo nói lên web.

Về công nghệ, các kỹ sư nhóm xử lý tiếng nói của VTCC đã sử dụng công nghệ hiện đại nhất trong lĩnh vực trí tuệ nhân tạo như mạng nơron học sâu để sản sinh ra tiếng nói Tiếng Việt với ngữ điệu tự nhiên, đa dạng và dễ dàng tích hợp trên các hệ thống.

VTCC.AI sử dụng công nghệ học sâu (deep learning) tiên tiến thay vì áp dụng các kỹ thuật truyền thống như HMM (Hidden Markov Model) hay ghép nối các từ... giúp cho giọng đọc tự nhiên, liền mạch, ngắt nghỉ, kết hợp với biểu cảm chính xác.

Sản phẩm này đạt được giải nhất trong cuộc thi xử lý ngôn ngữ tiếng Việt (VLSP 2018) với số điểm vượt trội so với các đối thủ cả về độ tự nhiên lẫn mức độ rõ ràng và được các chuyên gia đánh giá cao. 

Công cụ báo nói Dân trí giúp độc giả có thể theo dõi nội dung bài báo vừa có thể thư giãn mà không cần phải tập trung vào màn hình

Công cụ báo nói Dân trí giúp độc giả có thể theo dõi nội dung bài báo vừa có thể thư giãn mà không cần phải tập trung vào màn hình

Giọng đọc Bắc, Nam

Với việc sử dụng các công nghệ tiên tiến thế giới về xử lý ngôn ngữ tự nhiên, xử lý tiếng nói, học sâu, hệ thống tổng hợp giọng nói cho báo Dân trí sinh ra 3 giọng đọc cho người dùng lựa chọn theo giọng Nam/Bắc, Nam/Nữ  nên với một triệu bài viết sẽ sinh ra số bài báo đọc tương ứng là 3 triệu, đòi hỏi rất nhiều tài nguyên của cả Dantri.com.vnvà VTCC.

Để đáp ứng nhu cầu của độc giả, VTCC và hệ thống báo nói Dân tríhiện đang sử dụng số lượng lớn các máy chủ mạnh với công nghệ tính toán song song cho phép đáp ứng nhanh chóng mọi yêu cầu của bạn đọc, đội ngũ kỹ thuật đã tăng cường hệ thống hạ tầng server, băng thông, tối ưu thuật toán nén dữ liệu để đảm bảo bạn đọc nghe được nhanh nhất, ngay cả trong các trường hợp truy cập tăng đột biến.

Chất lượng giọng nói tiếng Việt của VTCC.AI vượt trội so với với sản phẩm tương tự, chẳng hạn như công cụ chuyển đổi văn bản thành giọng nói tiếng Việt của Google, cả về âm điệu, cách ngắt câu, thể hiện biểu cảm...

Khi sử dụng công cụ báo nói Dân trí, độc giả rất khó để có thể nhận ra rằng những giọng đọc ở trên trang web đều là giọng đọc nhân tạo, bởi giọng điệu hết sức tự nhiên.

Dantri.com.vn là báo nói đầu tiên tích hợp với VTCC nên ban đầu còn gặp nhiều khó khăn, ví dụ cụm các thuật ngữ chuyên ngành, cụm từ viết tắt... Đội ngũ kỹ thuật đã phải thử nghiệm trên hàng triệu mẫu giọng để chọn ra giọng đọc phù hợp nhất và dự kiến sẽ còn tiếp tục cải thiện các tính năng của phiên bản báo nói, giúp mang đến độc giả Dân trí trải nghiệm tốt nhất.

Theo T.Thủy (dantri.com.vn)

Tin khác

Ấn tượng về hiện vật tô thắm Chiến thắng Điện Biên Phủ vẻ vang

Ấn tượng về hiện vật tô thắm Chiến thắng Điện Biên Phủ vẻ vang

(CLO) Trong những ngày tháng diễn ra Chiến dịch Điện Biên Phủ, đã có những bài báo, những bức ảnh ghi lại những khoảnh khắc lịch sử hào hùng, phản ánh chân thực, sinh động nhất về diễn biến Chiến dịch Điện Biên Phủ và 56 ngày đêm chiến đấu kiên cường… Những câu chuyện ấy phần nào được kể qua hiện vật trưng bày tại Bảo tàng Báo chí Việt Nam hôm nay.

Nghề báo
Phát động cuộc thi ảnh báo chí, ảnh nghệ thuật toàn quốc về Quân đội nhân dân Việt Nam

Phát động cuộc thi ảnh báo chí, ảnh nghệ thuật toàn quốc về Quân đội nhân dân Việt Nam

(CLO) Chiều 26/4, tại Hà Nội, Tổng cục Chính trị Quân đội nhân dân Việt Nam tổ chức họp báo giới thiệu Cuộc thi ảnh báo chí, nghệ thuật toàn quốc về Quân đội nhân dân Việt Nam và Quốc phòng toàn dân năm 2024.

Nghề báo
Đài Truyền hình Việt Nam sẽ phát sóng nhiều chương trình đặc sắc về Chiến thắng Điện Biên Phủ

Đài Truyền hình Việt Nam sẽ phát sóng nhiều chương trình đặc sắc về Chiến thắng Điện Biên Phủ

(CLO) Kỷ niệm 70 năm Chiến thắng Điện Biên Phủ, Đài Truyền hình Việt Nam thực hiện nhiều chương trình trọng điểm, phát sóng đa nền tảng trên các kênh và nền tảng số của VTV.

Nghề báo
Gần 100 hội viên học tập chuyên đề làm theo tư tưởng, đạo đức, phong cách Hồ Chí Minh

Gần 100 hội viên học tập chuyên đề làm theo tư tưởng, đạo đức, phong cách Hồ Chí Minh

(CLO) Ngày 26/4, Hội Nhà báo tỉnh Bình Dương đã tổ chức hội nghị học tập và làm theo tư tưởng, đạo đức, phong cách Hồ Chí Minh cho gần 100 hội viên, nhà báo đang công tác tại các cơ quan báo chí trong tỉnh.

Nghề báo
Báo Khánh Hòa thực hiện chương trình “Đồng hành cùng ngư dân”

Báo Khánh Hòa thực hiện chương trình “Đồng hành cùng ngư dân”

(CLO) Nhân dịp kỷ niệm 77 năm ngày truyền thống Báo Khánh Hòa, ngày 26/4, Báo Khánh Hòa tiếp tục phối hợp với Công ty Cổ phần Nước giải khát yến sào Khánh Hòa thực hiện chương trình “Đồng hành cùng ngư dân”.

Nghề báo