Hãy nhớ những câu chuyện kinh dị từ những ngày Windows XP nhận dạng giọng nói? Tuy nhiên, đó là một mớ hỗn độn, với sự gia tăng của AI và học máy, việc chuyển lời nói thành văn bản (không phải văn bản thành giọng nói) đã trở nên đáng tin cậy và hiệu quả hơn bao giờ hết. Có rất nhiều ứng dụng chuyển giọng nói thành văn bản thực hiện điều này trong thời gian thực, nhưng nếu bạn muốn ghi âm giọng nói thành văn bản thì sao? Tôi đã tổng hợp danh sách các giải pháp tốt nhất để chuyển đổi bản ghi âm giọng nói thành văn bản trên điện thoại di động, trình duyệt web và PC của bạn. Hãy kiểm tra chúng ra.
>>> Tìm hiểu chi tiết: Bật mí 4 cách chuyển văn bản thành giọng nói tiếng Việt trên máy tính
Chuyển đổi bản ghi âm giọng nói thành văn bản
1. Bảng điểm
Phiên âm ghi âm cả video và âm thanh thành văn bản. Mặc dù ứng dụng miễn phí, nhưng ứng dụng kiếm tiền từ thời gian phiên âm hàng giờ. So với các tùy chọn cao hơn trong danh sách này như Happyscribe, mức giá khá hợp lý chỉ 4,99 đô la. Nhà phát triển không cho biết liệu họ đang sử dụng API chuyển lời nói thành văn bản như Google Cloud Input hay một giải pháp tùy chỉnh.
Ứng dụng đã đưa ra một lối thoát rõ ràng không có dấu chấm câu ở đây và ở đó. Anh ấy chỉ gặp vấn đề với những từ không rõ ràng hoặc hơi méo. Dù bằng cách nào, ứng dụng vẫn xuất ra từ gần nhất và làm tắc nghẽn quá trình phiên âm của chính nó. Tuy nhiên, lợi nhuận là rất lớn, một bước tiến rõ ràng từ các giải pháp miễn phí như Bear Converter và với mức 4,99 đô la mỗi giờ sao chép, nó sẽ không phá vỡ ngân hàng.
Độ chính xác: 96%
Cài đặt bản ghi (iOS)

2. Rái cá.AI
Otter là một ứng dụng phiên âm tuyệt vời dành cho sinh viên và giúp họ giảm bớt công việc ghi chép tẻ nhạt. Không chỉ sinh viên, nó phổ biến không kém với các chuyên gia sử dụng nó để ghi biên bản cuộc họp và hội nghị. Mặc dù nó được thiết kế để giải mã nhanh chóng, bạn vẫn có thể tải xuống bản ghi âm giọng nói từ bộ nhớ cục bộ và giải mã tệp âm thanh. Tất cả phiên âm diễn ra trên đám mây và bạn có hai tùy chọn tập lệnh. Bản nháp đầu tiên là bản ghi nhanh được tạo trong vòng vài giây và có thể có lỗi, tuy nhiên, âm thanh được xử lý lại trên đám mây và cải thiện đáng kể độ chính xác của bản ghi. Ứng dụng này miễn phí và có sẵn cho cả Android và iOS, bạn có thể giải mã lên đến 600 phút.
Trong quá trình thử nghiệm của mình, tôi thấy rằng ứng dụng vẫn rất chính xác và nhận được tất cả các từ chính xác, nó vẫn gặp khó khăn với các dấu chấm câu. Anh ấy cũng không thể xác định được bất kỳ thay đổi hạng mục nào, nhưng đó không phải là vấn đề lớn, làm sao tôi có thể chỉnh sửa kịch bản sau đó.
Độ chính xác: 94%
Cài đặt Otter (Android và iOS)

3. Người ghi chép may mắn
Happyscribe là tùy chọn trực tuyến đầu tiên trong danh sách này. Đây là một ưu đãi trả phí nhắm trực tiếp vào các chuyên gia, bao gồm cả các nhà báo và giá chắc chắn cho thấy điều này: Đăng ký trả tiền khi bạn đi theo kế hoạch có giá 12 euro mỗi giờ. Cần phải có một khoản thanh toán có ý nghĩa cho loại tiền đó. Nó có dạng thuật toán học máy tiên tiến cao của Happyscribe, được sử dụng để xác định và phiên âm giọng nói. Thuật toán của Happyscribe đủ nâng cao để nhận ra một số người nói khác nhau – nó làm cho quá trình vượt qua lần thứ hai nhanh hơn bằng cách cung cấp chế độ bản đồ nhiệt cho bạn biết chính xác vị trí trong bảng điểm mà thuật toán của nó đang gặp khó khăn. Bạn cũng nhận được nhiều tùy chọn xuất tệp, từ tài liệu từ và tệp văn bản thuần túy đến CPT tạm thời.
Anh ấy đã cho thấy những kết quả đáng kinh ngạc và gần như đúng tất cả các từ, anh ấy thậm chí còn tìm thấy một điểm thay đổi, điều này thật tuyệt nếu bạn có nhiều người nói trong một cuộc trò chuyện. Happyscribe có bản dùng thử miễn phí cho phép bạn sử dụng 30 phút phiên âm. Nhìn chung, nếu bạn đang tìm kiếm giải pháp văn bản âm thanh trực tuyến tốt nhất, thì Happyscribe là một lựa chọn tuyệt vời.
Độ chính xác: 99%
Kiểm tra Happyscribe

4. Sonics
Sonix rất giống với Happyscribe và nhắm đến cùng một thị trường mục tiêu – những người dùng doanh nghiệp muốn có một giải pháp phiên âm mạnh mẽ, được hỗ trợ bởi AI thực sự hoàn thành công việc, mặc dù chỉ bằng một phần nhỏ chi phí phiên mã của con người. Định giá của Sonix phản ánh điều này: Bạn đang xem đăng ký 11,25 đô la mỗi tháng cho một giấy phép người dùng ở mức cao nhất của tốc độ ghi 6 đô la mỗi giờ. Nếu bạn đang tìm cách xử lý âm lượng lớn, điều này làm cho nó cạnh tranh hơn Happyscribe, nhưng cái sau sẽ thắng đối với các trường hợp sử dụng âm lượng ít hơn. Sonix cũng có 30 phút dùng thử miễn phí, mặc dù bạn sẽ phải nhập thông tin thẻ tín dụng / thẻ ghi nợ của mình để truy cập. Chúng tôi đã thử nó và rất ngạc nhiên bởi chất lượng của bản sao.
Đọc: Đây là phần mềm phiên âm tốt nhất cho Mac
Như với Hyperscribe, Sonix đã hoạt động rất tốt. Không một từ nào được phiên âm sai. Một điểm khác cần lưu ý là Sonix mất ít thời gian hơn đáng kể để hoàn thành việc giải mã so với Happyscribe.
Độ chính xác: 97%
Kiểm tra Sonix

5. Công cụ chuyển đổi tệp Bear
Phần mềm phiên âm chuyên nghiệp có thể đắt tiền! Ngay cả khi bạn đang bỏ lỡ những bản ghi âm tốt nhất trong ngành, thì các lựa chọn thay thế miễn phí vẫn phù hợp hơn nếu ngân sách của bạn bằng không. Chúng tôi đã dùng thử Bear Converter như một tùy chọn miễn phí. Nó là một công cụ chuyển đổi đa phương tiện cho phép bạn chuyển đổi hầu hết mọi loại tệp sang bất kỳ loại tệp nào khác và nhân tiện, nó có một bộ chuyển đổi MP3 sang TXT sử dụng công cụ nhận dạng giọng nói của Baidu.
Mặc dù lời thú nhận của Baidu không hoàn hảo nhưng nó được phiên âm chính xác cho khoảng 70% bài phát biểu. Không tồi đối với một trình chuyển đổi phương tiện thậm chí không được quảng cáo như một chương trình phiên âm! Có một bìa 3MB trên các tệp âm thanh để phiên âm. Bạn có thể giảm kích thước tệp bằng cách mã hóa lại thành tốc độ bit thấp hơn, nhưng điều này chỉ có thể làm xấu đi khả năng nhận dạng.
Độ chính xác: 70%
Công cụ chuyển đổi tệp gấu

6. Sobolsoft MP3 to Text Converter
Sobolsoft có hơn 1500 ứng dụng và phiên âm âm thanh chỉ là một trong số đó. Sobolsoft Speech to Text Converter yêu cầu tùy chỉnh nhiều hơn một chút so với hầu hết. Để làm cho nó hoạt động, bạn cần có khóa IBM Speech to Text API. Watson’s Speech to the Text cung cấp cho bạn 100 phút phiên âm miễn phí mỗi tháng, sau đó sẽ được tính theo giá mỗi phút. Bản thân Sobolsoft có một phiên bản miễn phí và một phiên bản trả phí $ 19,99. Ngoài màn hình mè nheo, tôi không nhận thấy bất kỳ sự khác biệt đáng kể nào khi sử dụng phiên bản miễn phí.
Kết quả điểm chuẩn được hiển thị rõ ràng khi bạn đưa IBM Watson vào hình ảnh. Tuy nhiên, kết quả không tốt hơn một số ứng dụng nâng cao hơn ở trên, như Happyscribe và Otter. Nó không nhận ra bất kỳ dấu câu hoặc thay đổi đoạn văn nào.
Độ chính xác: 93%

Chuyển đổi Sable Mp3 sang Văn bản
Từ cuối cùng
Đây là những lựa chọn của tôi cho ứng dụng chuyển đổi giọng nói sang văn bản tốt nhất. Otter và Transcribe là giải pháp tốt nhất cho người dùng di động. Sonix rẻ hơn Hyperscribe nếu bạn định giải mã nhiều hơn. Sobolsoft MP3 to text là loại lỗi thời nhưng vẫn còn mới và mạnh mẽ trong xương. Bạn thích ứng dụng nào nhất trong danh sách này hoặc nếu bạn có giải pháp tốt hơn, hãy cho tôi biết trong phần bình luận bên dưới?