Google AI Edge Eloquent: Giải pháp nhập liệu bằng giọng nói thay thế bàn phím truyền thống
Google vừa giới thiệu ứng dụng AI Edge Eloquent trên iOS, sử dụng mô hình Gemma để chuyển đổi giọng nói thành văn bản offline và tự động biên tập nội dung chuyên nghiệp.
Google AI Edge Eloquent là ứng dụng chuyển đổi giọng nói thành văn bản mới nhất trên iOS, đánh dấu bước tiến mới trong việc nhập liệu trên smartphone. Khác với các công cụ truyền thống, ứng dụng này không chỉ ghi chép thô mà còn hiểu và tối ưu hóa nội dung theo ngữ cảnh người dùng.
Công nghệ nhận dạng giọng nói offline đột phá
Trái tim của Google AI Edge Eloquent là các mô hình nhận dạng giọng nói Gemma, cho phép ứng dụng hoạt động hoàn toàn mà không cần kết nối internet. Việc xử lý trực tiếp trên thiết bị giúp đảm bảo quyền riêng tư tối đa cho dữ liệu người dùng, đồng thời giảm thiểu độ trễ trong quá trình hiển thị văn bản theo thời gian thực.
Đáng chú ý, hệ thống có khả năng tự động loại bỏ các từ đệm phổ biến như “um”, “ah”. Khi người dùng dừng nói, AI sẽ thực hiện chỉnh sửa câu chữ để văn bản trở nên rõ ràng và mạch lạc hơn, tương đương với một đoạn văn đã qua biên tập chuyên nghiệp.

Tích hợp AI Gemini và khả năng cá nhân hóa
Bên cạnh khả năng xử lý nội bộ, Google AI Edge Eloquent còn cung cấp tùy chọn kết nối đám mây để tận dụng sức mạnh của Gemini. Khi kích hoạt chế độ này, người dùng có thể tóm tắt ý chính, thay đổi văn phong hoặc điều chỉnh độ dài văn bản một cách linh hoạt.
Để tăng cường độ chính xác, ứng dụng cho phép bổ sung từ vựng cá nhân như tên riêng hoặc các thuật ngữ chuyên ngành. Toàn bộ lịch sử nhập liệu được lưu trữ khoa học, hỗ trợ tìm kiếm nhanh và cung cấp các thống kê chi tiết về tốc độ nói cũng như tổng số lượng từ đã ghi nhận.
Tương lai của phương thức soạn thảo văn bản
Hiện tại, Google AI Edge Eloquent mới chỉ xuất hiện trên nền tảng iOS. Tuy nhiên, nhiều nguồn tin cho biết phiên bản dành cho Android đang được phát triển tích cực với khả năng tích hợp sâu hơn vào hệ điều hành. Dự kiến, ứng dụng có thể hoạt động dưới dạng nút nổi toàn hệ thống hoặc thậm chí thay thế hoàn toàn bàn phím mặc định.
Sự ra đời của AI Edge Eloquent cho thấy xu hướng nhập liệu bằng giọng nói đang bước sang giai đoạn mới. Nếu được phổ biến rộng rãi, phương thức soạn thảo bằng lời nói có thể trở thành thói quen sử dụng chính trên các thiết bị di động trong tương lai gần.


