Realtime Screen Translation cho Game và Ứng dụng
Sử dụng EasyOCR hoặc PaddleOCR chạy cục bộ để dịch tự động theo thời gian thực. Hỗ trợ cửa sổ chat cho visual novel và dịch toàn màn hình.
Hỗ trợ nhiều LLM: Gemini, ChatGPT, Ollama và Google Translate. Dịch thuật nhận biết ngữ cảnh cho độ chính xác cao hơn.
Tối ưu hóa dịch thuật cho từng game cụ thể, xem xét ngữ cảnh trước đó và nhận dạng tên nhân vật/địa điểm.
Chức năng text-to-speech và khả năng dịch 100% cục bộ với Ollama.
Hiển thị văn bản dịch đè lên văn bản gốc trong vùng dịch được chọn (Hiện chỉ làm việc trên win 11).
Bằng cách cung cấp thông tin về game đang dịch và ngữ cảnh trước đó, bản dịch chính xác hơn các phương pháp khác.
Win + R
, gõ cmd
, và nhấn Enter) và gõ "conda". Nếu hiển thị các lệnh conda, bạn đã cài đặt. Nếu báo lỗi, hãy cài đặt Miniconda tại đây.Lưu ý: Bạn có thể sử dụng source_language và target_language trong prompt, ứng dụng sẽ tự động ánh xạ ngôn ngữ sang mã ngôn ngữ bạn đã chọn trong cài đặt. Ví dụ: nếu bạn chọn source_language=en và target_language=vi trong cài đặt, prompt gửi đến LLM sẽ được chuyển đổi thành "English" và "Vietnamese" trước khi gửi đến LLM tự động.
Lần đầu tiên bạn sử dụng EasyOCR hoặc PaddleOCR với một ngôn ngữ mới, nó phải tải xuống trước! Vì vậy, có thể có vẻ không hoạt động, chỉ cần đợi một hoặc hai phút và khởi động/dừng dịch của ứng dụng, nó sẽ hoạt động.
RSTGameTranslation sẽ tự động kiểm tra cập nhật khi bạn khởi động. Nếu có phiên bản mới, bạn sẽ thấy thông báo hỏi xem bạn có muốn tải xuống không. Để cập nhật:
Phím tắt | Chức năng | Ghi chú |
---|---|---|
Alt+G | Bắt đầu/Dừng | Hoạt động toàn cục |
Alt+Q | Chọn vùng dịch | Hoạt động toàn cục |
Alt+F | Hiện/Ẩn chế độ hiển thị văn bản dịch đè lên text gốc | Hoạt động toàn cục |
Alt+C | Hiện/Ẩn ChatBox | Hoạt động toàn cục |
Alt+P | Hiện/Ẩn Cài đặt | Hoạt động toàn cục |
Alt+L | Hiện/Ẩn bảng điều khiển nhật ký | Hoạt động toàn cục |
Mặc dù cá nhân tôi khuyên dùng Gemini Flash 2 lite và PaddleOCR (tốt hơn cho ngôn ngữ châu Á và sử dụng ít tài nguyên hơn), có nhiều tùy chọn khác nhau cho bạn. Bạn có thể sử dụng OCR tích hợp của Windows thay vì máy chủ python, điều này không hoạt động tốt cho tiếng Nhật nhưng có thể ổn cho các ngôn ngữ khác.
Đối với Ollama, hãy cài đặt nó và thiết lập một mô hình như gemma3:12b. Trên RTX 4090, mất khoảng 5 giây để trả về bản dịch. (cài đặt có hướng dẫn và nút để bắt đầu)
Tất cả OCR được thực hiện ở cấp độ ký tự. Sau đó có một chức năng "Block detection" kết hợp các ký tự lại với nhau để tạo thành từ và đoạn văn. Bạn có thể chỉnh sửa "Block Power" để làm cho nó có khả năng kết hợp các thứ lại với nhau hoặc tách chúng ra.
Phần mềm có thể dịch hầu hết các ngôn ngữ, nhưng được thử nghiệm chủ yếu với dịch từ tiếng Nhật sang tiếng Anh và tiếng Anh sang tiếng Việt.
Có, nhưng hiệu suất sẽ kém hơn nhiều vì phải sử dụng CPU (30-50% công suất). Bạn có thể thử dùng Windows OCR cho hiệu suất nhẹ hơn.
Có, bạn có thể sử dụng Ollama để chạy 100% offline. Bạn sẽ cần tải mô hình LLM về máy trước.
Bạn có thể đăng ký API key Gemini miễn phí tại Google AI Studio. Sau khi đăng nhập, bạn có thể tạo API key trong phần cài đặt.