🎮 RSTGameTranslation

Phần mềm Dịch Màn hình Game Thời gian thực

Phiên bản 4.1
☕ Ủng hộ tác giả

✨ Tính năng chính

🔥 Dịch thời gian thực

Sử dụng EasyOCR, RapidOCR, PaddleOCR, OneOCR hoặc Windows OCR chạy cục bộ để dịch tự động theo thời gian thực. Hỗ trợ cửa sổ chat cho visual novel và dịch toàn màn hình.

🤖 Dịch bằng AI tiên tiến

Hỗ trợ nhiều LLM: Gemini, Groq, ChatGPT, Ollama, Mistral, LM Studio và Google Translate. Dịch thuật nhận biết ngữ cảnh cho độ chính xác cao hơn.

🎯 Nhận dạng thông minh

Tối ưu hóa dịch thuật cho từng game cụ thể, xem xét ngữ cảnh trước đó và nhận dạng tên nhân vật/địa điểm.

🔊 Chuyển giọng nói thành văn bản

Nhận dạng giọng nói trực tiếp từ âm thanh game và dịch thời gian thực. Hoàn hảo cho các game không có phụ đề hoặc chỉ có hội thoại tiếng nước ngoài.

📢 Tính năng bổ sung

Chức năng text-to-speech và khả năng dịch 100% cục bộ với Ollama hoặc LM Studio.

📝 Dịch đè text gốc

Hiển thị văn bản dịch đè lên văn bản gốc trong vùng dịch được chọn.

🎮 Tối ưu cho game

Bằng cách cung cấp thông tin về game đang dịch và ngữ cảnh trước đó, bản dịch chính xác hơn các phương pháp khác.

⚠️ Lưu ý quan trọng

  • Yêu cầu hệ thống: Windows 10 trở lên. Game cần để ở chế độ windowed, fullscreen borderless hoặc windowed borderless.
  • Phần cứng khuyến nghị: GPU NVIDIA để có hiệu suất tốt nhất.
  • Hiệu suất CPU: Nếu không có GPU NVIDIA, bạn sẽ mất 30-50% công suất CPU (nếu chọn EasyOCR hoặc PaddleOCR).
  • Lựa chọn OCR: RapidOCR, OneOCR, WindowsOCR (khuyến nghị cho VGA AMD và Intel), RapidOCR, EasyOCR và PaddleOCR cho NVIDIA
  • Vùng dịch: Khu vực dịch càng nhỏ, tốc độ dịch càng nhanh.

🚀 Cách cài đặt và sử dụng (Windows)

Điều kiện tiên quyết:

  1. Tải phiên bản mới nhất (file zip) tại đây và giải nén.

Tùy chọn thiết lập:

🔵 Thiết lập đơn giản (Không cần cài đặt thêm)

  1. Chạy `rst.exe`
  2. Vào Cài đặtOCR: Chọn OneOCR
  3. Vào Cài đặtLanguage: Chọn ngôn ngữ nguồn và đích
  4. Trong tab Language, nếu bạn đang sử dụng Windows OCR hãy bấm vào nút "Check" để kiểm tra cài đặt gói ngôn ngữ trước khi bắt đầu
  5. Vào tab Translation, chọn dịch vụ dịch thuật bạn muốn sử dụng
  6. Bây giờ bạn có thể đóng cửa sổ cài đặt
  7. Nhấn nút Select Window: Chọn cửa sổ bạn muốn chụp
  8. Nhấn Alt+Q để chọn vùng, sau đó Alt+F để bật Overlay
  9. Nhấn Alt+G để bắt đầu/dừng dịch

🔴 Thiết lập nâng cao (Cần cài đặt thêm)

  1. Thiết lập máy chủ (Chỉ làm một lần cho mỗi phương pháp OCR):
    • Nhấp vào nút SetupOCR để bắt đầu thiết lập máy chủ dựa trên phương pháp OCR bạn đã chọn trong cài đặt (Nếu bạn chọn Windows OCR, bạn có thể bỏ qua bước này)
    • Thiết lập có thể mất 5-15 phút, tùy thuộc vào tốc độ internet và sức mạnh máy tính của bạn
    • Đợi cho đến khi thiết lập máy chủ hoàn tất, bạn sẽ thấy thông báo "... environment setup completed"
  2. Bắt đầu dịch:
    • Nhấp vào nút StartOCR và đợi cho đến khi bạn thấy thông báo "Successfully connected to .... server" (Nếu bạn chọn Windows OCR, bạn có thể bỏ qua bước này)
    • Bây giờ bạn có thể bắt đầu dịch bằng cách chọn vùng dịch (ALT+Q hoặc click button SelectArea)
    • Click Start (ALT+G) để bắt đầu dịch
    • Kết quả dịch hiển thị trong cửa sổ chat (nút ChatBox, ALT+C) hoặc trong Overlay (nút Overlay, ALT+F)
  3. Cài đặt LLMS:
    • Vào phần cài đặt và thêm khóa API Gemini của bạn. Có thông tin hướng dẫn cách lấy khóa API ở đó.
    • Bạn có thể nhập nhiều API key (Mỗi API key sau khi nhập cần nhấn Enter để lưu)
    • Kiểm tra các cài đặt khác; các giá trị mặc định nên ổn. Lưu ý rằng có một chỗ để nhập tên của game, điều này rất quan trọng! LLM biết điều này sẽ giúp nó sửa lỗi và tạo đoạn hội thoại tốt hơn.

Lưu ý: Lần đầu tiên bạn sử dụng EasyOCR, RapidOCR hoặc PaddleOCR với một ngôn ngữ mới, nó phải tải xuống trước! Vì vậy, có thể có vẻ không hoạt động, chỉ cần đợi một hoặc hai phút và khởi động/dừng dịch của ứng dụng, nó sẽ hoạt động.

🔄 Cách cập nhật phiên bản

RSTGameTranslation sẽ tự động kiểm tra cập nhật khi bạn khởi động. Nếu có phiên bản mới, bạn sẽ thấy thông báo hỏi xem bạn có muốn tải xuống không. Để cập nhật:

⚙️ Cài đặt nâng cao

Cài đặt khuyến nghị

Mẹo tăng hiệu suất

⚙️ Tất cả cài đặt — mô tả chi tiết

Mô tả ngắn và hướng dẫn sử dụng cho các nhóm cài đặt trong cửa sổ cài đặt:

Ngôn ngữ

  • Chọn ngôn ngữ nguồn/đích (ví dụ: ja, en, vi). Dùng nút ⇄ để hoán đổi nhanh.
  • Windows OCR: bấm "Check" để kiểm tra/cài gói ngôn ngữ nếu dùng Windows OCR.

OCR & Màn hình

  • Phương pháp OCR: chọn EasyOCR, Windows OCR, PaddleOCR, RapidOCR hoặc OneOCR. Các engine ngoài có thể cần cài server.
  • Chọn màn hình: xác định màn hình để chụp khi có nhiều monitor.
  • Auto OCR: bật để tự động chụp và dịch thời gian thực; tắt để chạy thủ công.
  • HDR support: bật nếu game sử dụng HDR (có thể ảnh hưởng tới phát hiện văn bản).
  • Remove OCR Data: xóa dữ liệu/mô hình đã tải cho các engine không tích hợp để giải phóng dung lượng.

Cài đặt OCR

  • Block detection power & settle time: điều chỉnh cách gom khối văn bản và thời gian chờ để văn bản ổn định trước khi chụp.
  • Text similarity threshold: bỏ qua các capture gần giống nhau (0.5–1.0). Giá trị thấp hơn = bỏ nhiều hơn.
  • Char-level OCR: bật để tách kết quả thành ký tự (hữu ích cho text nhỏ).
  • Giới hạn kích thước fragment / độ tin cậy ký tự/dòng: lọc kết quả OCR nhiễu.
  • Multi-selection area: cho phép chọn nhiều vùng dịch cùng lúc (ví dụ HUD + chat).

Ngữ cảnh & Overlay

  • Max/Min context và kích thước: điều khiển lượng ngữ cảnh gửi cho LLM để giữ liên tục ngữ nghĩa.
  • Game info: nhập mô tả ngắn về game để LLM dịch sát ngữ cảnh.
  • Overlay config & auto background: tinh chỉnh màu nền overlay và bật lựa chọn màu tự động.
  • Leave translation onscreen: luôn giữ bản dịch hiển thị thay vì hiện text nguồn.

Bỏ qua cụm từ (Ignore Phrases)

  • Thêm các cụm cần bỏ qua hoặc loại bỏ khỏi kết quả OCR. Chọn Exact Match để bỏ cả dòng nếu trùng khớp.

Dịch / LLM

  • Chọn dịch vụ (Gemini, Groq, ChatGPT, Ollama, LM Studio, Google Translate, Custom API).
  • API keys: nhập vào ô mật khẩu và nhấn Enter hoặc Save Keys; hỗ trợ nhiều key để dự phòng.
  • Chọn model: dùng View Models để mở tài liệu hướng dẫn nếu cần.
  • Prompt editor: tuỳ chỉnh mẫu prompt cho dịch vụ hiện tại, Save / Restore Default có sẵn.

Text-to-Speech (TTS)

  • Bật TTS và chọn dịch vụ: ElevenLabs, Google Cloud TTS hoặc Windows TTS.
  • Nhập API key cho dịch vụ cloud, chọn giọng từ danh sách (giọng hệ thống sẽ được load tự động).
  • Exclude character name: bật để tránh đọc tên nhân vật trong TTS.

Xử lý âm thanh

  • Audio auto-translate: khởi động/dừng dịch âm thanh bằng local Whisper khi bật.
  • Chọn mô hình âm thanh (file .bin) và điều chỉnh silence threshold / duration để nhận tiếng nói chính xác.

Máy chủ (Server)

  • Install / Start / Remove server: chạy các script kèm theo để thiết lập hoặc điều khiển backend OCR cần server.
  • Gửi dữ liệu lên server: bật/tắt tuỳ chọn gửi dữ liệu OCR/diagnostic cho server (một số engine cần).

Profiles

  • Tạo, cập nhật, tải và xoá profile để lưu vùng dịch và tùy chỉnh theo từng game.

Mẹo: khi đổi OCR, model hoặc dịch vụ, hãy Clear Context/Reset Hash (ứng dụng có xử lý tự động) để buộc OCR và dịch mới.

❓ Câu hỏi thường gặp (FAQ)

RSTGameTranslation có thể dịch những ngôn ngữ nào?

Phần mềm có thể dịch hầu hết các ngôn ngữ, nhưng được thử nghiệm chủ yếu với dịch từ tiếng Nhật sang tiếng Anh và tiếng Anh sang tiếng Việt.

Tôi không có GPU NVIDIA, tôi vẫn có thể sử dụng không?

Có, nhưng hiệu suất sẽ kém hơn nhiều vì phải sử dụng CPU (30-50% công suất). Bạn có thể thử dùng Windows OCR cho hiệu suất nhẹ hơn.

Tôi có thể dùng RSTGameTranslation mà không cần kết nối internet không?

Có, bạn có thể sử dụng Ollama hoặc LM Studio để chạy 100% offline. Bạn sẽ cần tải mô hình LLM về máy trước.

Làm thế nào để có API key của Gemini?

Bạn có thể đăng ký API key Gemini miễn phí tại Google AI Studio. Sau khi đăng nhập, bạn có thể tạo API key trong phần cài đặt.

💬 Cộng đồng

Tham gia cộng đồng Discord của chúng tôi để được hỗ trợ, thảo luận và cập nhật:

Tham gia Discord
Tải xuống ngay Xem trên GitHub