🎮 RSTGameTranslation

Phần mềm Dịch Màn hình Game Thời gian thực

Phiên bản 4.6
☕ Ủng hộ tác giả

✨ Tính năng chính

🔥 Dịch thời gian thực

Sử dụng EasyOCR, RapidOCR, PaddleOCR, OneOCR hoặc Windows OCR chạy cục bộ để dịch tự động theo thời gian thực. Hỗ trợ cửa sổ chat cho visual novel và dịch toàn màn hình.

🤖 Dịch bằng AI tiên tiến

Hỗ trợ nhiều LLM: Gemini, Groq, ChatGPT, Ollama, Mistral, LM Studio và Google Translate. Dịch thuật nhận biết ngữ cảnh cho độ chính xác cao hơn.

🎯 Nhận dạng thông minh

Tối ưu hóa dịch thuật cho từng game cụ thể, xem xét ngữ cảnh trước đó và nhận dạng tên nhân vật/địa điểm.

🔊 Chuyển giọng nói thành văn bản

Nhận dạng giọng nói trực tiếp từ âm thanh game và dịch thời gian thực. Hoàn hảo cho các game không có phụ đề hoặc chỉ có hội thoại tiếng nước ngoài.

📢 Tính năng bổ sung

Chức năng text-to-speech và khả năng dịch 100% cục bộ với Ollama hoặc LM Studio.

📝 Dịch đè text gốc

Hiển thị văn bản dịch đè lên văn bản gốc trong vùng dịch được chọn.

🎮 Tối ưu cho game

Bằng cách cung cấp thông tin về game đang dịch và ngữ cảnh trước đó, bản dịch chính xác hơn các phương pháp khác.

⚡ Nhiều tùy chọn OCR

Lựa chọn từ 5 engine OCR: Windows OCR (tích hợp sẵn), OneOCR, RapidOCR, EasyOCR hoặc PaddleOCR tùy theo phần cứng của bạn.

⚠️ Lưu ý quan trọng

  • Yêu cầu hệ thống: Windows 10 trở lên. Game cần để ở chế độ cửa sổ, fullscreen borderless hoặc windowed borderless.
  • Phần cứng khuyến nghị: GPU NVIDIA để có hiệu suất tốt nhất với EasyOCR/PaddleOCR.
  • Hiệu suất CPU: Nếu không có GPU NVIDIA, bạn sẽ mất 30-50% công suất CPU (nếu chọn EasyOCR hoặc PaddleOCR).
  • Lựa chọn OCR: RapidOCR, OneOCR, WindowsOCR (khuyến nghị cho VGA AMD và Intel), RapidOCR, EasyOCR và PaddleOCR cho NVIDIA
  • Vùng dịch: Khu vực dịch càng nhỏ, tốc độ dịch càng nhanh.
  • Khóa API: Một số dịch vụ dịch thuật yêu cầu khóa API. Google Translate hoạt động không cần khóa, nhưng các dịch vụ AI cần khóa.

🚀 Bắt đầu nhanh

Sử dụng ngay (Không cần cài đặt)

  1. Chạy rst.exe
  2. Vào Cài đặtOCR: Chọn OneOCR hoặc Windows OCR
  3. Vào Cài đặtNgôn ngữ: Chọn ngôn ngữ nguồn và đích
  4. Vào Cài đặtDịch thuật: Chọn Google Translate
  5. Đóng cài đặt và nhấn nút Chọn Cửa sổ
  6. Nhấn Alt+Q để chọn vùng dịch
  7. Nhấn Alt+F để bật hiển thị overlay
  8. Nhấn Alt+G để bắt đầu dịch

Chất lượng cao (Cần khóa API)

  1. Lấy Khóa API Gemini miễn phí từ Google AI Studio
  2. Vào Cài đặtDịch thuật
  3. Chọn Gemini và nhập khóa API của bạn
  4. Chọn PaddleOCR hoặc RapidOCR trong cài đặt OCR
  5. Nhập Thông tin Game để dịch tốt hơn theo ngữ cảnh

📖 Tài liệu hướng dẫn

🔄 Cách hoạt động

Quy trình dịch thuật

📷 Chụp màn hình
🔤 Nhận dạng OCR
🤖 Dịch AI
📱 Hiển thị kết quả

Quy trình từng bước

  1. Chụp màn hình: Ứng dụng chụp vùng màn hình game đã chọn theo chu kỳ hoặc khi text thay đổi.
  2. Nhận dạng OCR: Engine OCR được chọn (Windows OCR, OneOCR, RapidOCR, EasyOCR, hoặc PaddleOCR) trích xuất text từ hình ảnh chụp.
  3. Xử lý text: Text được trích xuất được lọc, loại bỏ trùng lặp và phân tích ngữ cảnh.
  4. Dịch AI: Text được gửi đến dịch vụ dịch thuật được chọn (Gemini, ChatGPT, Google Translate, Ollama, v.v.)
  5. Tăng cường ngữ cảnh: Các bản dịch trước đó và thông tin game được sử dụng để cải thiện độ chính xác.
  6. Hiển thị kết quả: Text dịch xuất hiện trong overlay hoặc cửa sổ chat.

Khái niệm quan trọng

  • Vùng dịch: Vùng hình chữ nhật bạn chọn trên màn hình. Vùng nhỏ hơn = xử lý nhanh hơn.
  • Ngữ cảnh: Các đoạn text trước đó giúp AI hiểu luồng hội thoại.
  • Thông tin Game: Mô tả về game giúp AI dịch đúng tên nhân vật và thuật ngữ.
  • Phát hiện khối: Cách OCR nhóm các phần tử text lại với nhau. Công suất cao hơn = nhiều text được nhóm hơn.

🔤 Hướng dẫn Engine OCR

So sánh Engine OCR

Bên ngoài Nhanh

RapidOCR

Tài nguyên: ~10% GPU

Độ chính xác: Rất cao

Cài đặt: 5-15 phút

Phù hợp với: VGA NVIDIA, ngôn ngữ phương Tây

Bên ngoài Trung bình

EasyOCR

Tài nguyên: ~20% GPU

Độ chính xác: Tốt

Cài đặt: 5-15 phút

Phù hợp với: VGA NVIDIA, nhiều ngôn ngữ

Bên ngoài Nhanh

PaddleOCR

Tài nguyên: ~15% GPU

Độ chính xác: Rất cao

Cài đặt: 5-15 phút

Phù hợp với: VGA NVIDIA, ngôn ngữ Châu Á

Giải thích cài đặt OCR

Cài đặt Mô tả Giá trị khuyến nghị
Công suất phát hiện khối Điều khiển cách nhóm các khối text. Giá trị cao hơn gộp nhiều text hơn. 5 (mặc định) - Điều chỉnh thấp hơn cho text nhỏ, cao hơn cho đoạn văn
Thời gian ổn định Giây để chờ text ổn định trước khi chụp. 0.5s - Tăng lên nếu text nhấp nháy hoặc cập nhật chậm
Ngưỡng tương tự text Bỏ qua OCR nếu text mới tương tự text trước (0.5-1.0). 0.75 - Thấp hơn để bỏ qua nhiều bản sao hơn
OCR cấp ký tự Tách kết quả thành từng ký tự riêng lẻ để xử lý khoảng cách tốt hơn. Bật - Khuyến nghị cho text có khoảng cách chặt
Kích thước fragment tối thiểu Bỏ qua các fragment text nhỏ hơn số ký tự này. 2 - Lọc nhiễu và các phần tử UI nhỏ
Độ tin cậy ký tự/dòng tối thiểu Lọc đầu ra OCR theo điểm tin cậy (0.0-1.0). 0.1 / 0.2 - Thấp hơn để chấp nhận nhiều kết quả hơn
Vùng đa chọn Cho phép chọn nhiều vùng dịch cùng lúc. Tùy chọn - Hữu ích cho HUD + dịch chat

🤖 Hướng dẫn Dịch vụ Dịch thuật

So sánh dịch vụ

Dịch vụ Cần khóa API Chất lượng Tốc độ Bảo mật
Google Translate Tùy chọn (có gói miễn phí) Tốt Nhanh Cloud
Gemini Có (có gói miễn phí) Xuất sắc Nhanh Cloud
ChatGPT Có (trả phí) Xuất sắc Nhanh Cloud
Groq Xuất sắc Rất nhanh Cloud
Ollama Không Tốt-Rất tốt Phụ thuộc phần cứng 100% Cục bộ
LM Studio Không Tốt-Rất tốt Phụ thuộc phần cứng 100% Cục bộ
Mistral Xuất sắc Nhanh Cloud

Cài đặt Ngữ cảnh

Cài đặt Mô tả Giá trị khuyến nghị
Số mảnh ngữ cảnh tối đa Số bản dịch trước đó để bao gồm làm ngữ cảnh. 3 - Cung cấp ngữ cảnh tốt mà không quá tải
Kích thước ngữ cảnh tối thiểu Số ký tự tối thiểu để text được bao gồm làm ngữ cảnh. 20 - Lọc nhãn menu và nút
Thông tin Game Mô tả về game để xử lý thuật ngữ tốt hơn. Mô tả ngắn về thể loại, bối cảnh, nhân vật
Giữ bản dịch trên màn hình Luôn hiển thị bản dịch thay vì text gốc. Tùy sở thích cá nhân
💡 Mẹo: Sử dụng ngữ cảnh cải thiện đáng kể chất lượng dịch, đặc biệt cho hội thoại. AI có thể hiểu mối quan hệ nhân vật và luồng câu chuyện tốt hơn.

⚙️ Tham khảo Cài đặt Chi tiết

Tab Ngôn ngữ

Cài đặt Mô tả
Ngôn ngữ nguồn Ngôn ngữ của text trong game (ví dụ: ja cho Tiếng Nhật, ko cho Tiếng Hàn).
Ngôn ngữ đích Ngôn ngữ bạn muốn dịch sang (ví dụ: en cho Tiếng Anh, vi cho Tiếng Việt).
Đổi ngôn ngữ Nhanh chóng hoán đổi ngôn ngữ nguồn và đích.
Kiểm tra gói ngôn ngữ Xác minh gói ngôn ngữ Windows OCR được cài đặt cho ngôn ngữ nguồn của bạn.

Tab OCR & Màn hình

Cài đặt Mô tả
Phương pháp OCR Chọn engine OCR: EasyOCR, Windows OCR, PaddleOCR, RapidOCR hoặc OneOCR.
Chọn màn hình Chọn màn hình nào để chụp nếu sử dụng nhiều màn hình.
OCR tự động Bật dịch liên tục tự động. Tắt để điều khiển thủ công.
Hỗ trợ HDR Bật cho game HDR (có thể ảnh hưởng đến độ chính xác nhận dạng text).
Xóa dữ liệu OCR Xóa các mô hình OCR đã tải xuống để giải phóng dung lượng đĩa.

Tab Bỏ qua cụm từ

Cài đặt Mô tả
Cụm từ cần bỏ qua Danh sách các mẫu text để bỏ qua trong quá trình dịch. Hữu ích để loại bỏ các phần tử UI, watermark hoặc text lặp lại.
Khớp chính xác Khi bật, bỏ qua toàn bộ text nếu nó khớp. Khi tắt, loại bỏ cụm từ khỏi text.

Tab Loại trừ vùng

Cài đặt Mô tả
Vùng loại trừ Xác định các vùng hình chữ nhật trong vùng dịch không bao giờ được chụp hoặc dịch.

Tab Text-to-Speech (TTS)

Cài đặt Mô tả
Bật TTS Đọc to text dịch bằng giọng nói tổng hợp.
Dịch vụ TTS Chọn: ElevenLabs (chất lượng tốt nhất), Google Cloud TTS hoặc Windows TTS.
Chọn giọng Chọn giọng cho đầu ra TTS.
Loại trừ tên nhân vật Bỏ qua việc đọc tên nhân vật trong hội thoại.

Tab Phím tắt

Cài đặt Mô tả
Bật phím tắt Công tắc chính cho phím tắt bàn phím.
Chọn chức năng Chọn hành động nào để gán phím tắt.
Kết hợp phím Đặt phím bổ trợ (CTRL, SHIFT, ALT) + chữ/số.

Tab Xử lý Âm thanh

Cài đặt Mô tả
Dịch tự động âm thanh Khởi động dịch vụ Whisper để dịch giọng nói thành text từ âm thanh game.
Chọn mô hình Chọn kích thước mô hình Whisper cục bộ (lớn hơn = chính xác hơn, chậm hơn).
Ngưỡng im lặng Mức âm thanh dưới đó được coi là im lặng (0.0-1.0).
Mẫu buffer tối đa Kích thước buffer âm thanh tối đa để xử lý.

Tab Điều khiển Server

Cài đặt Mô tả
Cài đặt/Khởi động/Xóa Server Quản lý server backend OCR (EasyOCR, PaddleOCR, RapidOCR).
Gửi dữ liệu đến Server Cho phép gửi dữ liệu chẩn đoán đến server từ xa (được sử dụng bởi một số engine OCR).

Tab Hồ sơ Game

Cài đặt Mô tả
Tạo/Tải Hồ sơ Lưu các hình chữ nhật vùng dịch và cài đặt dưới dạng hồ sơ có tên cho các game khác nhau.

⌨️ Phím tắt

Phím tắt Hành động Mô tả
Alt + Q Chọn vùng Chọn vùng dịch trên màn hình
Alt + F Bật/Tắt Overlay Hiển thị/Ẩn overlay dịch thuật
Alt + G Bắt đầu/Dừng Bắt đầu hoặc dừng dịch
Alt + C ChatBox Mở cửa sổ lịch sử dịch
Alt + S Cài đặt Mở cửa sổ cài đặt
Alt + L Log Mở cửa sổ log
Alt + A Dịch vụ âm thanh Bật/Tắt dịch vụ Whisper
Alt + X Xóa vùng Xóa tất cả vùng dịch đã chọn
Alt + 1-5 Chọn vùng N Chuyển nhanh sang vùng 1-5
Alt + R Thử lại Thử lại dịch thuật bị lỗi lần cuối
Alt + W Đổi ngôn ngữ Hoán đổi ngôn ngữ nguồn và đích

📚 Trường hợp sử dụng & Ví dụ

Trường hợp 1: Visual Novel

Cài đặt khuyến nghị:
OCR: OneOCR hoặc Windows OCR
Dịch thuật: Gemini với ngữ cảnh được bật
Hiển thị: Chế độ ChatBox
Cài đặt: Bật "Giữ bản dịch trên màn hình" để đọc dễ dàng

Các bước:

  1. Chọn vùng hộp thoại bằng Alt+Q
  2. Đặt Ngữ cảnh tối đa thành 3-5 mảnh cho luồng hội thoại
  3. Nhập thông tin game: "Visual novel, bối cảnh trường học Nhật Bản"
  4. Bắt đầu dịch với Alt+G

Trường hợp 2: Game Action RPG HUD

Cài đặt khuyến nghị:
OCR: RapidOCR (nếu có NVIDIA) hoặc OneOCR (nếu có AMD/Intel)
Dịch thuật: Google Translate (nhanh) hoặc Gemini (chính xác)
Hiển thị: Chế độ Overlay với màu nền tự động

Các bước:

  1. Chọn vùng HUD chứa tên vật phẩm, text nhiệm vụ, v.v.
  2. Đặt Công suất phát hiện khối thấp hơn (3-4) cho các phần tử text riêng lẻ
  3. Bật "Tự động đặt màu nền Overlay"
  4. Sử dụng Alt+F để bật/tắt overlay khi cần trong gameplay

Trường hợp 3: Manga/Comic

Cài đặt khuyến nghị:
OCR: OneOCR (có hỗ trợ manga)
Dịch thuật: Gemini để có chất lượng tốt nhất
Hiển thị: Chế độ ChatBox
Cài đặt: Giảm Ngưỡng tương tự text (0.6) cho bong bóng thoại

Các bước:

  1. Chọn vùng bong bóng thoại
  2. Tắt OCR cấp ký tự cho text được kết nối
  3. Bật "Giữ bản dịch trên màn hình"
  4. Sử dụng Vùng đa chọn nếu manga có nhiều hộp text

Trường hợp 4: Game chỉ có âm thanh (Speech-to-Text)

Cài đặt khuyến nghị:
OCR: Không cần
Dịch thuật: Gemini hoặc Ollama (cục bộ)
Âm thanh: Whisper với mô hình "base" hoặc "small"
Hiển thị: Chế độ ChatBox

Các bước:

  1. Bật "Dịch tự động âm thanh" trong tab Xử lý Âm thanh
  2. Chọn mô hình Whisper (ggml-small để cân bằng, ggml-base để nhanh)
  3. Điều chỉnh ngưỡng im lặng để tránh xử lý tiếng ồn nền
  4. Bản dịch xuất hiện trong ChatBox khi âm thanh được nhận dạng

Trường hợp 5: Dịch 100% Offline

Cài đặt khuyến nghị:
OCR: OneOCR hoặc Windows OCR (đều hoạt động offline)
Dịch thuật: Ollama hoặc LM Studio (100% cục bộ)
Không cần kết nối internet sau khi cài đặt ban đầu

Các bước:

  1. Cài đặt Ollama hoặc LM Studio
  2. Tải một mô hình (llama3, phi3 hoặc mistral)
  3. Nhập URL và tên mô hình trong cài đặt Dịch thuật
  4. Tất cả bản dịch đều ở trên máy của bạn

💾 Cài đặt và sử dụng (Windows)

Điều kiện tiên quyết:

  1. Tải phiên bản mới nhất (file zip) tại đây và giải nén.

Tùy chọn thiết lập:

🔵 Thiết lập đơn giản (Không cần cài đặt thêm)

  1. Chạy `rst.exe`
  2. Vào Cài đặtOCR: Chọn OneOCR
  3. Vào Cài đặtNgôn ngữ: Chọn ngôn ngữ nguồn và đích
  4. Trong tab Ngôn ngữ, nếu bạn đang sử dụng Windows OCR hãy bấm vào nút "Kiểm tra" để xác minh cài đặt gói ngôn ngữ trước khi bắt đầu
  5. Vào tab Dịch thuật, chọn dịch vụ dịch thuật bạn muốn sử dụng
  6. Bây giờ bạn có thể đóng cửa sổ cài đặt
  7. Nhấn nút Chọn Cửa sổ: Chọn cửa sổ bạn muốn chụp
  8. Nhấn Alt+Q để chọn vùng, sau đó Alt+F để bật Overlay
  9. Nhấn Alt+G để bắt đầu/dừng dịch

🔴 Thiết lập nâng cao (Cần cài đặt thêm)

  1. Thiết lập máy chủ (Chỉ làm một lần cho mỗi phương pháp OCR):
    • Nhấp vào nút Thiết lập OCR để bắt đầu thiết lập máy chủ dựa trên phương pháp OCR bạn đã chọn trong cài đặt (Nếu bạn chọn Windows OCR, bạn có thể bỏ qua bước này)
    • Thiết lập có thể mất 5-15 phút, tùy thuộc vào tốc độ internet và sức mạnh máy tính của bạn
    • Đợi cho đến khi thiết lập máy chủ hoàn tất, bạn sẽ thấy thông báo "... environment setup completed"
  2. Bắt đầu dịch:
    • Nhấp vào nút Bắt đầu OCR và đợi cho đến khi bạn thấy thông báo "Successfully connected to .... server" (Nếu bạn chọn Windows OCR, bạn có thể bỏ qua bước này)
    • Bây giờ bạn có thể bắt đầu dịch bằng cách chọn vùng dịch (ALT+Q hoặc click nút ChọnVùng)
    • Click Bắt đầu (ALT+G) để bắt đầu dịch
    • Kết quả dịch hiển thị trong cửa sổ chat (nút ChatBox, ALT+C) hoặc trong Overlay (nút Overlay, ALT+F)
  3. Cài đặt LLMS:
    • Vào phần cài đặt và thêm khóa API Gemini của bạn. Có thông tin hướng dẫn cách lấy khóa API ở đó.
    • Bạn có thể nhập nhiều API key (Mỗi API key sau khi nhập cần nhấn Enter để lưu)
    • Kiểm tra các cài đặt khác; các giá trị mặc định nên ổn. Lưu ý rằng có một chỗ để nhập tên của game, điều này rất quan trọng! LLM biết điều này sẽ giúp nó sửa lỗi và tạo đoạn hội thoại tốt hơn.

Lưu ý: Lần đầu tiên bạn sử dụng EasyOCR, RapidOCR hoặc PaddleOCR với một ngôn ngữ mới, nó phải tải xuống trước! Vì vậy, có thể có vẻ không hoạt động, chỉ cần đợi một hoặc hai phút và khởi động/dừng dịch của ứng dụng, nó sẽ hoạt động.

🔄 Cách cập nhật phiên bản

RSTGameTranslation sẽ tự động kiểm tra cập nhật khi bạn khởi động. Nếu có phiên bản mới, bạn sẽ thấy thông báo hỏi xem bạn có muốn tải xuống không. Để cập nhật:

⚙️ Cài đặt nâng cao

Cài đặt khuyến nghị

Mẹo tăng hiệu suất

❓ Câu hỏi thường gặp (FAQ)

H: Tại sao dịch chậm?

Nguyên nhân và giải pháp có thể:

  • Vùng dịch lớn: Giảm kích thước vùng để xử lý nhanh hơn
  • Engine OCR: Thử OneOCR hoặc Windows OCR để có tốc độ nhanh hơn
  • Thời gian phản hồi API: Google Translate nhanh nhất, tiếp theo là Gemini
  • Tải CPU/GPU: Đóng các ứng dụng khác sử dụng nhiều tài nguyên
H: OCR không nhận dạng text đúng

Các bước khắc phục:

  • Kiểm tra ngôn ngữ: Đảm bảo ngôn ngữ nguồn khớp với game
  • Điều chỉnh cài đặt OCR: Giảm ngưỡng tin cậy
  • Thử OCR khác: Một số engine hoạt động tốt hơn với một số kiểu text
  • Xóa ngữ cảnh: Đôi khi ngữ cảnh cũ có thể can thiệp
  • Kiểm tra chế độ game: Đảm bảo game đang ở chế độ windowed hoặc borderless
H: Làm sao để lấy khóa API?

Cho các dịch vụ khác nhau:

H: Tôi có thể sử dụng offline không?

Có! Các tùy chọn cho sử dụng offline:

  • Windows OCR / OneOCR: Tích hợp sẵn, hoạt động không cần internet
  • Ollama: Tải từ ollama.com để có AI 100% cục bộ
  • LM Studio: Tải từ lmstudio.ai cho mô hình cục bộ
H: Làm sao dịch nhiều vùng cùng lúc?

Thiết lập đa chọn:

  1. Vào Cài đặt → Cài đặt OCR
  2. Bật "Vùng đa chọn"
  3. Chọn vùng đầu tiên với Alt+Q
  4. Nhấn Alt+Q lần nữa để thêm vùng khác
  5. Lặp lại cho tối đa 5 vùng
H: Overlay che UI game

Giải pháp:

  • Làm cho vùng dịch chính xác hơn
  • Sử dụng "Vùng loại trừ" để tránh chụp các phần tử UI
  • Bật/tắt overlay với Alt+F khi không cần
  • Thử chế độ ChatBox thay vì overlay
H: Tôi có thể lưu cài đặt khác nhau cho các game khác không?

Có! Sử dụng Hồ sơ Game:

  1. Cấu hình cài đặt cho game đầu tiên
  2. Vào Cài đặt → Hồ sơ Game
  3. Nhấn "Tạo Hồ sơ" và đặt tên
  4. Lặp lại cho các game khác
  5. Tải hồ sơ nhanh khi chuyển game
H: Tại sao chất lượng dịch thay đổi?

Các yếu tố ảnh hưởng đến chất lượng:

  • Ngữ cảnh: Bật ngữ cảnh để có luồng hội thoại tốt hơn
  • Thông tin Game: Nhập mô tả game để có độ chính xác thuật ngữ
  • Chất lượng OCR: Text càng rõ = bản dịch càng tốt
  • Mô hình AI: Gemini và GPT-4 cung cấp kết quả tốt nhất
H: Làm sao báo lỗi hoặc xin hỗ trợ?

Kênh hỗ trợ: