grep -Prl --binary-files=without-match "[àáạảãâầấậẩẫăằắặẳẵèéẹẻẽêềếệểễìíịỉĩòóọỏõôồốộổỗơờớợởỡùúụủũưừứựửữỳýỵỷỹđ]" .
Lệnh tìm các ký tự có dấu như tiếng việt trên tất cả các file text.
Sau khi tìm được danh sách các file chưa ký tự đặc biệt hay dấu tiếng việt thì lúc này mở file lên và lại tìm tiếp các vị trí có chữ tiếng việt hoặc ký tự đặc biệt như sau:
Áp dụng với công cụ visual studio code nhé:
Nhấn Ctrl + Shift + F
(hoặc Cmd + Shift + F
trên Mac)
🔧 Bước 2: Bật chế độ Regex
-
Click biểu tượng
.*
ở góc trái trong ô tìm kiếm để bật Regular Expression
🔧 Bước 3: Dán regex sau để tìm ký tự có dấu tiếng Việt:
Khi bấm vào nút .* nhớ bấm bật tắt để kiểm tra ký tự đặc biệt còn không, hệ thống sẽ f5 lại để tìm lại
[^\x00-\x7F]
[àáạảãâầấậẩẫăằắặẳẵèéẹẻẽêềếệểễìíịỉĩòóọỏõôồốộổỗơờớợởỡùúụủũưừứựửữỳýỵỷỹđÀÁẠẢÃÂẦẤẬẨẪĂẰẮẶẲẴÈÉẸẺẼÊỀẾỆỂỄÌÍỊỈĨÒÓỌỎÕÔỒỐỘỔỖƠỜỚỢỞỠÙÚỤỦŨƯỪỨỰỬỮỲÝỴỶỸĐ]
✅ Regex này bao phủ hầu hết chữ cái có dấu tiếng Việt cả chữ thường và hoa.
Nếu không tìm ra có thể thử thêm
[^\x00-\x7F]