Ngày 29.7.2010, Dân trí có đăng bài "Lỗi chính tả trong văn bản tiếng Việt gấp 8 lần chuẩn" đã gây sự chú ý của dư luận. Nhiều câu câu hỏi được đặt ra xung quanh kết quả điều tra này, chẳng hạn: Tại sao các cơ quan xuất bản lại để "lọt" nhiều lỗi chính tả như vậy? Căn cứ vào "chuẩn " chính tả nào để xác định sai đúng? Cách thống kê, xử lí;v.v... Chúng tôi thấy đây là vấn đề cần được quan tâm, vì thế, xin trích giới thiệu bài viết này
(Dân trí) - Tỷ lệ lỗi chính tả trung bình của văn bản tiếng Việt là 7,79%, cao gần 8 lần so với chuẩn 1%. Đáng nói, tỷ lệ lỗi khu vực Đại học và Viện nghiên cứu cũng xấp xỉ mức trung bình xã hội.
Báo cáo Tình hình chính tả văn bản tiếng Việt do Viện Công nghệ Thông tin - ĐH Quốc gia Hà Nội và Công ty VieGrid công bố hôm qua (28/7) cho thấy, tỷ lệ lỗi chính tả trong văn bản tiếng Việt đã ở mức báo động, vượt quá cao so với tiêu chuẩn.
Cụ thể, trong tháng 6 vừa qua, nhóm nghiên cứu đã thống kê trên 67.000 mẫu của 177 đơn vị trong 7 khu vực, lựa chọn phương pháp thống kê với tập lỗi điển hình. Tập lỗi dùng để đánh giá trong đợt này được chọn từ một số lỗi phổ biến như: bổ xung, sử lý, xử dụng, sáng lạn, cọ sát, soi mói, thăm quan…
Kết quả, các từ có tỷ lệ lỗi cao nhất là “soi mói” với 74,33%, “sáng lạn” 41,66%, “cọ sát” 28,38%, “thăm quan” 20,61%... Đơn vị có nhiều lỗi nhất là Cục Vệ sinh an toàn thực phẩm 38,46%, tiếp đến là Viện Năng lượng nguyên tử 31,49%. Đơn vị có ít lỗi nhất thuộc về ngành ngân hàng.
Khu vực báo chí và truyền thông có tỷ lệ lỗi chính tả cao nhất, gần mức báo động 10%. Trong đó, cả hai khu vực này đều có các đại diện có tỷ lệ lỗi gần hoặc vượt mức 30%. Khu vực chính quyền địa phương, và các cơ quan thuộc Bộ cũng có tỷ lệ lỗi chính tả khá cao. Đặc biệt, có đơn vị có tỷ lệ lỗi gần 40% như Cục Vệ sinh an toàn thực phẩm. Tỷ lệ lỗi khu vực Đại học và Viện nghiên cứu cũng xấp xỉ mức trung bình của xã hội.
Trong khi đó, nhóm khá nhất là doanh nghiệp và các Bộ có tỷ lệ lỗi 7,47- 19,98% vẫn bỏ xa mức chuẩn 1%.
TS Nguyễn Ái Việt, Phó Viện trưởng Viện Công nghệ thông tin, ĐH Quốc gia Hà Nội cho biết, trước khi đánh giá chất lượng chính tả văn bản tiếng Việt, nhóm nghiên cứu đã tiến hành một cuộc điều tra tại 2 nhóm Chuyên gia ngôn ngữ và Chuyên gia CNTT: Nhóm chuyên gia ngôn ngữ yêu cầu tỷ lệ lỗi chính tả trong văn bản Việt phải là dưới 1%. Nhóm chuyên gia CNTT chấp nhận tỷ lệ này trong khoảng 2,5-5%.
Các chuyên gia đều thống nhất cho rằng, tỷ lệ 10% là ngưỡng báo động đối với các lỗi chính tả và 30% là ngưỡng mà một lỗi chính tả đã trở thành một cách viết có thể đồng thời được chấp nhận. Theo đề nghị này, từ “soi mói” đã trở thành từ đúng với tỷ lệ sử dụng hơn 74%, “sáng lạn” có thể xem như một cách viết tương đương với “xán lạn” do đạt tỷ lệ sử dụng gần 42%. Các lỗi “cọ sát”, “thăm quan” đều đến mức báo động đỏ.
“Kết quả trên phản ánh tình trạng báo động của chính tả tiếng Việt. Nhóm nghiên cứu sẽ tiến hành tiếp các đợt đánh giá tiếp theo với quy mô rộng hơn, nhằm mở đường cho một chiến dịch cộng đồng về quét lỗi chính tả”- TS Việt nói.
[ Nguồn: P. Thanh, Dân Trí, 29 tháng 7 năm 2010]