8h30’ sáng ngày 5/12/2013, ThS Phạm Văn Lam đã trình bày buổi thuyết trình khoa học với chủ đề "Mạng từ và các quan hệ ngữ nghĩa trong Mạng từ trong tiếng Việt". Buổi thuyết trình đã thu hút được đông đảo cán bộ trong Viện và một số nhà khoa học ở Viện công nghệ thông tin tham dự.
Thuyết trình mở đầu với những nghiên cứu tiên phong của G. Miller và nhóm nghiên cứu của ông năm 1978 tại Đại học Princeton, phát triển một cơ sở ngữ liệu với các mối quan hệ khái niệm, được coi như là sự thể hiện của một mô hình phản ánh những quan hệ có tính bản thể của vốn từ vựng nội tâm (mental lexicon). Cơ sở dữ liệu này, gọi là mạng từ (Wordnet), đã được tổ chức dưới dạng các quan hệ mạng giữa các lớp từ khác nhau xung quanh ý niệm đó.
Thiên về ngữ nghĩa, các kho từ vựng dạng mạng từ (Wordnet) tạo ra một tập hợp từ vựng đồ sộ, theo đó các từ được sắp xếp trong dãy của những loạt đồng nghĩa, bao nghĩa hay phân nghĩa, giúp cho việc xác định nghĩa của từ và để phân biệt được nghĩa đang xét với các nghĩa khác. Nguyên lí tổ chức chung của mạng từ là mạng lưới các quan hệ ngữ nghĩa. Đó là quan hệ đồng nghĩa (synonymy); quan hệ trái nghĩa (antonymy); quan hệ bao thuộc (hyponymy); quan hệ tổng phân (meronymy); v.v. Dạng kho từ vựng này rất hữu ích cho việc gán nhãn ngữ nghĩa cũng như việc truy cập vào ngữ nghĩa của văn bản.
Việc xác định ý nghĩa chung cho một loạt đồng nghĩa là một việc làm cần thiết khi xây dựng mạng từ cho các ngôn ngữ trên thế giới trong đó có tiếng Việt. Do thời gian có hạn, bài thuyết trình chưa trình bày hết các quan hệ ngữ nghĩa trong mạng từ tiếng Việt mà mới chỉ dừng lại ở việc giớii thiệu các mạng từ (nguồn gốc ra đời, ứng dụng của mạng từ…), minh họa các mạng từ và việc nhận diện, xử lý các loạt đồng nghĩa trong Mạng từ tiếng Việt. Các quan hệ ngữ nghĩa khác sẽ được trình bày trong các buổi tiếp theo.
Buổi thuyết trình nhận được thảo luận sôi nổi của các nhà khoa học có kinh nghiệm lâu năm về lĩnh vực từ vựng, ngữ nghĩa và ngôn ngữ học đại cương như GS. Nguyễn Đức Tồn, GS. Nguyễn Văn Khang, GS. Nguyễn Văn Hiệp, PGS. Phạm Tất Thắng, cùng một số chia sẻ rất thú vị và cụ thể của những chuyên gia về xử lí ngôn ngữ tự nhiên trong công nghệ thông tin.
Một số hình ảnh của buổi thuyết trình:
Buổi thuyết trình thu hút nhiều nhà khoa học có kinh nghiệm tham gia
ThS. Phạm Văn Lam trình bày nội dung của buổi thuyết trình