Khi tìm hiểu về lập trình, vấn đề đầu tiên mà người học IT cần nắm vững chính là các thành phần của ngôn ngữ lập trình. Mặc dù cấu trúc của mọi ngôn ngữ lập trình đều giống nhau, nhưng sự khác biệt giữa chúng lại nằm ở chính các yếu tố cấu thành và đại lượng liên quan.
Mục lục
1. Ngôn ngữ lập trình là gì?
Ngôn ngữ lập trình là một dạng ngôn ngữ được xây dựng trên cơ sở hệ thống quy tắc riêng, được người lập trình sử dụng khi xây dựng các chương trình làm việc trên thiết bị điện tử. Nói một cách đơn giản, đây là ngôn ngữ chung dùng để giao tiếp giữa con người và máy móc.
2. Các thành phần của ngôn ngữ lập trình
Có 3 thành phần chính cấu tạo nên ngôn ngữ lập trình là bảng chữ cái, cú pháp và ngữ nghĩa.
2.1. Bảng chữ cái
Đây là tập hợp các ký tự được sử dụng để xây dựng chương trình. Mỗi ngôn ngữ lập trình lại sử dụng một hệ thống ký tự khác nhau.
Ví dụ với ngôn ngữ lập trình pascal. Bên cạnh 26 chữ cái trong bảng chữ cái tiếng Anh ở dạng in thường và in hoa, bảng chữ cái dùng trong lập trình còn bao gồm 10 chữ số thập phân, cũng như các ký tự đặc biệt như \\, \xhh, \nnn, \?, \0,… và không hề có sự xuất hiện của dấu !. Trong khi ngôn ngữ C lại dùng ký tự này.
2.2. Cú pháp
Cú pháp của ngôn ngữ lập trình là tập hợp các quy tắc về thứ tự và hình thức viết của một câu lệnh. Cấu trúc thông thường của cú pháp sẽ tuân theo những luật lệ dưới đây:
- Bắt đầu câu lệnh bằng ký tự hoặc một từ để chỉ tên của câu lệnh
- Tiếp theo là trật tự xác định của toán tử, hệ thống ký tự hoặc tham số.
- Kết thúc câu lệnh bằng một ký tự (tùy theo một số ngôn ngữ lập trình). Thông thường sẽ là dấu chấm phẩy.
Tương tự với bảng chữ cái, các ngôn ngữ lập trình không dùng chung một loại cú pháp. Với Pascal, cặp từ Begin – End được sử dụng để gộp các câu lệnh thành 1 câu, trong khi C++ lại thay thế bằng cặp ký hiệu {}.
Nếu có lỗi trong cú pháp, chương trình dịch sẽ nhanh chóng phát hiện và kịp thời thông báo cho lập trình viên để sửa lại. Chỉ khi cú pháp hoàn chỉnh và đúng thì chương trình mới có thể dịch sang ngôn ngữ máy.
2.3. Ngữ nghĩa
Nếu như cú pháp được dùng để thiết lập một câu lệnh hợp lệ, thì ngữ nghĩa giải thích cho tính hợp lệ của câu lệnh đó. Ngữ nghĩa chính là thành phần xác định ý nghĩa thao tác lập trình cần thực hiện, tương ứng với tổ hợp ký tự tùy vào ngữ cảnh của thao tác đó.
Những lỗi liên quan đến ngữ nghĩa sẽ được phát hiện trong khi chạy chương trình trên dữ liệu cụ thể.
3. Một số khái niệm liên quan
Trong thế giới của ngôn ngữ lập trình, mọi đối tượng được sử dụng trong chương trình đều phải có tên gọi riêng. Quy tắc đặt tên của mỗi ngôn ngữ là khác nhau. Có ngôn ngữ không phân biệt chữ thường hay in hoa, nhưng có ngôn ngữ lại phân biệt.
Có 3 loại tên cơ bản dùng trong ngôn ngữ lập trình:
3.1. Tên dành riêng (Từ khóa)
Loại tên này đã được ngôn ngữ lập trình quy định sẵn ý nghĩa và không thể bị thay đổi. Tên dành riêng thường được hiển thị với màu sắc nổi bật hơn hẳn so với các tên khác.
Ví dụ: một số tên dành riêng dùng trong ngôn ngữ Pascal như Begin, End, Var, Program, Uses,…
3.2. Tên chuẩn
Loại tên được ngôn ngữ lập trình quy định ý nghĩa và có thể bị thay đổi bởi lập trình viên.
Ví dụ: một số tên chuẩn dùng trong ngôn ngữ Pascal như Sin, Cos, Real, Char,…
3.3. Tên do lập trình viên tự đặt
Loại tên này được người lập trình khai báo trước khi dùng và được chọn lọc để tránh bị trùng với tên dành riêng.
3.4. Hằng và biến
Hằng là đại lượng có giá trị giữ nguyên khi thực hiện chương trình. Tùy theo từng ngôn ngữ lập trình mà hằng được quy định về cách viết khác nhau. Có 2 loại hằng là hằng được đặt tên và hằng không được đặt tên.
Do tính chất có thể thay đổi được, nên biến là đại lượng được sử dụng rất phổ biến khi viết chương trình. Mỗi loại ngôn ngữ lập trình lại có các loại biến khác nhau và lập trình viên phải khai báo trước khi dùng.
3.5. Chú thích
Để thuận tiện cho việc đọc lại hoặc giúp người khác hiểu được câu lệnh mà mình viết, những người lập trình phải đưa các chú thích tương ứng vào chương trình. Thành phần này hoàn toàn không ảnh hưởng gì đến hoạt động của chương trình.
Tương tự với những đại lượng trên, chú thích được sử dụng trong mỗi loại ngôn ngữ đều không giống nhau. Ví dụ: chú thích của Pascal được đặt trong cặp ký tự {} hoặc (* *).
Mặc dù có sự khác biệt rõ rệt về hệ thống bảng chữ cái, trật tự và hình thức cú pháp, cũng như ngữ nghĩa, nhưng tựu chung lại, đây đều là các thành phần của ngôn ngữ lập trình mà người làm IT nên nắm vững khi xây dựng các chương trình.
Nguồn tham khảo: mindx