HTML Nâng Cao: HTML Entity, Meta Charset và URL Encode

Trong bài viết này chúng ta sẽ tìm hiểu về các khái niệm HTML entity, Meta charsetURL encode.

HTML Entity

HTML entity là cú pháp được dùng để biểu diễn các ký tự đặc biệt hoặc được bảo lưu trong HTML.

Các ký tự như <, >, &, "' được bảo lưu trong HTML do bản thân chúng được sử dụng với ý nghĩa đặc biệt trong HTML (ví dụ như < để tạo thẻ mở và > để tạo thẻ đóng)... Để hiển thị các ký tự này chúng ta cần sử dụng các HTML entity.

HTML entity có thể được biểu diễn sử dụng với cú pháp như sau:

&entity_name;

Ví dụ để biểu diễn ký tự < trong HTML chúng ta sẽ sử dụng HTML entity như sau:

&lt;

Entity name thường là chữ viết tắt của ký tự mà nó đại diện. Trong cách viết ở trên &lt; chúng ta sử dụng entity name là lt viết tắt của less than (nhỏ hơn).

Ngoài cách sử dụng entity name thì HTML entity còn có thể biểu diễn sử dụng entity number:

&entity_number;

Ví dụ vẫn đối với ký tự < bạn có thể sử dụng cú pháp sau:

&60;

Vì việc sử dụng chữ cái viết tắt của entity dễ nhớ hơn sử dụng số nên cách biểu diễn HTML entity theo tên (entity name) được sử dụng nhiều hơn theo kiểu số (entity number).

Meta Charset

Meta charset là viết tắt của meta character, meta charset chứa thông tin về bộ ký tự được trên trang. Meta character là cách nói vắn tắt của việc sử dụng thẻ <meta> chứa thuộc tính charset với giá trị là bộ ký tự cần sử dụng.

Ví dụ để quy định bộ ký tự character set là UTF-8 chúng ta sử dụng thẻ <meta> như sau:

<meta charset="utf-8">

Một bộ ký tự bao gồm tập hợp các ký tự khác nhau trong đó. Các bộ ký tự khác nhau sẽ có khác nhau (và cả các ký tự giống nhau). Bộ ký tự UTF-8 là bộ ký tự phổ biến vì bộ này chứa hầu hết tất cả các ký tự mà chúng ta cần sử dụng trong trao đổi thông tin.

Tham khảo thêm về Character Set và Character Encode.

URL Encode

URL Encode là cách HTML mã hoá địa chỉ web chúng ta sử dụng để đảm bảo tính bảo mật cho trang.

Ví dụ bạn có một địa chỉ URL như sau:

http://www.codehub.vn/hello+world = hello world

Thì khi gõ địa chỉ này lên trang web bạn sẽ thấy trình duyệt hiển thị lại kết quả như sau:

http://www.codehub.vn/hello+world%20=%20hello%20world

Các ký tự như khoảng trắng (`) ở URL ban đầu được mã hoá thành%20`.

1 Bình Luận

Thuận Phương Thuận Phương

Hi, cho mình hỏi thêm là làm sao để cập nhật lại dữ liệu đã lưu dạng HTML entities về lại chữ tiếng việt có dấu bình thường. ví dụ như trang: https://ptj.vn khi view source lên sẽ ra nội dung dạng Entities rất khó đọc! mình cảm ơn!

Content must not be empty

Related Blog