- Lúc: 21:28
Sitemap (sơ đồ trang web) là một tập tin liệt kê tất cả các trang trên website, được sử dụng để thông báo cho Google và các công cụ tìm kiếm khác hiểu được cách tổ chức nội dung của trang web. Nhờ có sitemap mà Googlebot có thể thu thập dữ liệu trang web của bạn dễ dàng và đầy đủ hơn.
Ngoài việc chứa tất cả URL của trang web, sitemap có thể chứa các thông tin liên quan khác như thời gian cập nhật gần nhất của trang, mức độ thường xuyên được thay đổi (hàng ngày, hàng tuần, hàng tháng,…), tầm quan trọng của trang so với các trang khác…Thậm chí chứa cả thể loại nội dung trên trang web (video, hình ảnh,…), chẳng hạn như một mục sitemap video có thể chứa thời lượng, thể loại và độ tuổi phù hợp xem video.
CÁC LOẠI SITEMAP
Có hai loại sitemap phổ biến là XML Sitemap (sơ đồ trang web định dạng XML) và HTML Sitemap (sơ đồ trang web định dạng HTML). Trong đó XML Sitemap là một định dạng cấu trúc mà người dùng không cần nhìn thấy nhưng nó giúp các máy tìm kiếm dễ dàng đọc các trang trên website, còn HTML Sitemap được thiết kế cho người sử dụng để giúp họ tìm kiếm các nội dung trên trang web. Hầu hết các máy tìm kiếm (Google, Bing,…) chỉ hỗ trợ Sitemap định dạng XML.
LỢI ÍCH CỦA SITEMAP
Nếu bạn tối ưu onpage tốt, trình thu thập dữ liệu của các máy tìm kiếm có thể phát hiện hầu hết các trang web của bạn. Mặc dù vậy, tập tin sitemap vẫn là một trợ thủ đắc lực cho bọ tìm kiếm, đặc biệt trong những trường hợp sau:
- Khi website của bạn còn mới, bạn phải tạo sitemap và đăng ký với các máy tìm kiếm. Khi đó website của bạn sẽ có cơ hội xuất hiện trên các kết quả tìm kiếm.
- Khi các trang trên website của bạn không được liên kết với nhau (các liên kết nội bộ không có hoặc ít). Nhờ có sitemap mà các máy tìm kiếm vẫn có thể phát hiện ra hầu hết nội dung trên website của bạn.
- Khi website của bạn đã có nhiều nội dung hoặc khi nội dung mới được sản xuất rất nhiều mỗi ngày (kiểu như các diễn đàn hoặc các trang thương mại điện tử…) thì có thể trình thu thập dữ liệu sẽ bỏ qua một số nội dung hoặc những thay đổi nhỏ trong trang web của bạn nếu không có sitemap.
- Khi website của bạn có nhiều loại nội dung (các nội dung đa phương tiện: video, hình ảnh,…) thì sitemap sẽ giúp máy tìm kiếm phân loại nội dung để hiển thị sao cho phù hợp.
Việc tạo và sử dụng sitemap không đảm bảo rằng tất cả các mục trong sitemap của bạn sẽ được thu thập và lập chỉ mục. Tuy nhiên, trong hầu hết các trường hợp, trang web của bạn sẽ được hưởng lợi từ việc có một sitemap.
HƯỚNG DẪN TẠO SITEMAP CHO WEBSITE
Thông thường khi bạn sử dụng các mã nguồn phổ biến như WordPress, Joomla, Drupal, Magento,vBulletin, Xenforo,…thì đều có sẵn các tiện ích mở rộng giúp tạo sitemap tự động mỗi khi xuất bản nội dung mới hoặc khi chỉnh sửa một nội dung nào đó trên trang web. Cho nên với từng mã nguồn cụ thể mà bạn phải tự tìm hiểu cách cài đặt và sử dụng tiện ích mở rộng đó.
Xem thêm: Hướng dẫn sử dụng Google XML Sitemaps.
Trong khuôn khổ bài viết này, tôi chỉ hướng dẫn các bạn cách tạo sitemap cho các trang web không có tiện ích hỗ trợ tạo sitemap tự động.
CÁCH 1 – TẠO XML SITEMAP THỦ CÔNG
Tạo sitemap thủ công sẽ tốn khá nhiều thời gian nếu website của bạn có nhiều trang, tuy nhiên có ưu điểm là bạn có thể dễ dàng điều chỉnh các thông số theo ý của mình.
Bước 1: Tạo một file có đuôi .xml (sử dụng Notepad hoặc tốt nhất là Notepad++) và thêm vào đoạn code sau vào dòng đầu tiên của file XML Sitemap này:
1
2
| <? xml version = "1.0" encoding = "UTF-8" ?> < urlset xmlns:xsi = "http://www.w3.org/2001/XMLSchema-instance" xmlns:image = "http://www.google.com/schemas/sitemap-image/1.1" xsi:schemaLocation = "http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9" > |
Bước 2: Bắt đầu khai báo mỗi URL theo đúng cấu trúc của sitemap như sau:
1
2
3
4
5
6
| < url > < loc >http://www.kenhtai2.blogspot.com/url-1</ loc > < lastmod >2015-12-28</ lastmod > < changefreq >monthly</ changefreq > < priority >0.8</ priority > </ url > |
Trong đó:
Thẻ | Bắt buộc | Mô tả |
<loc> | Có | Cung cấp URL đầy đủ của trang (bao gồm http, https). Tối đa 2048 ký tự. |
<lastmod> | Không | Cung cấp thời thời gian cập nhật gần nhất. Định dạng YYYY-MM-DD. |
<changefreq> | Không | Lựa chọn các giá trị: hourly, daily, weekly, monthly, yearly và never. Thẻ này chỉ được sử dụng như một hướng dẫn cho trình thu thập và không được sử dụng để xác định mức độ thường xuyên các trang được lập chỉ mục. |
<priority> | Không | Mặc định là 0.5. Bạn có thể đặt giá trị từ 0.1 – 1.0 (cao nhất). Giá trị này để thông báo cho các trình thu thập dữ liệu biết được mức độ quan trọng của các trang khi lập chỉ mục. Giá trị này không ảnh hưởng đến thứ hạng của các trang trên công cụ tìm kiếm. |
Một ví dụ về file xml sitemap đầy đủ:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
| <? xml version = "1.0" encoding = "UTF-8" ?> < urlset xmlns:xsi = "http://www.w3.org/2001/XMLSchema-instance" xmlns:image = "http://www.google.com/schemas/sitemap-image/1.1" xsi:schemaLocation = "http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9" > < url > < loc >http://www.kenhtai2.blogspot.com/url-1</ loc > < lastmod >2015-12-28</ lastmod > < changefreq >daily</ changefreq > < priority >1.0</ priority > </ url > < url > < loc >http://www.kenhtai2.blogspot.com/url-2</ loc > < lastmod >2015-12-27</ lastmod > < changefreq >weekly</ changefreq > < priority >0.6</ priority > </ url > < url > < loc >http://kenhtai2.blogspot.com/url-3</ loc > < lastmod >2015-12-26</ lastmod > < changefreq >monthly</ changefreq > < priority >0.2</ priority > </ url > </ urlset > |
Xin lưu ý:
- File sitemap có giới hạn là 50.000 URLs và dung lượng không quá 10MB khi được giải nén.
- Sitemap có thể được nén bằng gzip.
- Một file sitemap có thể chứa một danh sách các sitemaps nhưng không quá 50.000 sitemaps.
Ví dụ về sitemap có chứa một danh sách cách sitemaps:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
| <? xml version = "1.0" encoding = "UTF-8" ?> < urlset xmlns:xsi = "http://www.w3.org/2001/XMLSchema-instance" xmlns:image = "http://www.google.com/schemas/sitemap-image/1.1" xsi:schemaLocation = "http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9" > < sitemap > < loc >http://www.kenhtai2.blogspot.com/1-sitemap.xml</ loc > < lastmod >2015-12-26T00:02:52+07:00</ lastmod > </ sitemap > < sitemap > < loc >http://www.kenhtai2.blogspot.com/2-sitemap.xml</ loc > < lastmod >2015-12-18T14:04:49+07:00</ lastmod > </ sitemap > < sitemap > < lastmod >2015-12-26T00:02:52+07:00</ lastmod > </ sitemap > </ sitemapindex > |
CÁCH 2 – TẠO XML SITEMAP TỰ ĐỘNG
Có nhiều trang web hỗ trợ tạo file sitemap tự động, bạn chỉ cần tìm kiếm từ khóa “create sitemap” hoặc“sitemap generator” trên Google và đọc kỹ hướng dẫn của họ. Một số trang nổi tiếng:
WEBSITE | GIỚI HẠN |
xml-sitemaps.com | 500 trang |
web-site-map.com | 3850 trang |
xmlsitemapgenerator.org | 2000 trang |
freesitemapgenerator.com | 5000 trang |
Về cơ bản tất cả những công cụ này sẽ yêu cầu bạn thực hiện 4 bước:
- Nhập URL của website mà bạn muốn tạo sitemap.
- Chọn tần suất thay đổi. Tức là mức độ thay đổi thường xuyên của trang (hàng ngày, hàng tuần,…)
- Chọn thời gian cập nhật gần nhất.
- Chọn mức độ quan trọng.
Sau khi file sitemap được tạo thành công, bạn tải về (file đuôi .xml) để up lên web và đăng ký với các máy tìm kiếm. Việc sử dụng các công cụ tạo sitemap tự động có ưu điểm là nhanh, tiết kiệm thời gian và công sức, tuy nhiên không điều chỉnh được các thông số theo ý muốn. Do đó, sau khi tạo tự động bạn nên mở file Sitemap ra để sửa lại các thông số sao cho phù hợp
.
0 nhận xét